Modelling Transport

EspanolDescripción completa

Views 427 Downloads 5 File size 4MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

MODELOS DE TRANSPORTE

Juan de Dios Ortúzar y Luis G. Willumsen

Traducción de Ángel Ibeas Portilla y Luigi dell’Olio

Ortúzar, Juan de Dios. Modelos de transporte / Juan de Dios Ortúzar, Luis G. Willumsen ; traducción de Ángel Ibeas Portilla, Luigi Dell’Olio. -- Santander : PUbliCan, Ediciones de la Universidad de Cantabria, 2008. -- (Traducciones Universidad de Cantabria; 3) En la port.: Consorcio Transportes Madrid. ISBN 978-84-8102-512-5 Transporte-- Modelos Matemáticos Willumsen, Luis G. Ibeas Portilla, Ángel. Dell’Olio, Luigi. 656:519.87 591.87:656

Esta edición es propiedad de PUBLICAN - EDICIONES DE LA UNIVERSIDAD DE CANTABRIA, cualquier forma de reproducción, distribución, comunicación pública o transformación sólo puede ser realizada con la autorización de sus titulares, salvo excepción prevista por la ley. Diríjase a CEDRO (Centro Español de Derechos Reprográficos, www.cedro.org) si necesita fotocopiar o escanear algún fragmento de esta obra.

Coordinación de la edición española a cargo de Ángel Ibeas Portilla y Luigi dell’Olio

Consejo Editorial de PUbliCan - Ediciones de la Universidad de Cantabria Presidente: Gonzalo Capellán de Miguel Área de Ciencias Biomédicas: Jesús González Macías Área de Ciencias Experimentales: M.ª Teresa Barriuso Pérez Área de Ciencias Humanas: Fidel Ángel Gómez Ochoa Área de Ingeniería: Luis Villegas Cabredo Área de Ciencias Sociales: Concepción López Fernández y Juan Baró Pazos ©

Juan de Dios Ortúzar y Luis G. Willumsen

©

PUbliCan - Ediciones de la Universidad de Cantabria Avda. de los Castros, s/n. 39005 Santander Tel.: 942 201 087 - Fax: 942 201 290

ISBN: 978-84-8102-512-5 D.L.: M-29.991-2008

Impreso en España Imprenta PEDRO CID, S.A., 2008

Del indice se ha suprimido el indice de tablas y de figuras. Puede valer, PERO DEBE INCLUIRSE LOS subepigrafes con TRES DIGITOS

Índice

Pag 407 el título es incorrecto. Falta una "o" Prólogo a la edición inglesa ........................................................................

11

Prólogo a la edición en castellano ...............................................................

17

1.

Introducción ........................................................................................ 1.1. Planificación y modelización del sistema de transportes ....... 1.2. Problemática del transporte ..................................................... 1.3. Modelos y proceso decisional .................................................. 1.4. Tópicos en modelización del transporte .................................. 1.5. Estructura del modelo clásico de transporte .......................... 1.6. Planificación continua del transporte ..................................... 1.7. Sobre la teoría versus la práctica ...........................................

21 21 25 36 43 55 59 64

2.

Prerrequisitos matemáticos ................................................................. 2.1. Introducción .............................................................................. 2.2. Álgebra y funciones .................................................................. 2.3. Álgebra matricial ...................................................................... 2.4. Elementos de cálculo ............................................................... 2.5. Estadística matemática elemental ............................................

69 69 70 77 80 91

3.

Datos y rol del espacio ........................................................................ 3.1. Teoría básica de muestreo ....................................................... 3.2. Errores en la modelización y en la predicción ....................... 3.3. Métodos de recolección de datos ............................................ 3.4. Redes y sistemas de zonificación ............................................. Ejercicios .............................................................................................

97 97 112 122 180 189

4.

Modelos de generación de viajes ........................................................ 4.1. Introducción .............................................................................. 4.2. Análisis de regresión ................................................................ 4.3. Análisis por categoría o cross-classification ...........................

193 194 201 219



Índice

4.4. 4.5.

Previsión de variables en el análisis de generación de viajes .. 236 Estabilidad y actualización de los parámetros de generación de viajes .................................................................................... 239 Ejercicios ............................................................................................. 244

5.

Modelos de distribución zonal ............................................................ 249 5.1. Definiciones y notaciones ........................................................ 5.2. Métodos de factor de crecimiento ........................................... 5.3. Modelos sintéticos o gravitacionales ....................................... 5.4. Maximización de la entropía ................................................... 5.5. Calibración de modelos gravitacionales ................................. 5.6. Enfoque tri-proporcional .......................................................... 5.7. Otros modelos sintéticos .......................................................... 5.8. Consideraciones prácticas ....................................................... Ejercicios .............................................................................................

6.

Modelos de reparto modal ................................................................... 301 6.1. Introducción .............................................................................. 6.2. Factores que influyen en la elección modal ........................... 6.3. Modelos de elección de destino y partición modal ................ 6.4. Modelos de distribución y partición modal ............................ 6.5. Modelos sintéticos .................................................................... 6.6. Modelos de demanda directa ................................................... Ejercicios .............................................................................................

7.

301 302 304 305 306 317 323

Modelos de elección discreta .............................................................. 329 7.1. Consideraciones generales ....................................................... 7.2. Marco teórico de referencia ..................................................... 7.3. Modelo logit multinomial (MNL) ............................................. 7.4. Modelo Logit Jerárquico (HL) ................................................. 7.5. Otros modelos y paradigmas de elección ............................... Ejercicios .............................................................................................

8.

250 254 259 264 274 277 285 288 297

330 334 338 342 352 364

Especificación y estimación de modelos de elección discreta ............ 369 8.1. 8.2. 8.3. 8.4. 8.5. 8.6.

Introducción .............................................................................. Determinación del conjunto de elecciones .............................. Especificación y forma funcional ............................................ Estimación estadística .............................................................. Métodos de estimación del MNP ............................................. Estimación del modelo logit mixto de componentes de error ..

369 371 373 378 401 407

MODELOS

DE

TRANSPORTE



8.7. Modelización con datos de preferencias declaradas .............. 409 Ejercicios ............................................................................................. 443 9.

Agregación de modelos y transferibilidad .......................................... 447 9.1. Introducción .............................................................................. 9.2. Sesgos de agregación y prognosis ........................................... 9.3. Métodos de agregación ............................................................ 9.4. Actualización o transferibilidad de modelos ........................... Ejercicios .............................................................................................

447 449 451 454 461

10. Asignación .......................................................................................... 465 10.1. Conceptos básicos .................................................................... 10.2. Métodos de asignación de tráfico ........................................... 10.3. Asignación todo o nada ........................................................... 10.4. Métodos estocásticos ................................................................ 10.5. Asignación con congestión ....................................................... 10.6. Asignación al transporte público ............................................. 10.7. Consideraciones prácticas ....................................................... Ejercicios .............................................................................................

465 474 481 482 488 497 507 511

11. Equilibrio entre oferta y demanda ....................................................... 515 11.1. Introducción .............................................................................. 11.2. El equilibrio .............................................................................. 11.3. Extensión de la asignación de equilibrio ................................ 11.4. Equilibrio del sistema de transportes ...................................... 11.5. Elección del horario de partida y asignación ........................ Ejercicios .............................................................................................

515 516 528 543 557 565

12. Modelos simplificados de demanda de transporte .............................. 569 12.1. Introducción .............................................................................. 12.2. Métodos simplificados de modelización .................................. 12.3. Modelos de demanda incremental ........................................... 12.4. Estimación de modelos a partir de aforos de tráfico ............. 12.5. Modelos marginales y de corredor .......................................... 12.6. Juegos de simulación ................................................................ Ejercicios .............................................................................................

569 571 573 577 604 610 613

13. Otros tópicos de interés ....................................................................... 617 13.1. Modelos de demanda de mercancías ....................................... 617 13.2. Previsión de variables de planificación .................................. 630



Índice

13.3. Predicción de la tasa de motorización .................................... 13.4. El valor del tiempo de viaje .................................................... 13.5. Valoración de externalidades de transporte ............................ Ejercicios .............................................................................................

640 652 664 673

Bibliografía ................................................................................................. 675

Prólogo a la edición inglesa Juan de Dios Ortúzar y Luis G. Willumsen

E

ste libro es el resultado de más de 20 años de colaboración, a veces a distancia y otras trabajando conjuntamente en Gran Bretaña y en Chile. A lo largo de estos años hemos discutido muchas veces lo que considerábamos puntos fuertes y débiles de la modelización del transporte y la planificación en el sector. Hemos especulado, investigado y probado en la práctica algunas ideas nuevas y otras no tan novedosas, coincidiendo a veces y también discrepando tanto sobre temas como sobre el nivel de detalle requerido en la modelización o sobre el valor de los modelos desagregados al efectuar previsiones de demanda; aprovechando un período en el que nuestras visiones convergieron, las plasmamos en este texto. Deseamos presentar lo que consideramos, desde nuestra perspectiva, las técnicas más importantes de modelización de transporte de forma accesible tanto a estudiantes como a profesionales del sector en sus diferentes ámbitos. Esto lo intentamos haciendo especial hincapié en ciertos temas clave de la modelización y planificación de sistemas de transporte contemporánea: • La importancia práctica de la consistencia teórica en la modelización del transporte. • El tema de los errores en los datos y en la especificación de los modelos, su importancia relativa y los métodos para tratarlos. • El papel fundamental del contexto en que se toman las decisiones en la elección de las herramientas de modelización más apropiadas. • Las ventajas de una modelización flexible: un modelo marco simplificado unido a uno mucho más detallado que permita tratar las decisiones que se deben tomar. • La importancia de una función de seguimiento dependiente de un sistema de recolección continua de datos así como de la actualización de previsiones y modelos, para conformar modelos de respuesta rápida que puedan ser adaptados a un entorno cambiante.



Prólogo a la edición inglesa

Hemos afrontado estos temas desde el punto de vista de un ejercicio de modelización, discutiendo el papel de la teoría, los datos, la especificación del modelo en su sentido más amplio y la estimación, validación y capacidad predictiva de los modelos. Nuestro objetivo al escribir este libro fue producir tanto un texto para un curso de licenciatura o máster en transporte, como un volumen de referencia para los profesionales del sector; no obstante, las materias se presentan de forma que también sean útiles para cursos de ingeniería civil, geografía y urbanismo. El libro se basa en nuestros apuntes de clase que fueron preparados y mejorados a lo largo de varios años de docencia de pre y postgrado; además los hemos utilizado para adiestrar a profesionales tanto a través de programas de práctica internos como de cursos cortos de actualización. Finalmente, los hemos ampliado y mejorado para cubrir material adicional y ayudar a los lectores a abordar el libro sin el apoyo expreso de un supervisor. Los Capítulos del 3 al 9, 12 y 13 proporcionan todos los elementos necesarios para impartir un curso de unas 30 sesiones sobre modelización de la demanda de transporte. De hecho, hemos impartido cursos de esta naturaleza, con diferente énfasis en determinados temas, a nivel de pregrado en Chile y a nivel de postgrado en Gran Bretaña, Portugal, Colombia y España. Si se añade material de los Capítulos 10 y 11 se puede conformar un curso completo sobre modelización de sistemas de transporte. Los Capítulos del 4 al 6 y del 10 al 12 constituyen el núcleo básico para un curso sobre modelos de equilibrio en transporte; cabe reseñar que un curso sobre modelización de la oferta requeriría más material, en particular aquel relacionado con importantes aspectos de la oferta de transporte colectivo, que no se discuten con suficiente detalle. El Capítulo 1 proporciona una introducción a temas de planificación de transporte y esboza nuestra visión sobre la relación entre planificación y modelización. El Capítulo 2 está ahí principalmente para el beneficio de aquellos que deseen refrescar sus conocimientos analíticos y hacer que el texto sea lo suficientemente auto-contenido. Durante nuestra vida profesional hemos tenido la suerte de poder combinar enseñanza, investigación y consultoría profesional. Así, hemos aprendido de publicaciones científicas, investigaciones, experimentación y de nuestros errores; felizmente estos últimos no han sido demasiado costosos en términos de asesoría inadecuada. Esto no es sólo una cuestión de suerte; un analista que se precie, paga por los errores cometidos trabajando más duro y por mayor tiempo, a fin de definir formas alternativas para resolver una tarea de mo-

MODELOS

DE

TRANSPORTE



delización dificultosa. Hemos aprendido la importancia de elegir técnicas y tecnologías apropiadas para cada tipo de problema; la capacidad de adaptar enfoques de modelización a problemas de toma de decisiones es una habilidad clave de nuestra profesión. A través del libro se examinan las restricciones prácticas de los modelos de transporte en planificación, particularmente en vista de las limitaciones de las actuales técnicas analíticas, y de la naturaleza y calidad de los datos típicamente disponibles. Hemos evitado el detalle matemático intrincado de cada modelo para concentrarnos, por el contrario, en sus principios básicos, la identificación de sus fortalezas y limitaciones y una discusión sobre su uso. El nivel teórico ofrecido por este libro es, en nuestra opinión, suficiente para seleccionar y utilizar los diferentes modelos en la práctica. También hemos intentado acortar la brecha existente entre las publicaciones más teóricas y los libros más pragmáticos (tipo recetario); no creemos que la profesión pueda ser bien servida por un libro simplista del tipo “Consejos para…” que proporcione un facsímile para cada problema de modelización. No existen soluciones únicas en modelización y planificación de transporte. La dependencia de la modelización del contexto y la teoría es un tema recurrente en este libro. Nuestro objetivo es proporcionar suficiente información y guía para que los lectores puedan comprender y aplicar realmente cada técnica en terreno; bajo esta perspectiva, nos hemos esforzado en analizar los aspectos prácticos relacionados con la aplicación de cada metodología. En todos los casos en los que el área de estudio aún está sujeta a desarrollo, hemos incidido en presentar extensas referencias bibliográficas a artículos científicos y libros que el lector interesado puede consultar si le parece necesario. Asimismo, en relación con los enfoques de modelización más consolidados, hemos mantenido solamente las referencias esenciales para comprender la evolución de los temas, o que sirvan como punto de partida para desarrollar nuevas investigaciones. Consideramos que no se puede aspirar a ser un profesional cualificado, en cualquier área, sin hacer trabajo real en un laboratorio o en terreno. Por ello, hemos ido más allá de la mera descripción de las técnicas, acompañándolas de varios ejemplos de aplicación. Éstos sirven para ilustrar algunos de los problemas teóricos o prácticos relacionados con cada modelo en particular. Finalmente proporcionamos algunos ejercicios al final de los capítulos clave: éstos pueden resolverse con el apoyo de calculadoras científicas de bolsillo (o incluso mejor, con una hoja de cálculo) y deberían ayudar a comprender mejor los modelos analizados.



Prólogo a la edición inglesa

Aunque el libro es ambicioso, ya que abarca un número relativamente elevado de temas, debemos aclarar desde el principio que no intentamos (ni consideramos posible) estar totalmente actualizados en cada tema tratado. Si bien constituye una buena reflexión sobre el estado del arte, para investigaciones de punta el lector debería utilizar las referencias bibliográficas que se han incluido como avisos para futuras investigaciones. Gran parte de la primera edición de este libro se escribió durante el año sabático de uno de nosotros en University College London en el curso 1988-1989. Ello fue posible gracias al apoyo proporcionado por el UK Science and Engineering Research Council, The Royal Society, la Fundación Andes (Chile), el Consejo Británico y The Chartered Institute of Transport. Damos las gracias por dicho apoyo, así como agradecemos también la financiación proveniente de muchas instituciones y agencias en los últimos veinte años para nuestras investigaciones. Aunque ambos autores hemos hecho la misma contribución intelectual al contenido del libro, a la hora de redactar y recopilar el variado material que lo compone nos hemos beneficiado de numerosas discusiones e intercambio de ideas con amigos y colegas. Richard Allsop nos enseñó mucho acerca de metodología y rigor. Las ideas de Huw Williams’s están detrás de muchas de las contribuciones teóricas del Capítulo 7. Andrew Daly y Hugh Gunn nos ayudaron a aclarar muchos temas de los Capítulos 3, 7 y 8. El énfasis de Dirck Van Vliet en explicar la asignación y el equilibrio en términos simples pero rigurosos inspiró los Capítulos 10 y 11. Tony Fowkes nos proporcionó valiosos comentarios sobre previsión de la tasa de motorización y sobre métodos de preferencias declaradas. Jim Steer aportó una referencia constante a los problemas prácticos y a la necesidad de desarrollar mejores enfoques para abordarlos. Muchas partes del libro se han beneficiado del libre y entusiasta intercambio de ideas con nuestros colegas J. Enrique Fernández y Joaquín de Cea, de la Pontificia Universidad Católica de Chile; Sergio Jara y Jaime Gibson, de la Universidad de Chile; Marc Gaudry, de la Universidad de Montreal; Roger Mackett, del Univesity College London; Dennis Gilbert, del Imperial College y Mike Bell, de la Universidad de Newcastle upon Tyne. Por supuesto, muchos otros colegas han contribuido, sin saberlo, a nuestras reflexiones. Por otro lado, las sucesivas ediciones de este libro se han beneficiado de los comentarios de un gran número de amigos y lectores que nos han ayudado a identificar errores y áreas de mejora. Entre ellos habría que mencionar a Patrick Bonnel, del French Laboratoire d’Economie des Transports; Michael Florian,

MODELOS

DE

TRANSPORTE



de la Universidad de Montreal; Rodrigo Garrido, de la Pontificia Universidad Católica de Chile; Ben Heydecker, del University College London; Frank Koppelman, de la Northwestern University; Mariëtte Kraan, de la University of Twente; Marcela Munizaga, de la Universidad de Chile; Piotr Olszewski, de la Nanyang Technological University, y Sofía Athanassiou, Neil Chadwick y David Pearmain, de Steer Davies Gleave. Nuestro agradecimiento final va dirigido a todos nuestros estudiantes en Gran Bretaña, Chile, Colombia, Portugal y España. Ellos son siempre agudos críticos y nos han estimulado a invertir nuestro tiempo de forma provechosa. No todas las sugerencias que se nos han hecho han sido tenidas en cuenta, por cuanto algunas de ellas habrían significado modificar el enfoque y estilo del texto; pensamos que otros libros, en el futuro, continuarán aclarando ciertos temas y proporcionarán un mayor rigor a muchos de los temas aquí tratados. El transporte es realmente una problemática muy dinámica. Finalmente, a pesar de todo este apoyo generoso, nos consideramos –como antes– los únicos responsables de los errores que puedan subsistir en esta tercera edición. Valoramos, genuinamente, la oportunidad de aprender de nuestros errores.

Prólogo a la edición en castellano

L

Ángel Ibeas Portilla y Luigi dell’Olio Profesores de Planificación de Transporte y Transporte Urbano Universidad de Cantabria, Santander (España) http://grupos.unican.es/gist/index.asp

a difusión internacional de Modelling Transport de Juan de Dios Ortúzar y Luis Willumsen ha alcanzado ya su tercera edición, lo cual no hace más que confirmar el gran interés suscitado en el ámbito del transporte por esta obra, que constituye un pilar básico y fundamental en la adquisición, aprendizaje y consulta del conocimiento en la materia. Conscientes de que muchos estudiantes, académicos y profesionales del transporte disponen de la versión original inglesa –y recientemente de la italiana–, no es menos cierto que no existen demasiados textos en habla hispana capaces de aglutinar el saber de la modelización del transporte. Por otra parte, 400 millones de personas en el mundo hispanohablante bien merecen la atención dispensada por el equipo traductor. Para los profesores de transporte de la Universidad de Cantabria (España) que han dirigido dicho equipo de traductores, la traducción de Modelling Transport ha constituido un reto y, sobre todo, una incitación al conocimiento: prácticamente todos los epígrafes proporcionan una apertura de horizontes del saber que estimula no sólo su lectura, sino también la curiosidad y el ánimo de acometer posteriores indagaciones en la literatura mundial al respecto. Por si no bastara lo indicado, nos ha animado a acometerlas la confianza depositada por los autores en este equipo traductor y el apoyo institucional de la Universidad de Cantabria, una de las tres mejores de España. Los rápidos cambios que se están produciendo en la sociedad internacional, es decir, de mercados de oferta a mercados de demanda, del paso de la sociedad industrial a la postindustrial, del trabajo individual al trabajo en red, el salto hacia la sociedad del conocimiento y de ésta a la globalización, hacen plenamente vigentes los conocimientos recopilados en el Modelling Transport. Está claro que los resultados que la modelización matemática aplicada al transporte proporciona, no son la panacea universal ni deben considerarse



Prólogo a la edición en castellano

como verdades absolutas. Más bien, su carácter objetivo la convierte en una herramienta potente e indispensable a la hora de tomar decisiones de planificación. Por ello, en este libro se describen métodos y criterios, así como las técnicas más importantes y novedosas de dicha modelización, tanto a nivel teórico como su aplicación práctica. El carácter fundamentalmente científico, pedagógico y la estructura de la obra se concretan en cada capítulo complementándose con una serie de ejercicios propuestos al final de cada uno de ellos. Éstos resultan útiles para afianzar, por un lado, las técnicas propuestas y, por otro, para estimular la imaginación del lector, que estará en condiciones de proponer soluciones metodológicas a las situaciones reales que se planteen. En resumen, Modelling Transport proporciona una reseña prácticamente única y exhaustivamente puesta al día, de las principales técnicas de modelización del sistema de transportes. El texto de Ortúzar y Willumsen tiene, además, el importante mérito de proponer formas de análisis poco o nada practicadas en España hasta la fecha. Últimamente se detecta un mayor interés por estas técnicas de apoyo para la toma de decisiones en políticas de planificación. Su flexibilidad empieza a convencer a los políticos, quienes hasta ahora las consideraban encorsetadoras de sus decisiones. En último término, la realidad es siempre la que marca el camino y la que hace que problemas tan serios como la contaminación, el deterioro medioambiental o los accidentes requieran soluciones eficientes que rara vez van a confiarse exclusivamente a la aplicación de modelos mentales insuficientemente justificados. Por ello precisamente gana terreno el recurso a técnicas matemáticas aplicadas al sector del transporte, porque están suponiendo una importante disminución de los componentes de error en el ámbito de la planificación. Se ha emprendido la traducción de Modelling Transport con entusiasmo y deseos de seguir aprendiendo y divulgando, aunque en varias ocasiones no han faltado dudas acerca de determinados subepígrafes de la versión original. La traducción que ofrecemos es la versión completa de la tercera edición de Modelling Transport que mantiene el justo equilibrio entre los elementos teóricos y las aplicaciones prácticas que caracteriza el texto y lo hace particularmente atractivo tanto para los iniciados como para los especialistas del sector. Como se ha dicho, y en lo tocante al contenido, la obra proporciona indicaciones claras para profundizar precisamente en los elementos teóricos que están en la base de los modelos de transporte, así como para especular sobre interesantes temas de investigación de vanguardia.

MODELOS

DE

TRANSPORTE



En cuanto a los aspectos formales de la traducción realizada, se ha tratado de alcanzar un justo compromiso entre la claridad del lenguaje y la fidelidad a la versión original, además del compromiso pragmático de mantener algunos términos en inglés, en particular aquellos que, por nuestra experiencia en el ámbito del transporte, consideramos que son de uso común en castellano. En el convencimiento de que contar con una versión en castellano del libro Modelling Transport representa una contribución significativa para el mundo de habla hispánica, el Grupo de Investigación de Sistemas de Transporte de la Universidad de Cantabria desea mostrar su agradecimiento, en primer lugar, a los dos autores del libro, los profesores Juan de Dios Ortúzar y Luis Willumsen, por haber depositado su confianza en nuestro grupo confiándonos la realización de este trabajo y por las sucesivas revisiones de la traducción realizada. En segundo lugar, al Consorcio Regional de Transportes de Madrid, entidad siempre preocupada por el desarrollo del transporte en todas sus vertientes incluso en la científica, como entidad patrocinadora. En tercer lugar, al investigador y asiduo colaborador del Grupo de Investigación de Sistemas de Transporte de la Universidad de Cantabria, D. Felipe A. González Rojas, ingeniero civil por la Pontificia Universidad Católica de Chile, que ha revisado la traducción de todos los conceptos matemáticos de los modelos del libro; a la investigadora Aida Inguanzo, también de la Universidad de Cantabria, por su apoyo en la revisión ortográfica y gramatical; a José Luis Moura por los desbroces iniciales para los capítulos 5, 12 y 13; al Ingeniero de Caminos, Canales y Puertos Antonio García Pastor, de Steer Davies Gleave España, por su interesante aportación en la traducción de los Capítulos 3, 8 y sobre todo del 12; a Cris Aol, geógrafo, también por sus desbroces iniciales en los Capítulos 1, 8 y 13. Además debemos mucho a la versión italiana Pianificazione Dei Sistema Di Transporto, de Elisabetta Cherchi e Italo Meloni, que por la similitud de idioma ha facilitado grandemente la comprensión de la versión inglesa. No queremos dejar de agradecer, asimismo, la ayuda recibida de otras muchas personas que, en mayor o menor medida, han intervenido en este intenso y muy interesante trabajo a lo largo de su desarrollo. Por último, queremos destacar nuestro agradecimiento a la Universidad de Cantabria, que, de acuerdo con la editorial Wiley, se encarga de la edición y distribución de esta edición española.

1. Introducción

1.1.

PLANIFICACIÓN Y MODELIZACIÓN DEL SISTEMA DE TRANSPORTES

1.1.1. Antecedentes

A

unque en las últimas décadas se han producido sustanciales cambios en el devenir mundial a los que el transporte no ha sido en absoluto ajeno, muchos de sus problemas no sólo han persistido del pasado sino que incluso se han incrementado. Situaciones como la congestión, la contaminación, los accidentes, el déficit financiero de las empresas municipales de transporte público siguen siendo hoy en día problemas tan o más importantes que en el pasado, apareciendo como nuevos retos a resolver en un entorno de movilidad sostenible. No obstante, últimamente ha sido posible aprender bastante de un período de escasa planificación, limitada inversión, énfasis en el corto plazo y en general, falta de confianza en la modelización y toma de decisión estratégica tanto en países en desarrollo como en muchos países industrializados. Se ha aprendido, por ejemplo, que los problemas básicos recién mencionados no desaparecen simplemente con la aplicación de mejores técnicas de gestión del tráfico; de hecho, estos problemas clásicos tienden a reaparecer con mayor virulencia difundiéndose en áreas más amplias y adoptando nuevas formas aún más difíciles y complejas de manejar. En estos momentos, el mundo desarrollado está pasando por una fase de mayor confianza en las soluciones técnicas que en décadas anteriores. No es una confianza ciega en la tecnología como proveedora de soluciones mágicas para los problemas sociales y económicos; también hemos aprendido que éstas no son más que un mero espejismo. Sin embargo, la electrónica y la informática han avanzado tanto que posibilitan nuevas concepciones de infraestructura del transporte (p. ej., sistemas guiados automáticos) y de los sistemas de movimiento (p. ej., sistemas de navegación vial y trenes completamente automatizados).



Introducción

De interés especial son los avances logrados en las últimas décadas en la informática a bajo coste, tanto en el software como sobre todo en el hardware, lo cual ha posibilitado la eliminación de los “cuellos de botella” clásicos en el tratamiento masivo de datos. De hecho, las principales limitaciones van ahora por el lado humano y técnico: la planificación de transporte contemporáneo requiere de profesionales muy bien cualificados así como de técnicas de modelización teóricamente sólidas con implementaciones computacionales eficientes y que faciliten su interpretación. Asimismo, la mayoría de los países en desarrollo también sufren problemas graves de congestión y contaminación urbana en particular y de transporte en general. Dichos problemas no son ya sólo la falta de conexiones entre áreas rurales y los correspondientes mercados sino que también padecen los típicos problemas del mundo industrializado. Desgraciadamente, los países en desarrollo tienen características diferentes que demandan tratamientos también distintos: ingresos bajos, crecimiento rápido, alta demanda en el transporte público, escasez de recursos, datos fiables y de personal cualificado. Los comienzos del siglo XXI vienen caracterizados por dos importantes hechos conceptuales que afectan a multitud de aspectos vitales y, por tanto, al progreso socio-económico. En primer lugar, el concepto de globalización, así como la potenciación de la “sociedad del conocimiento” y, en segundo lugar, y como soporte a ella, el fuerte desarrollo de las telecomunicaciones baratas y de alta capacidad. La combinación de ambas consigue la correspondiente integración en redes más amplias cambiando la forma en que se abordan muchos de los problemas actuales. Evidentemente, el mundo del transporte, no puede ser ajeno a dichas transformaciones. Algunas de estas influencias son: i) las variaciones sustanciales en las asignaciones de tráficos a las redes de transporte gracias a la agilidad que supone la rápida tramitación de instrucciones a través del mundo de Internet, una “ventaja competitiva empresarial” nada despreciable en las economías modernas; ii) la decisiva implicación del sector privado en el suministro y la operación del transporte hasta ahora en determinados ámbitos en manos del poder público; iii) el papel también decisivo de las telecomunicaciones en la posibilidad de reducir la necesidad de viajar al poder, por ejemplo, tener reuniones no presenciales, sobre todo en transacciones internacionales. En cuanto se refiere a transporte, puede afirmarse que en el último tercio del siglo pasado se produjeron importantes avances técnicos en la modelización, especialmente en los principales centros de investigación; estos desarrollos

MODELOS

DE

TRANSPORTE



han ido perfeccionándose e implementándose por grupos selectos de expertos, aunque muchas de esas innovaciones no han tenido demasiado alcance fuera de los ámbitos académicos. Por lo tanto, después de estos años de experimentación comienza a observarse una mayor comprensión del papel que pueden cumplir los modelos de transporte a la hora de tomar decisiones en la planificación y es por lo que en este libro se intenta revisar lo más importante de la práctica actual en la modelización del transporte. En la mayoría de los casos se abordan los aspectos más avanzados seleccionando aquellos que ya han sido implementados con éxito en la práctica. Asimismo este libro no representa tanto la vanguardia de la investigación en la modelización, pero sí intenta proporcionar herramientas fundamentales para quienes desean mejorar el conocimiento sobre la modelización y su repercusión en la planificación del transporte. Puede afirmarse, por tanto, que esta obra trata de tender un puente o ser un punto de partida hacia trabajos más teóricos que, sin duda, conformarán la base de la modelización del transporte en el próximo futuro. Ha de quedar claro entonces que la modelización del transporte no es la planificación del transporte sino una herramienta para la toma de decisiones en dicha actividad, a pesar de que en determinadas ocasiones puede adquirir un papel preponderante aunque no definitivo. Se conocen muchos y buenos profesionales que han desarrollado modelos de transporte suficientemente sofisticados pero que, sin embargo, han visto frustrado su trabajo por su falta de consideración a la hora de la toma de decisiones en planificación. La realidad es que la modelización ha de ser considerada como una herramienta de apoyo para la toma de decisiones y no como el objetivo principal de dicha planificación. Esta filosofía sustenta este trabajo.

1.1.2.

Los modelos y su papel

Un modelo es, esencialmente, una representación simplificada de la realidad: el sistema de interés. Es una abstracción que se utiliza para lograr mayor claridad conceptual acerca de la realidad, reduciendo su variedad y complejidad a niveles que permitan comprenderla y especificarla de forma adecuada para su análisis. Normalmente en un modelo se expresan de forma simplificada las características más relevantes (para el caso estudiado) de un cierto fenómeno o situación real. Una definición tan amplia permite diferenciar los modelos físicos de los abstractos. Por ejemplo, en la primera categoría están aquellos modelos tales como maquetas arquitectónicas, túneles de viento o modelos en



Introducción

canales, oleaje y presas en ingeniería hidráulica o modelos de regeneración de playas o de diques portuarios, los cuales están claramente limitados al aspecto del diseño. En la segunda categoría, la tipología de modelos abarca desde los modelos mentales, usualmente utilizados en nuestras interacciones diarias, hasta las representaciones formales y abstractas (típicamente analíticas) de alguna teoría acerca del sistema de interés de que se trate y de cómo funciona (modelos abstractos). Los modelos mentales juegan un papel importante en la comprensión y la interpretación del mundo real así como de los modelos analíticos que se utilizan en la planificación del transporte. Se mejoran mediante discusiones, adquisición de nuevo conocimiento y, sobre todo, experiencia; por ese motivo son difíciles de comunicar y validar. Este libro trata principalmente una importante clase de modelos abstractos: los modelos matemáticos que intentan replicar el sistema de interés y su comportamiento por medio de ecuaciones matemáticas basadas en ciertas hipótesis teóricas. Aunque no dejan de ser representaciones simplificadas, estos modelos pueden ser muy complejos y frecuentemente requieren el uso de importantes cantidades de datos. Los modelos, en todo caso, son un instrumento muy valioso en cuanto a que suponen “un ámbito común” de discusión en políticas de intervención, permitiendo examinar, con un mínimo de objetividad, el inevitable compromiso que la experiencia requiere. Otra ventaja importante de los modelos matemáticos es que durante su formulación, calibración y uso, el planificador puede aprender mucho, mediante la experimentación, acerca del comportamiento y funcionamiento interno del sistema en cuestión. De esta forma, se pueden enriquecer los modelos mentales consiguiendo así una mejor y más inteligente organización y gestión del sistema de transporte. Un modelo es solamente una representación realista desde una perspectiva particular de la realidad. Puede ser razonable usar un cuchillo y un tenedor sobre una mesa para representar la posición de unos coches antes de un choque, pero no para representar sus sistemas mecánicos o su elección de ruta. Lo mismo se puede decir acerca de los modelos analíticos: su valor está limitado a un conjunto de problemas que están bajo ciertas condiciones específicas. Como se discute en el resto de este capítulo, un modelo sólo es apropiado según el contexto donde se va a utilizar. La habilidad de elegir y adaptar los modelos a contextos específicos es uno de los elementos más importantes en el bagaje total del planificador. El objetivo de este libro es resaltar la contribución que la modelización del transporte puede proporcionar a la mejora de las decisiones en el campo

MODELOS

DE

TRANSPORTE



del transporte, sosteniendo no sólo que el uso de los modelos es inevitable sino que el uso de modelos formales es altamente deseable. Como se mencionó anteriormente, la modelización del transporte es solamente una parte de la planificación. Los procedimientos administrativos, el marco institucional, profesionales expertos y con buen nivel de comunicación con quienes toman las decisiones, con los medios de comunicación y con el público, son los otros elementos que un sistema de planificación eficaz debe incluir. Por otro lado, la modelización del transporte y el proceso decisional pueden ser combinados de diferente forma, en función de la experiencia local, de sus tradiciones y competencias. Por tanto, antes de discutir cómo elegir un modelo y una aproximación a la planificación, merece la pena definir algunas de las características principales de los sistemas de transporte y de sus tópicos asociados, así como ilustrar algunos problemas importantes que se presentan en la modelización y de los cuales se dará cuenta en otros capítulos de este libro.

1.2.

PROBLEMÁTICA DEL TRANSPORTE

Los problemas asociados al transporte son ya más globales y serios que nunca, tanto en los países industrializados como en los que están en proceso de desarrollo. La escasez de combustibles líquidos puede no ser un problema serio en la actualidad. Sí lo son la congestión, el elevado consumo de tiempo, la accidentalidad y los consecuentes problemas medioambientales y de calentamiento global y más críticos hoy que nunca. Estos problemas no solamente se limitan al tráfico en las calles y/o carreteras o a los vehículos. El crecimiento económico parece haber generado una demanda tal que sobrepasa las capacidades de la mayoría de los sistemas de transporte. Asimismo, los largos períodos de limitada inversión en algunos modos de transporte y regiones, han dado como resultado que redes frágiles puedan colapsarse al menor incidente o variación en la demanda. Probablemente estos problemas no van a desaparecer en un futuro próximo. Ha transcurrido tanto tiempo con poca o inadecuada planificación en el transporte que es seguro que hará falta un esfuerzo importante para mejorar la mayoría de los diversos modos de transporte, tanto en las zonas urbanas como interurbanas. Por lo tanto, dado que los recursos son limitados, dicho esfuerzo ha de ser realizado meticulosamente mediante decisiones cuidadosas orientadas hacia la maximización del beneficio de nuevos servicios de transporte, al mismo tiempo que se minimizan sus costes y efectos colaterales no deseados.



1.2.1.

Introducción

Características de la demanda de transporte

La demanda de servicios del transporte es altamente cualitativa y diferenciada. Existe una amplia gama de demandas específicas de transporte que se diferencian por hora del día, día de la semana, motivo del viaje, tipo de mercancía, importancia de la velocidad y frecuencia, etcétera. Un servicio de transporte sin los atributos que permitan satisfacer esta demanda diferenciada puede ser totalmente inútil. Estas características hacen más difícil analizar y predecir la demanda por servicios de transporte: las ton/km y los pasajeros/km son unidades de rendimiento extremadamente gruesas que esconden una inmensa gama de requerimientos y servicios. La demanda de transporte es una demanda derivada, es decir, no es un fin en sí misma. Con la posible excepción del turismo, la gente viaja para satisfacer ciertas necesidades en sus destinos (trabajo, salud, entretenimiento). Esto es aún más cierto en el caso de las mercancías. Para comprender la demanda de transporte es importante analizar cómo están distribuidas en el espacio las facilidades para satisfacer estas necesidades humanas e industriales, tanto en contextos urbanos como regionales. Es evidente que un buen sistema de transporte amplía las oportunidades para satisfacer dichas necesidades, así como un sistema muy congestionado o mal conectado limita las opciones de movilidad y, por tanto, el desarrollo económico y social. La demanda de transporte tiene lugar en relación al espacio. Aunque parece trivial, es la distribución de las actividades en el espacio lo que provoca la demanda de transporte. Existen algunos problemas de transporte que se pueden tratar, a un nivel muy agregado, sin considerar explícitamente el espacio. Sin embargo, en la gran mayoría de los casos, el tratamiento explícito del espacio es inevitable y muy deseable. El enfoque más usual para tratar el espacio consiste en dividir el área de estudio en zonas y codificarlas, junto a las redes de transporte, de una forma adecuada para su procesamiento y tratamiento con la ayuda de paquetes computacionales especializados (software). En algunos casos, el área de estudio puede ser descrito simplificadamente, suponiendo que las zonas de interés forman un corredor que puede ser representado mediante un sistema lineal. En ambos casos existen diferentes métodos para tratar la distancia y/o distribuir orígenes y destinos (y sus atributos) en el espacio, los cuales son elementos esenciales del análisis de transporte. La articulación espacial de la demanda frecuentemente provoca problemas de falta de coordinación del sistema, la cual puede influir, de forma relevante,

MODELOS

DE

TRANSPORTE



en el equilibrio entre oferta y demanda de transporte. Por ejemplo, un servicio de taxis puede tener una fuerte demanda no satisfecha en una parte de la ciudad, mientras en otras existen muchos taxis buscando clientes. Por otro lado, la concentración de población y actividad económica en corredores bien definidos puede justificar un sistema de transporte masivo de alta capacidad que quizás no sería defendible en áreas geográficas con menor densidad de actividades. Finalmente, la oferta y demanda de transporte tienen elementos dinámicos muy potentes. Una parte importante de la demanda de viajes de transporte se concentra especialmente, durante unas pocas horas del día, en áreas urbanas coincidentemente con los momentos de mayor congestión de tráfico (horas punta). Esta característica de variabilidad de la demanda en el tiempo hace que su análisis y cálculo de previsiones sean más difíciles y a la vez también más interesantes de estudiar. Puede ser que un sistema de transporte funcione adecuadamente para la demanda promedio de viajes pero que se colapse durante la hora punta. Existen varias técnicas para tratar de repartir la carga de la hora punta de una red: flexibilizar los horarios de trabajo, partir la jornada laboral, tarificación por congestión, etc. Sin embargo, la variación de demanda entre las horas punta y valle sigue siendo un problema central y fascinante de la modelización y planificación del transporte.

1.2.2. Características de la oferta de transporte La primera característica de la oferta de transporte es que es un servicio y no una mercancía; por lo tanto, no se puede almacenar para ser utilizada cuando exista una demanda mayor. Un servicio de transporte tiene que ser consumido cuándo y dónde se produce, si no, pierde su beneficio. Por esta razón es muy importante estimar la demanda con la mayor precisión posible para así ahorrar recursos ajustando la oferta de servicios de transporte a ella. Muchas características de los sistemas de transporte provienen de su naturaleza como servicio. En términos muy generales, un sistema de transporte requiere un número de activos fijos (la infraestructura) y un número de unidades móviles (los vehículos). Es la combinación de ambos, junto con una serie de normas para su operación, lo que posibilita el movimiento de personas y mercancías. Frecuentemente se da el caso de que la infraestructura y/o los vehículos de transporte no son propiedad ni son operados por la misma empresa o grupo de empresas. Esto sucede en la mayoría de los modos de transporte, con



Introducción

la excepción notable de muchos sistemas ferroviarios. La separación entre el gestor de infraestructura y el gestor del servicio final de transporte genera una serie de interacciones suficientemente complejas entre entidades o Administraciones Públicas (estatales, regionales y/o locales), empresas de construcción, empresarios, operadores de transporte, viajeros, transportistas y público en general. Este último juega diversos papeles en la oferta de servicios de transporte, ya que con sus demandas puede influir en la puesta en marcha o no, de nuevos servicios que satisfagan sus necesidades dotando así, por ejemplo, de accesibilidad a un territorio y fomentando a la vez el desarrollo y la actividad económica. La provisión de infraestructura de transporte es particularmente importante desde el punto de vista de la oferta. La infraestructura de transporte es un “sistema unitario”, en el sentido de que no se puede concebir media pista de aterrizaje o la tercera parte de una estación de ferrocarril. Ciertamente, en algunos casos, puede haber razones suficientes para proveer gradualmente infraestructura a medida que crece la demanda. Por ejemplo, se puede empezar con una carretera sin pavimento, mejorarla más adelante con una o dos vías mediante un tratamiento superficial; luego una carretera sencilla o autovía bien construida, para finalizar con una carretera a nivel de autopista. De esta forma, la provisión de la infraestructura puede ajustarse y adecuarse a la demanda, evitándose así tempranas inversiones en instalaciones costosas innecesarias. Esto no es tan sencillo en otras áreas como, por ejemplo, aeropuertos, líneas ferroviarias, de metro, etcétera. A este respecto es necesario indicar que las últimas tendencias en la planificación del transporte van dirigidas hacia la gestión de la demanda en entornos de movilidad sostenible. El espacio es limitado pero el crecimiento de la demanda no lo es tanto. Por ello, puede ser interesante, en lugar de crecer en infraestructuras, proceder a una mejor optimización de los recursos existentes gestionando adecuadamente la demanda en modos y formas diferentes a los utilizados en las últimas décadas. Por otro lado, las inversiones en infraestructura del transporte no solamente son enormes sino que también su puesta en servicio lleva un tiempo considerable. Normalmente se trata de proyectos grandes y desde que comienza su planificación hasta que se implementan pueden pasar entre 5 y 15 años. Este aspecto es incluso más crítico en áreas urbanas en las que cualquier construcción y/o reparación de infraestructura de transporte, puede provocar serias perturbaciones, cuyas repercusiones en los usuarios y no usuarios son evidentes.

MODELOS

DE

TRANSPORTE



Además, las inversiones en transporte tienen un componente político muy importante. Por ejemplo, en los países en desarrollo los políticos normalmente consideran los proyectos de carreteras como algo seguro electoralmente: demuestran que hacen algo y es difícil que los medios de comunicación puedan demostrar errores. En países industrializados, en cambio, los proyectos de transporte normalmente conllevan el riesgo de polemizar con los residentes afectados o con los usuarios que sufren debido a la congestión y a los retrasos en obras sobrepasadas por la demanda. El juicio político es esencial en este tipo de disyuntivas, pero cuando no está apoyado por una planificación exhaustiva, las decisiones resultan ser una reacción rápida y, en general, poco reflexiva al problema y al momento de crisis; en el caso del transporte esto es, inevitablemente, “demasiado tarde”. En estos casos, la reflexión y la planificación son esenciales. En los 80, el énfasis en medidas tácticas de gestión de transporte a corto plazo reflejaba tanto una desconfianza en la modelización como un intento de evitar los problemas políticos, y una incapacidad a la hora de pensar estratégicamente acerca del futuro del sistema de transporte. La separación entre los que proveen infraestructura y los que ofrecen servicios introduce también complejidades desde el punto de vista económico. Para empezar, no siempre está claro que todos los usuarios perciban realmente los costes totales incurridos en la provisión de los servicios que ellos usan. Por ejemplo, prácticamente nunca se paga directamente por el espacio físico ocupado por las carreteras y cuando se hace, no se incluyen los costes de congestión u otras externalidades; posiblemente lo más cercano a esto son las autopistas de peaje y los modernos esquemas de tarificación vial. Los impuestos sobre vehículos y combustibles son solamente una aproximación genérica al pago por la provisión de infraestructura. Pero, ¿son importantes estas cuestiones? ¿no ocurre quizás que otros bienes y servicios como los parques públicos, las bibliotecas, la policía son a menudo proporcionados sin realizar ningún pago directo? ¿Qué problema hay en permitir la libre utilización económica de las calles? La teoría económica básica nos enseña que sí importa. En un mercado perfecto, una buena asignación de recursos para satisfacer las necesidades humanas solamente se consigue cuando los costes marginales de los bienes son iguales a su utilidad marginal. Por eso, a menudo se dice que el precio de los bienes y servicios, es decir, su coste percibido, debería fijarse según su coste marginal. Por supuesto, los mercados reales no son perfectos y la capacidad para pagar no es un buen indicador de necesidad; sin embargo, este marco general proporciona una base



Introducción

para contrastar otras formas de organizar el sistema de precios y su impacto en la asignación de recursos. El transporte es un elemento muy importante en el bienestar de los países y sus habitantes. Si los usuarios que utilizan la infraestructura de transporte no perciben las consecuencias de sus elecciones en términos de recursos, probablemente van a generar un equilibrio ineficiente entre oferta y demanda. Se despilfarrarán recursos, escasos al ser tarificados por debajo de su coste real, mientras que recursos más abundantes pero tarificados podrían no ser utilizados. El hecho de que globalmente algunos sectores de la economía (típicamente los dueños de vehículos privados) paguen más de lo necesario (a través de impuestos, tasas, combustibles, etc.) por el uso de infraestructura, no garantiza una asignación de recursos más racional. Los propietarios de coches probablemente ven estos costes anuales como costes fijos (a fondo perdido) y como mucho afectan en su decisión de comprar un coche, pero no de utilizarlo. En los países industrializados, sobre todo, las subvenciones entre usuarios se producen de forma “cruzada” no sólo entre modos (los impuestos del combustible pueden usarse para subvencionar el ferrocarril) sino dentro del mismo modo (los costes de mantenimiento de las carreteras son pagados mucho más ampliamente por los coches en función de lo que deterioran, que lo que pagan los vehículos pesados que, evidentemente, deterioran mucho más). Comparados con los vehículos pesados, los coches contribuyen más a los costes de mantenimiento de una carretera (de peaje o no) que el deterioro que ambos generan. Otro elemento de distorsión proviene de los efectos secundarios asociados a la producción de servicios de transporte: accidentes, contaminación y degradación del medioambiente en general. Estos efectos normalmente no son internalizados; el usuario del sistema de transporte raramente percibe el coste medioambiental o los gastos derivados de las hospitalizaciones de los heridos en accidentes relacionados con el transporte. Internalizar estos costes también podría ayudar a mejorar la toma de decisiones en planificación de transporte y, por tanto, a mejorar la asignación de la demanda hacia modos alternativos. Una de las características más importantes de la oferta de transporte es el grado de congestión al que se ha llegado últimamente, sobre todo en áreas urbanas y en algunas infraestructuras interurbanas. Es difícil definir la congestión objetivamente aunque todos sabemos cuándo la sufrimos. Hay aquí un problema de “percepción”, ya que de sobra es conocido que lo que se considera congestión excesiva en ciudades como Leeds o Lleida frecuentemente se consideraría normal en Londres o Lagos. La congestión surge cuando la

MODELOS

DE



TRANSPORTE

Tiempo de viaje “t”

intensidad de la demanda se aproxima a la capacidad de la instalación (calle, carretera, estación, etc.) y el tiempo requerido para utilizarla (viajar a través de ella) sobrepasa muy por encima la media establecida bajo condiciones de baja demanda. En el caso de la infraestructura de transporte, la inclusión de un vehículo adicional en el sistema genera un retraso suplementario a todos los demás usuarios, como puede verse, por ejemplo, en la figura 1.1. Obsérvese que la contribución de un vehículo adicional al retraso de todos los usuarios es mayor cuando la intensidad de flujo vehicular es más alta.

1

Figura 1.1.

1 Flujo V

La congestión y sus efectos externos.

Este efecto externo, motivado por el fenómeno de la congestión, es generalmente percibido por los demás usuarios pero no por el conductor que lo origina. Éste es el coste que se intenta internalizar mediante sistemas como la tarificación vial electrónica, con el objetivo de ayudar en la toma de decisiones individuales más razonadas.

1.2.3.

Equilibrio oferta y demanda

En términos generales, dado un sistema de transporte con una cierta capacidad de operación, la función de la planificación del transporte es asegurar la satisfacción de una cierta demanda D de movimiento de personas y mercancías con diferentes motivos de viaje, en distintos momentos del día, semana, mes y año, utilizando los distintos modos que lo conforman. El sistema de transporte se puede definir como la interacción de:



Introducción

1. Una infraestructura (p. ej., la red de transporte). 2. Un sistema de gestión (esto es, un conjunto de normas, como p. ej., conducir por la derecha y una serie de estrategias de control, como las señales de tráfico, etc.). 3. Un conjunto de modos de transporte y sus operadores. Considérense un conjunto de volúmenes de tráfico V sobre una red, a una velocidad S y con una capacidad de operación Q de acuerdo a un sistema de gestión M. En términos muy generales, la velocidad sobre la red puede ser representada como: S = f {Q,V,M}

(1.1)

La velocidad puede ser considerada como una primera aproximación de un indicador general del nivel de servicio (LOS) ofrecido por el sistema de transporte. En términos más generales, un LOS sería especificado como una combinación de varios efectos: velocidad o tiempo de viaje, tiempos de espera y caminata y precio; estos aspectos serán tratados en mayor detalle en los capítulos siguientes. El sistema de gestión M puede incluir esquemas de gestión del tráfico, control de áreas de tráfico y/o regulaciones aplicables a cada modo. La capacidad Q depende del sistema de gestión M y de los niveles de inversión I a lo largo del tiempo. De esta forma se puede escribir que: Q = f {I,M}

(1.2)

El sistema de gestión también puede ser utilizado para redistribuir la capacidad entre las diferentes infraestructuras de transporte, generando otra variable Q′ y/o dando prioridad a ciertos tipos de usuarios frente a otros, basándose en criterios de eficiencia (usuarios de transporte público, ciclistas), medioambientales (vehículos eléctricos) o de equidad (todos somos peatones alguna vez cada día). Como en el caso de la mayoría de los bienes y servicios, se espera que el nivel de demanda D dependa del nivel de servicio ofrecido por el sistema de transporte y también de la distribución de las actividades A en el espacio: D = f {S,A}

(1.3)

Para un sistema de actividades fijo resulta que combinando las ecuaciones (1.1) y (1.3) se debería encontrar un conjunto de puntos de equilibrio entre

MODELOS

DE



TRANSPORTE

la oferta y la demanda de transporte. Pero al variar el nivel de servicio en el espacio y en el tiempo, el sistema de actividades probablemente cambiará, determinando dos conjuntos diferentes de puntos de equilibrio: a corto y a largo plazo. El objetivo de la planificación del transporte es prever y gestionar la evolución en el tiempo de estos puntos de equilibrio de forma que se maximice el bienestar social. Por supuesto, ello no es una tarea fácil: la modelización de estos puntos de equilibrio debería ayudar a comprender mejor esta evolución y al mismo tiempo ayudar al planificador en el desarrollo e implementación de estrategias de gestión M y programas de inversión I. Algunas relaciones causa-efecto muy simples se pueden representar gráficamente para ayudar a comprender la naturaleza de algunos problemas de transporte. Un ejemplo típico es el círculo vicioso coche/transporte público que se muestra en la figura 1.2. El crecimiento económico trae como consecuencia, entre otros aspectos, un aumento en la compra de vehículos privados. Inicialmente, más coches significan, en general, que más personas desean transferirse del transporte público al coche, lo cual implica evidentemente menos pasajeros. A ello, los operadores pueden responder incrementando los precios de los billetes y/o reduciendo la frecuencia (el nivel del servicio) o ambos. En consecuencia, la situación descrita hace más atractiva la posesión y uso del coche privado, acelerando así el círculo vicioso. A medida que este proceso se Aumentos de renta Uso más atractivo del coche

Reducción de frecuencias en bus

Aumento posesión de coche

Disminución de la demanda de transporte público

Incrementos tarifarios

Más congestión y retrasos Menor número de km por autobús

Incremento de los costes de operación de los buses

Figura 1.2. El círculo vicioso del transporte público.



Introducción

repite cada año, los niveles de congestión aumentan, los autobuses se retrasan, sus frecuencias disminuyen y sus tarifas son cada vez más altas; se constata, por tanto, que la acumulación de decisiones individuales razonables, provoca un estado final peor para todos que el inicial. Esta sencilla representación también puede ayudar a identificar las posibles medidas a tomar para ralentizar e incluso, invertir, este círculo vicioso. Estas ideas se resumen en la figura 1.3. Por ejemplo, medidas estructurales (físicas) como el establecimiento de carriles bus y otras medidas de prioridad a buses son particularmente atractivas, ya que dan como resultado una asignación más eficiente del espacio vial. Por otro lado, las subvenciones al transporte público tienen sus detractores y sus defensores; pueden reducir la necesidad de subir los precios a corto plazo, pero tienden a generar grandes déficits y a proteger una gestión “pobre”, que es en parte consecuencia de su propia ineficacia. Este aspecto últimamente ha hecho que, en países en los que el transporte público se ejerce, por parte de empresas u operadores privados en base a concesiones (España, p. ej.), las licitaciones se realicen en función de lo que se denomina “Contratos de Gestión Interesada”, en los cuales se exige y vigila al empresario en el cumplimiento de ciertos estándares de calidad (puntualidad, frecuencias, comportamiento y atención al usuario, adaptabilidad de bus, edad del bus, etc.), de forma que sus Aumentos de renta Uso más atractivo del coche

ciones Restric ches c s a lo o

Aumento posesión de coche

Disminución de la demanda de transporte público cio en bv Su

Incrementos tarifarios

ne

s

Reducción de frecuencias en bus

Más congestión y retrasos Prioridad a buses

Menor número de km por autobús

Incremento de los costes de operación de los buses

Figura 1.3. Ruptura del círculo vicioso: vehículo privado-transporte público.

MODELOS

DE

TRANSPORTE



ingresos aumenten si dichos estándares se cumplen, penalizando a aquellos empresarios que no los cumplen. El tipo de modelo que subyace en las figuras 1.2 y 1.3 suele denominarse modelo estructural, tal y como se tratará en el Capítulo 12; se trata de representaciones sencillas pero poderosas, en particular, porque permiten la discusión de temas fundamentales de forma suficientemente parsimoniosa. Sin embargo, no están libres de peligros al ser aplicados en contextos diferentes. Por ejemplo, piénsese en este modelo del círculo vicioso en el contexto de un país en desarrollo. El crecimiento de la población mantendrá el incremento de la demanda de transporte público mucho más tiempo que en un país industrializado. De hecho, en algunos países los flujos de autobuses encontrados son enormemente altos, llegando a los 400-600 autobuses por hora por sentido en algunos corredores. El contexto también es relevante cuando se trata de buscar soluciones, así, se ha discutido que uno de los objetivos principales del establecimiento de carriles “sólo bus” en países en desarrollo no es tanto proteger a los autobuses de la congestión, como el de organizar el movimiento de los autobuses (Gibson et al., 1989). Los altos volúmenes de autobuses frecuentemente otorgan una prioridad de facto, y en estos casos, la interferencia entre autobuses puede llegar a ser un mayor factor de retraso que la congestión generada por los coches. Por lo tanto, habría que revisar el modelo del círculo vicioso expuesto anteriormente. Asimismo parece observarse una cierta concienciación debido a los problemas derivados de las fuertes emisiones de contaminantes que el tráfico produce, sobre todo en las ciudades. La alarma sobre la situación de la capa de Ozono y la preocupación mostrada en este sentido (Protocolo de Kyoto, etc.) por muchos países o por la misma Unión Europea, ha hecho que se comiencen a adoptar medidas para intentar paliar estos problemas. Así, la Cumbre de los Presidentes de los países miembros de la UE adoptó, el 9 de marzo del 2007, tres resoluciones importantes con horizonte el año 2020: la primera es el acuerdo de reducir las emisiones en un 20%; la segunda hace alusión a que el 20% de la energía utilizada provenga de fuentes renovables y la tercera establece que el 10% de los combustibles utilizados en el transporte público han de ser biocarburantes. De hecho, a iniciativa de la UE está surgiendo, además, toda una línea de trabajo dirigida hacia proyectos de investigación en los que se favorezca el uso de “modos alternativos de transporte” en ciudades, bajo el concepto de “movilidad sostenible”: uso de combustibles alternativos (bio-diésel, pilas de hidrógeno, vehículos híbridos), tanto para buses como para coches con



Introducción

importantes subvenciones públicas para los consumidores, fomento masivo (y en muchos casos, gratuito) de la bicicleta, programas de difusión y formación hacia la sostenibilidad, fomento de los carriles bicis y peatonales, carriles BUS-VAO (para buses y para coches altamente ocupados), establecimiento de peajes urbanos, etc. En definitiva, todo un conjunto de medidas disuasorias de la utilización del vehículo privado. Desgraciadamente, es imposible caracterizar todos los problemas de transporte de una forma sencilla, única y universal. Los problemas de transporte dependen del contexto, el cual no puede ignorarse a la hora de resolverlos. Los modelos pueden contribuir a lograr que la identificación de los problemas y la selección de la forma de resolverlos tenga una base más sólida.

1.3.

MODELOS Y PROCESO DECISIONAL

1.3.1.

Estilos de toma de decisiones

Antes de elegir un marco de modelización para un problema determinado, hay que identificar y definir el contexto relevante: país, gobierno o entidad determinada. También debe reconocerse que existen varios estilos de toma de decisiones en la práctica y que no todos ellos utilizan la modelización como herramienta básica. Dichos estilos se pueden caracterizar de muchas diferentes maneras: lo que se explica a continuación es una adaptación de un esquema realizado por Nutt (1981). 1.3.1.1.

Decisiones basadas en Planes Directores

Existe una larga tradición en desarrollar y aplicar este tipo de estrategia en el campo del transporte. También existe una amplia experiencia sobre el fracaso de este enfoque. Las decisiones se basan en interpretaciones del Plan Director que establecen las normas que controlan las contingencias, las expectativas de rendimiento y lo que se puede y no se puede hacer. Normalmente se prepara el Plan Director con muchísimo cuidado y atención al futuro, quizás utilizando un modelo de transporte estratégico de alto coste, del tipo utilizado en las décadas de los 60 y 70. Los Planes Directores pueden ser razonables cuando el contexto socioeconómico es estable y por ende los problemas son recurrentes. Tienen la ventaja de informar a todos de lo que se va a hacer y la gran desventaja de que casi nunca funcionan: los ambientes económicos, sociales y tecnológicos cambian

MODELOS

DE

TRANSPORTE



más rápido de lo que el plan puede adaptarse. Además, como la información nueva no encaja en el Plan Director, casi nunca se recoge o se utiliza para mejorar la toma de decisiones. Desgraciadamente, muchos países en proceso de desarrollo han tratado de adoptar este tipo de enfoque que es inapropiado para sus cambiantes condiciones. 1.3.1.2.

Teoría de la decisión normativa o racionalidad sustantiva

Éste es el enfoque racional para la toma de decisiones implícito en la mayoría de los libros de texto acerca de planificación de transporte. También se le conoce como “enfoque sistémico”. Aquí la cuantificación es esencial. El problema de decisión se considera bajo la perspectiva de elegir opciones entre un conjunto completo de alternativas y escenarios, con estimaciones acerca de su probabilidad de ocurrencia; la utilidad de cada alternativa se mide en términos de beneficios y costes y de otros criterios como la protección del medioambiente, seguridad, etcétera. En algunos casos es posible formular el problema de decisión en un marco de programación matemática. Esto requiere que la función objetivo sea conocida y especificada, y que lo mismo se aplique para las restricciones que definen el espacio de soluciones. Sin embargo, en la mayoría de los problemas reales resulta difícil cuantificar algunos elementos de la función objetivo o de las restricciones o convertirlos a unidades de medida comunes, como dinero o tiempo. También puede ser difícil incluir alguno de los elementos probabilísticos en cada caso pero se puede aprender bastante del problema durante el proceso. En este caso, la modelización es el elemento central. Algunos ejemplos del tipo de problemas asociados a la aplicación de la teoría de la decisión normativa son: 1. La acusación de falta de sensibilidad frente a las aspiraciones del público. 2. Sus elevados costes. 3. La aberración de quienes toman decisiones, que pueden no entender o aceptar un tratamiento analítico del problema. Además, este enfoque frecuentemente ha fracasado en lo que se refiere a producir resultados a tiempo y con una exactitud aceptable; hasta ver la adversa reacción a la modelización de transporte a gran escala durante los 80.

 1.3.1.3.

Introducción

Teoría conductual de la decisión

Éste es un intento de suavizar el enfoque de la teoría de la decisión normativa reconociendo que a menudo los que toman decisiones no buscan maximizar la utilidad sino solamente producir una solución satisfactoria (ver la discusión en el Capítulo 7). La búsqueda de “mejores soluciones” frecuentemente se detiene cuando se encuentra una que es aceptable; este enfoque combina búsqueda, aprendizaje y toma de decisiones, pero probablemente no logre generar soluciones que no constituyan más que mejoras marginales a la práctica actual. De hecho, este enfoque es parecido a un análisis marginal del problema de optimización empezando desde una solución no óptima; se buscan y se exploran mejoras menores pero aceptables con la esperanza de subir un escalón en el proceso. La modelización juega aquí un papel más restringido y puede ser del tipo más sencillo que se discute en el Capítulo 12. Los modelos de oferta y demanda marginales encajan muy bien en este enfoque. 1.3.1.4.

Toma de decisiones en grupo

Éste es un enfoque que se sigue en muchas áreas gobernadas por un comité. La toma de decisiones se convierte en un proceso de aprendizaje dentro de un grupo con autoridad para tomar decisiones y un objetivo específico. Los individuos contribuyen con su experiencia y conocimientos, y el grupo intenta aplicarlos al problema de decisión. En este enfoque se combina información cuantitativa y cualitativa, así como posibles previsiones; sin embargo, el proceso no se realiza de forma sistemática. Los puntos de vista de los miembros del grupo más persuasivos o poderosos pueden predominar más allá de su valor intrínseco. La participación en un grupo de este tipo a menudo ayuda a aceptar ciertas decisiones, lo cual es muy importante en un contexto de planificación. Algunas veces se crea un grupo directivo para guiar y aconsejar la implementación de ejercicios de modelización importantes. Tienen el potencial de dar buenos consejos acerca de lo que se incluye o no en la tarea de modelización y también pueden promocionar la aceptabilidad del plan resultante. 1.3.1.5.

Toma adaptativa de decisiones

Este enfoque es una versión más flexible de la toma de decisiones en grupo. Reconoce la interacción entre grupos de presión, que no tienen poder de decisión. Cada grupo ve el problema de una forma distinta, siendo necesarios la negociación y el compromiso para llegar a una solución decisional. Este enfoque

MODELOS

DE

TRANSPORTE



es útil si el problema contiene muchas variables e interacciones que no están bien definidas y si no existe una teoría normativa o de comportamiento que sugiera relaciones causa-efecto. El enfoque es bastante común en la toma de decisiones legislativas y diplomáticas, así como en muchos grupos de decisión, especialmente cuando la supervivencia pasa a ser el objetivo dominante. Dentro de este enfoque la modelización del transporte sólo juega un papel instrumental menor. Las recomendaciones de un determinado estudio se utilizan como argumentos en las negociaciones entre los grupos de presión, de forma casi independiente de su valor intrínseco. Pueden usarse las técnicas más modernas, no porque sean las más exactas o sensibles sino porque el mencionar que se han utilizado otorga mayor valor a los resultados del estudio y, por lo tanto, más poder a los que promocionaban su uso. 1.3.1.6.

Estrategias mixtas de toma de decisiones

Finalmente, a menudo es posible combinar muchos de los enfoques anteriores en una estrategia flexible. Esto es bastante común en estudios de transporte. Este tipo de estrategia reconoce que la forma en que se toman las decisiones puede ser tan importante como la acción elegida. El enfoque mixto utiliza el análisis, la persuasión, la negociación y las estrategias políticas en diferentes escenarios bajo diferentes objetivos. A veces, estos últimos se consideran fijos y conocidos pero mientras las negociaciones continúan puede ser necesario aumentarlos para incluir las preocupaciones de grupos en conflicto. Éste es un enfoque realista que acepta que en el caso de problemas importantes los objetivos y escenarios pueden variar como parte del proceso de toma de decisiones. Éste es el caso de, por ejemplo, los planes para hacer importantes mejoras en una red de carreteras o construir una autopista en una zona urbana; o la tarea de elegir la mejor ruta para un ferrocarril que una Londres con el Túnel de La Mancha; o el aumento de la capacidad de un aeropuerto que sirva a una gran conurbación. La modelización suele jugar un papel importante en este enfoque; el énfasis debería estar en la flexibilidad y en la capacidad de adaptación, la inclusión de nuevas variables y el análisis rápido de políticas y diseños innovadores.

1.3.2. Cómo escoger un enfoque de modelización Este libro supone que el estilo de decisión adoptado implica el uso de modelos, por ejemplo, estrategias de racionalidad sustantiva o mixtas, pero no pro-



Introducción

mueve un enfoque de toma de decisiones único (es decir, normativo). La aceptabilidad de la modelización o de un enfoque de modelización en particular, en el contexto de un estilo de decisión es muy importante. Los modelos que terminan siendo ignorados por quienes toman decisiones no solamente malgastan recursos sino que también producen analistas y planificadores desanimados. También se propone que cuando se especifica un enfoque analítico hay que tener en cuenta varias características de los problemas y modelos de transporte. 1. El contexto de la toma de decisiones. Implica adoptar una perspectiva particular y elegir el alcance o amplitud del sistema de interés. La elección de la perspectiva define el tipo de decisiones que se han de considerar: planificación estratégica, táctica (de gestión de transporte) o incluso soluciones a problemas específicos de operación. La elección del alcance implica especificar el nivel del análisis: ¿solamente se ha de incluir el transporte o también ha de implicarse la localización de actividades?; para diferentes niveles del sistema de transporte, ¿interesa solamente la demanda o también la oferta?; ¿ha de considerarse también la eficiencia del sistema o de los operadores de servicios, la minimización de los costes entre los operadores, etc.? También es crucial la cuestión de cuántas alternativas hay que tener en cuenta para satisfacer a los diferentes grupos de interés o para desarrollar el mejor plan; por lo tanto, el contexto en que se toman las decisiones también ayudará a definir los requerimientos de los modelos utilizados, las variables a ser incluidas en el modelo y las que se considerarán dadas o exógenas. 2. Exactitud deseada. Éste es resultado del punto anterior y está influenciado en gran manera por los dos puntos siguientes (3 y 4). Sin embargo, normalmente la exactitud deseada es justo la necesaria para discriminar entre una buena solución y otra menos buena. En algunos casos puede ser bastante obvio cuál es la mejor solución, necesitándose así una modelización menos precisa. Sin embargo, hay que recordar que en el pasado, se ha responsabilizado al sentido común de algunas decisiones de planificación de transporte muy pobres. 3. La disponibilidad de datos adecuados, su estabilidad y las dificultades asociadas a pronosticar sus valores futuros. En muchos casos puede que se disponga de muy pocos datos; en otros pueden existir razones para desconfiar de la información, o tener menos confianza en las predicciones a futuro de las variables clave de planificación, pues el sistema no es lo

MODELOS

DE

TRANSPORTE



suficientemente estable. Muchas veces los datos disponibles serán el factor clave en la decisión del enfoque de modelización. 4. Estado del arte en modelización para un tipo particular de intervención en el sistema de transporte. Esto, a su vez, puede dividirse en: a) Riqueza teórica. b) Facilidad del tratamiento matemático e informático. c) Disponibilidad de buenos algoritmos de solución. Debe considerarse que, en la práctica, todos los modelos suponen que algunas variables son exógenas. Además, muchas otras variables deben ser omitidas del marco de la modelización, ya sea porque no son relevantes para la tarea a realizar, demasiado difíciles de predecir o porque se espera que varíen poco y no influyan en el sistema de interés. Una consideración explícita de lo que se ha dejado fuera del modelo puede ayudar a la hora de decidir acerca de su idoneidad en relación a un determinado problema. 5. Recursos disponibles para el estudio. Éstos incluyen dinero, datos, equipos y software informático, habilidades técnicas, etc. Sin embargo, hay dos tipos de recursos que merecen una mención especial: el tiempo y el nivel de comunicación con los que toman las decisiones y con el público. El tiempo es probablemente lo más crucial: si hay poco tiempo disponible para elegir entre diferentes soluciones, será necesario tomar atajos para poder ofrecer asesoría en plazos adecuados. Los decisores suelen fijar escalas de tiempo absurdamente cortas para evaluar proyectos que tardarán años en procesarse a través de los múltiples niveles de decisión, años en implementarse y muchos más años en verificar si eran o no correctos. Por otra parte, un buen nivel de comunicación con quienes toman las decisiones y con los usuarios aliviará en parte el problema: surgirán menos expectativas irrealistas acerca de nuestra habilidad para modelizar con exactitud diferentes alternativas de transporte, además, una mejor comprensión de las ventajas y limitaciones de la modelización debería moderar los extremos de aceptación ciega o rechazo total a las recomendaciones del estudio. 6. Requisitos de procesamiento de datos. Este aspecto solía interpretarse como algo del tipo: ¿de qué tamaño es el ordenador que necesitas? La respuesta actual a esa pregunta es “no muy grande”, ya que un buen microordenador bastará en la gran mayoría de los casos. El verdadero “cuello de botella” en el procesamiento de datos es la habilidad humana para recoger, codificar e introducir los datos, activar los programas e interpretar



Introducción

los resultados. Cuanto mayor sea el nivel de detalle, más difíciles serán estas tareas. La recolección de datos ayudados por ordenador incluyendo edición gráfica de entradas y salidas reduce en parte este problema. Sin embargo, se necesita más progreso en estas materias para superar este cuello de botella. 7. Niveles de preparación y habilidad de los analistas. Normalmente los costes de entrenamiento son bastante altos; tanto que, a veces, es mejor usar un modelo existente y bien conocido antes que intentar adquirir y aprender el uso de un modelo ligeramente más avanzado. Por supuesto, ello podría parecer una receta para sofocar la innovación y el progreso; sin embargo, siempre sería posible dedicar tiempo a aprender sobre técnicas más modernas y eficaces sin rechazar la experiencia lograda con los modelos anteriores. Florian et al. (1988) formalizaron los contextos de la toma de decisiones utilizando un marco bidimensional: nivel de análisis y perspectiva. Los niveles de análisis pueden incluir seis grupos diferentes de procedimientos, cada uno de los cuales se centra en uno o más modelos y sus algoritmos específicos de solución. Éstos son: 1. Procedimientos de localización de actividades, L; 2. Procedimientos de demanda, D; 3. Procedimientos de rendimiento del sistema de transporte, P, que producen como salidas los niveles de servicio, el gasto económico y las capacidades prácticas, y dependen de los niveles de demanda y de las condiciones de oferta de transporte; 4. Procedimientos de intervenciones en la oferta, S, que determinan las acciones tomadas por los proveedores de servicios de transporte e infraestructura; éstas dependen de sus objetivos (maximización de beneficios, bienestar social), ambiente institucional, sus costes y una estimación de futuros estados del sistema; 5. Procedimientos de minimización de costes, CM; 6. Procedimiento de producción, PR. Los dos últimos tienen más que ver con los aspectos microeconómicos que afectan a los proveedores de la oferta (ya sean operadores o de infraestructuras) cuando eligen entre las combinaciones de insumos que minimizan sus costes.

MODELOS

DE

TRANSPORTE



La perspectiva de la dimensión del problema considera los seis niveles de procedimientos L, D, P, S, CM, PR y, además, tres perspectivas: una estratégica STR, una táctica TAC y una operativa OPE. Por supuesto, éstas se relacionan con los horizontes de planificación y los niveles de inversión; sin embargo, en este contexto, ellos deberían considerarse como conceptos genéricos asociados a la capacidad de: 1. Visualizar los niveles L, D, P, S, CM, PR en su importancia absoluta y relativa. 2. Elegir, a cualquier nivel, lo que puede ser considerado como fijo o variable. En la figura 1.4 se resume la forma en que se interrelacionan las diferentes perspectivas y niveles. Por supuesto el nivel más importante y agregado es el nivel estratégico; los análisis y las elecciones en este nivel tienen impactos que afectan a todo el sistema a largo plazo, y, en general, implican la adquisición de recursos y el diseño de redes. Los temas tácticos tienen una perspectiva más corta y puntual, y se trata de cuestiones tales como el mejor aprovechamiento de las instalaciones e infraestructura actuales. La perspectiva más estrecha, la operativa, trata de los problemas a corto plazo de los proveedores de servicios de transporte y queda fuera del alcance de este libro; sin embargo, las decisiones reales acerca de, por ejemplo, el nivel de servicio o el tamaño de vehículos, representan una entrada exógena importante en algunos de los modelos discutidos en este libro, y esto se muestra en la figura 1.4. Todo es, por supuesto, una forma relativamente abstracta e idealizada de visualizar los problemas de planificación de transporte. Sin embargo, ayuda a clarificar las elecciones que debe hacer el analista al desarrollar un enfoque de modelización de transporte. Este libro se centra principalmente en los problemas de planificación estratégica y táctica al nivel de los procedimientos de demanda y rendimiento del sistema de transporte. No obstante, algunos de los modelos discutidos a veces pueden ser útiles fuera de estos niveles y perspectivas.

1.4.

TÓPICOS EN MODELIZACIÓN DEL TRANSPORTE

Hasta aquí ya se han identificado las interacciones entre los problemas de transporte, los estilos de toma de decisiones y los enfoques de modelización. Ahora se discutirá acerca de algunos de los tópicos críticos de modelización que son relevantes para la elección de un modelo. Estos tópicos consi-



Introducción

Exógenos

Estratégica

Operacional

Endógenos

Táctica

Perspectivas de Planificación y Gestión

Localización de actividades L Demanda

D

Rendimiento

P

Alcance de este libro

Intervenciones en la oferta S Minimización de costes

CM

Producción

PR

Niveles sistema de transportes

Figura 1.4. El marco conceptual tridimensional.

deran algunos temas generales, como, por ejemplo, los roles de la teoría y los datos, la especificación y la calibración de modelos. Pero quizás, las elecciones más críticas son aquellas que sitúan al planificador entre el uso de enfoques de modelización agregados o desagregados, modelos de corte transversal o de series de tiempo y técnicas de preferencias reveladas o declaradas.

1.4.1.

Tópicos generales de modelización

Wilson (1974) proporciona una interesante lista de preguntas que deberían ser respondidas por cualquier aspirante a modelizador; ésta abarca desde aspectos generales como el propósito que hay detrás de construir el modelo, hasta aspectos más detallados como qué técnicas están disponibles para dicha construcción. A continuación se discuten algunos de estos temas, junto con otros que son especialmente relevantes para el desarrollo de este libro.

MODELOS

1.4.1.1.

DE

TRANSPORTE



Los roles de la teoría y los datos

Mucha gente tiende a asociar la palabra “teoría” a una serie sin fin de fórmulas y manipulaciones algebraicas. En el campo de la modelización del transporte urbano esta asociación ha sido bastante correcta: es difícil comprender y replicar las complejas interacciones entre seres humanos, que constituyen una característica inevitable de los sistemas de transporte. Algunos desarrollos teóricos que trataron de superar estas dificultades, han dado como resultado modelos a los que les faltaban tanto datos como software adecuados para su implementación práctica. Ello ha llevado a muchos profesionales a pensar que la brecha entre teoría y práctica es cada vez más amplia; y esto es algo que se ha intentado contrarrestar en este libro. Una consideración importante para juzgar la contribución de una nueva teoría es si ésta impone restricciones que tengan sentido a, por ejemplo, la forma de una función de demanda. Existe por lo menos un caso documentado sobre un estudio “práctico” de planificación de transporte, que duró varios años y costó varios millones de dólares, que dependía de modelos de demanda “pragmáticos” con una estructura errónea (algunas de sus elasticidades tenían el signo incorrecto; véase Williams y Senior, 1977). Aunque esto podría haber sido diagnosticado previamente por dichos profesionales pragmáticos si no hubieran despreciado la teoría, sólo fue descubierto a posteriori por los teóricos. Desgraciadamente (o quizás afortunadamente, diría un pragmático) a veces se pueden derivar formas funcionales similares de los modelos a partir de diferentes perspectivas teóricas (este tópico de equifinalidad se trata con más detalle en el Capítulo 8). Sin embargo, la interpretación de los resultados de un modelo depende en gran medida del marco teórico adoptado. Por ejemplo, la misma forma funcional del modelo gravitacional se puede derivar de una analogía con la física, de la maximización de la entropía y de la teoría de la maximización de la utilidad. La interpretación de los resultados, sin embargo, puede depender de la teoría adoptada. Si interesan solamente los flujos en los arcos de una red, podría ser irrelevante qué marco teórico subyace en la función analítica del modelo. Sin embargo, si se requiere una medida de evaluación, la situación cambia, ya que sólo sería de ayuda en este caso una teoría basada en el comportamiento del usuario bajo la perspectiva económica. En otros casos, se utilizarán frases como “la atracción de la zona de destino de viajes se incrementará…”, o “ésta es la forma más probable de organizar los viajes…”, o “la matriz de viajes más probable coincidente con nuestra información acerca del sistema…”; estas frases no ayudan a definir medidas de evaluación pero



Introducción

pueden ayudar a interpretar mejor la naturaleza de la solución encontrada. Asimismo, el marco teórico también otorgará cierta credibilidad al modelo al intentar pronosticar el comportamiento futuro. En este sentido es interesante reflexionar sobre la interacción entre la práctica y la teoría. Por ejemplo, se ha comprobado que los modelos o formas analíticas utilizadas en la práctica, tradicionalmente han influenciado las hipótesis utilizadas en el desarrollo de nuevos marcos teóricos. También se sabe que modelos ampliamente utilizados, como, por ejemplo, el logit múltiple, que será tratado en los Capítulos 6 y 7, han sido objeto de importantes racionalizaciones a posteriori: los avances teóricos son especialmente bienvenidos cuando fortalecen las prácticas habituales que pueden carecer de una lógica particularmente convincente (Williams y Ortúzar, 1982b).

Los dos estilos clásicos de enfoque para el desarrollo de teorías son el método deductivo (construir un modelo y probar sus predicciones frente a observaciones) y el método inductivo (en el que a partir de los datos se intentan inferir leyes generales). El enfoque deductivo se ha mostrado más productivo en el caso de las ciencias puras y el enfoque inductivo se ha preferido en el caso de las ciencias sociales analíticas. Es interesante hacer ver que los datos son un elemento central de ambos enfoques; de hecho, se sabe que la disponibilidad de datos normalmente deja poco margen para la negociación y el compromiso entre la relevancia y la complejidad de un modelo. Es más, en muchos casos la naturaleza de los datos restringe la elección del modelo a una única alternativa. El tema de los datos está estrechamente ligado a otros aspectos como, por ejemplo, el tipo de variables que se va a representar en el modelo y esto, por supuesto, también está ligado a aspectos teóricos. Los modelos predicen un cierto número de variables dependientes (o endógenas) dadas otras variables independientes (o explicativas). Para probar la bondad de un modelo normalmente se necesitarían datos acerca de cada variable. De interés particular son las variables de política, que son aquellas que se supone están bajo el control de quienes toman las decisiones, y esto es, las que el analista puede hacer variar para evaluar diferentes políticas o proyectos. Otro tema importante en este contexto es el de la agregación: • ¿Cuántos segmentos de la población o tipos de individuos son necesarios para obtener una buena representación o conocimiento del problema?

MODELOS

DE

TRANSPORTE



• ¿A qué nivel de detalle se deben medir ciertas variables para replicar un fenómeno dado? • El espacio es un elemento crucial en el transporte; ¿a qué nivel de detalle se debe codificar el origen y el destino de los viajeros para modelizar su comportamiento? 1.4.1.2.

Especificación de modelos

En su acepción más amplia e interesante, la especificación del modelo comprende los siguientes aspectos: • La estructura del Modelo. ¿Se puede replicar el sistema que se va a modelizar con una estructura sencilla que suponga, por ejemplo, que todas las alternativas son independientes? o ¿es necesario construir modelos más complejos que calculen, por ejemplo, las probabilidades de elección condicionales en elecciones anteriores? Modelos contemporáneos, como los que se discuten en los Capítulos del 7 al 9, normalmente contienen parámetros que representan aspectos de la estructura de los modelos, y las extensiones metodológicas logradas a mediados de los 80 han permitido la estimación de modelos cada vez más generales. Sin embargo, como ha señalado Daly (1982b), aunque podría suponerse hipotéticamente que, al fin y al cabo, todas las cuestiones acerca de la forma de los modelos podrían resolverse con pruebas empíricas, tal solución no es posible ni apropiada. • Forma Funcional. ¿Es posible utilizar formas lineales o el problema requiere funciones no lineales más complejas? Estas últimas pueden representar al sistema de interés con mayor exactitud, pero seguramente van a ser más exigentes en términos de recursos y técnicas de calibración y uso del modelo. Aunque las consideraciones teóricas pueden jugar un importante papel a la hora de solucionar esta cuestión, también es posible examinarla de forma inductiva mediante “simulaciones de laboratorio”, por ejemplo, mediante experimentos de intenciones/preferencias declaradas. • Especificación de variables. Éste es el significado más usual asociado al tema de especificación, y consiste en definir qué variables se deben utilizar y cómo (de qué forma) deberían entrar en un modelo determinado. Por ejemplo, si se supone que el ingreso de los usuarios influye en la elección modal individual, ¿cómo debería entrar esta variable en el modelo, como tal o deflactando a la variable coste? Los métodos para avanzar en esta cuestión van desde la utilización deductiva (constructiva) de la teoría



Introducción

hasta el análisis estadístico inductivo de los datos mediante transformaciones. 1.4.1.3.

Calibración, validación y uso de modelos

Un modelo puede representarse sencillamente como una función matemática de variables X y parámetros θ, tal que: Y = ƒ(X,θ)

(1.4)

Es interesante mencionar que los conceptos gemelos calibración de modelos y estimación de modelos han tomado tradicionalmente diferente significado en el campo del transporte. La calibración de un modelo requiere la selección de sus parámetros que se suponen con valor distinto de cero, con el objetivo de optimizar una o más medidas de bondad de ajuste que son función de los datos observados. Esta forma de proceder se ha atribuido a los físicos e ingenieros responsables de la primera generación de modelos de transporte, que no se preocupaban demasiado acerca de las propiedades estadísticas de estos índices; esto es, cuán grandes pueden ser los errores de calibración. La estimación implica encontrar los valores de los parámetros que hagan que los datos observados sean más probables bajo la especificación del modelo; en este caso puede resultar que uno o más parámetros no sean significativos y deban excluirse del modelo. La estimación también considera la posibilidad de examinar empíricamente ciertas cuestiones de especificación; por ejemplo, se pueden estimar parámetros estructurales y/o de forma funcional. Este procedimiento se ha asociado a los ingenieros y econometristas responsables de la segunda generación de modelos, quienes daban mucha importancia a la posibilidad de efectuar tests estadísticos ofrecida por estos métodos. Sin embargo, en esencia ambos procedimientos coinciden porque la forma de decidir cuáles son los mejores valores de los parámetros consiste en examinar algunos indicadores de bondad de ajuste previamente definidos. La diferencia está en que estas medidas normalmente tienen propiedades estadísticas bien conocidas que permiten construir intervalos de confianza alrededor de los valores estimados y las previsiones de los modelos. Ya que la gran mayoría de los modelos de transporte han sido construidos basándose en datos de corte transversal, ha existido una tendencia a interpretar la validación del modelo exclusivamente en términos de su bondad de ajuste al comportamiento observado. Aunque ésta es una condición necesaria para la validación del modelo, no es de ninguna manera suficiente; esto se ha demos-

MODELOS

DE



TRANSPORTE

trado en un número de casos en los que se ha podido comparar las predicciones del modelo con los resultados observados en estudios antes y después (véase la discusión en Williams y Ortúzar, 1982a). La validación del modelo requiere comparar sus predicciones con información que no haya sido utilizada durante el proceso de estimación. Naturalmente, esto implica un test más riguroso del modelo y requiere más información o más recursos. Una de las primeras tareas que enfrenta el modelizador es decidir cuáles son las variables que el modelo va a predecir y cuáles son los inputs o entradas necesarios a tal efecto. Algunas variables no se incluirán en absoluto, bien porque el modelizador no puede obtenerlas o bien porque la teoría subyacente al modelo no las contempla (véase la figura 1.5). Ello implica, inmediatamente, un cierto grado de error y de incertidumbre (se volverá sobre este tema en el Capítulo 3) que, obviamente, se complica aún más por otros errores que también son inherentes a la modelización; por ejemplo, los errores de muestreo y, todavía más importante, los errores debidos a las inevitables simplificaciones de la realidad que necesita el modelo para ser utilizado en la práctica (véase la figura 1.5).

Comportamiento individual

Elección

Respuesta

Factores que determinan la elección

Población

Medioambiente

Teoría del comportamiento

Atributos Cambio de política

Muestra Modelo

Simulación

Espacio del modelizador

Figura 1.5. Modelización y muestreo.

Previsión



Introducción

Por lo tanto, el uso principal de los modelos en la práctica es la predicción condicional: el modelo producirá estimaciones de las variables dependientes dado un conjunto de variables independientes. De hecho, las predicciones típicas vienen condicionadas de dos formas (Wilson, 1974): • En relación a los valores asignados a las variables de política en el plan y cuyo impacto es analizado en el modelo. • En relación a los valores supuestos para otras variables. Los modelos son normalmente utilizados para valorar una serie de planes alternativos para un rango de hipótesis factibles acerca de los valores futuros de las otras variables (p. ej., escenarios de ingreso). Ello significa que el modelo debe ejecutarse muchas veces en el contexto de evaluar un determinado problema. Por esta razón, puede ser de gran importancia que su especificación permita altas velocidades de procesamiento por ordenador; esto no es una tarea fácil en el caso de un modelo de transporte a gran escala, ya que implica procesos complejos de equilibrio entre oferta y demanda, como se discutirá en el Capítulo 11.

1.4.2. Modelización agregada y desagregada El nivel de agregación seleccionado para la medición de los datos es una cuestión importante en el diseño general de un estudio de planificación de transporte. Aunque un nivel mayor de detalle –con miras a un mayor grado de exactitud– debería mejorar la calidad de los modelos, probablemente incrementará los costes de recogida y análisis de datos así como de la mayoría de los restantes aspectos del ejercicio de la modelización. De interés central es la agregación de los datos exógenos, es decir, la información acerca de cuestiones diferentes al comportamiento de los viajeros, que se supone endógeno (es decir, el modelo intenta replicarlo). Por ejemplo, durante años se ha discutido si un ítem de datos representa el valor medio de un grupo de viajeros o si debería ser recogido específicamente para un individuo. Es inevitable un cierto grado de agregación cuando el modelo de interés procura representar el comportamiento de más de un individuo (p. ej., un seguimiento de mercado como los propietarios de coche de una determinada zona) como en el caso de los modelos agregados o de primera generación, que serán examinados en los Capítulos 5 y 6. Pero, cuando el modelo de interés intenta representar el comportamiento individual, como es el caso de los mo-

MODELOS

DE

TRANSPORTE



delos desagregados o de segunda generación examinados en los Capítulos 7 a 9, es lógico pensar que la información exógena pueda ser obtenida y utilizada separadamente para cada viajero. Una cuestión importante es entonces si, por razones de coste u otras, se debería preferir utilizar datos menos detallados (véase Daly y Ortúzar, 1990). La previsión de la demanda futura es un elemento crucial en la mayoría de los estudios de planificación del transporte. El ser capaz de predecir el uso más probable de nuevas infraestructuras es un precursor esencial para la toma de decisiones racional acerca de las ventajas o no de proveer tales infraestructuras. También puede ser importante tener alguna idea acerca de la sensibilidad de la demanda respecto a variables importantes que estén bajo control del analista (p. ej., la tarifa que se cobra por su uso). En la mayoría de los casos las previsiones y los estudios de sensibilidad deben proporcionarse a nivel agregado, es decir, deben representar el comportamiento del total de la población de interés. Por lo tanto, con el fin de obtener estos indicadores el analista que utiliza modelos desagregados tiene que encontrar un método robusto para agregar los resultados del modelo. Los modelos de la primera generación se solían utilizar casi sin excepción en los estudios de transporte hasta finales de los 70; llegaron a hacerse familiares, necesitaban relativamente pocas habilidades por parte del analista (pero sí algún conocimiento de informática básica) y tenían la propiedad de ofrecer una “receta” para todo el proceso de modelización completo, desde la recolección de datos hasta la predicción de flujos en los enlaces de una red. Los resultados de estos modelos, quizás porque eran generados por complicados programas de ordenador, a menudo se consideraban más exactos de lo que se pretendía; por ejemplo, predecir giros a izquierda de vehículos a 15 años vista. Los modelos de la primera generación han sido criticados severamente (a veces con justificación) por su inflexibilidad, inexactitud y coste. Desgraciadamente, muchos enfoques de la segunda generación, habiendo adoptado un tratamiento sofisticado de las elecciones y restricciones enfrentadas por los viajeros individuales, han fallado al momento de realizar previsiones, a veces porque requerían datos que no podían ser estimados de forma razonable. Los modelos desagregados, que llegaron a ser muy populares en los 80, ofrecen sustanciales ventajas sobre los métodos tradicionales y también son de utilidad práctica en múltiples aplicaciones. Sin embargo, un problema práctico importante es que requieren un alto nivel de conocimiento y “habilidades” estadísticas y econométricas (especialmente en la interpretación de los



Introducción

resultados), y definitivamente mucho mayor que en el caso de los modelos agregados. Además, se ha exagerado la diferencia entre los modelos de primera y segunda generación. Por ejemplo, los modelos desagregados fueron inicialmente promocionados como radicalmente diferentes a los métodos clásicos, una “revolución” en este campo del conocimiento. Sin embargo, bastante más tarde quedó claro que era más adecuado considerarlos una “evolución” desde un punto de vista de modelización (véase Williams y Ortúzar, 1982b). De hecho, en muchos casos, existe una equivalencia completa en la forma de pronosticar (Daly, 1982a). La diferencia esencial está en el tratamiento de la descripción del comportamiento, en particular durante el proceso de desarrollo del modelo; en muchos casos, el enfoque desagregado es claramente superior al conjunto de comportamientos individuales por zonas y estratos predefinidos de la población. Los intentos de clarificar el tema de en qué circunstancias sería preferible utilizar un enfoque agregado o desagregado, han llegado a la conclusión de que no existe un enfoque más adecuado para todas las situaciones planteadas (véase Daly y Ortúzar, 1990). Estos intentos también han concluido que se requiere una serie de directrices para ayudar a los profesionales desesperados a elegir la herramienta de modelización más apropiada para un contexto determinado. En este libro se ha intentado dar respuesta a esta cuestión.

1.4.3.

Datos de corte transversal y series temporales

Hasta finales de los 80 la gran mayoría de los estudios de planificación de transporte dependían de información acerca de los patrones de viaje obtenidos a partir de una muestra representativa de individuos tomada en un único momento fijo en el tiempo (sección transversal). De hecho, el uso del enfoque de muestreo mostró las diferencias entre las dos generaciones de modelos anteriormente descritos. Una hipótesis fundamental del enfoque de sección transversal es que se puede encontrar una medida de la respuesta a variaciones incrementales simplemente calculando las derivadas de una función de demanda respecto a las variables de política de interés. Ello hace explícita la hipótesis de que una relación causa-efecto realista puede deducirse de los parámetros de un modelo estimado con observaciones correspondientes a un determinado momento temporal. Esto sería razonable siempre que hubiese suficientes personas que cambiasen sus elecciones, por ejemplo, respecto a destinos o modo, en ambas

MODELOS

DE

TRANSPORTE



direcciones y si, además, no existiesen variaciones debidas al hábito o los efectos de desfases temporales. Sin embargo, la hipótesis de sección transversal tiene dos desventajas potencialmente serias. En primer lugar, una muestra representativa puede corresponder a una “historia” particular de cambios en los valores de ciertas variables clave que influyen en la elección. Por ejemplo, cambios en el tiempo, en el modo o en la localización, pueden haber sido provocados por una serie de estímulos diferentes (precio del combustible, cambios en el ciclo de vida, etc.) y el grado en el que el sistema puede ser considerado en desequilibrio (p. ej., debido a la inercia) va a depender de ellos. El problema es que se puede demostrar (véase el Capítulo 7) que la respuesta de grupos con exactamente las mismas características actuales, pero que han pasado por un proceso de cambios diferente, puede ser totalmente distinta. En segundo lugar, los datos correspondientes a un solo período temporal, normalmente no permiten discriminar entre formulaciones alternativas de un modelo, ni siquiera si éstas derivan de hipótesis teóricas completamente diferentes. Siempre es posible encontrar parámetros que produzcan el mejor ajuste a los datos del año base incluso si el modelo tiene severos problemas de especificación; el problema es, por supuesto, que estos parámetros no garantizan buenas propiedades de respuesta ante situaciones futuras. Como se vio en la sección 1.4.1, el hecho de que un modelo reproduzca bien la situación del año base no es una condición de validación suficiente. Por lo tanto, en general, cuando se utilizan datos de sección transversal no es posible distinguir entre la amplia variedad de fuentes posibles de dispersión presentes en un conjunto de datos (es decir, dispersión de preferencias, efectos de hábito, restricciones, etc.). Un progreso real en la comprensión y valoración de la efectividad de un modelo predictivo sólo puede obtenerse si existe información disponible sobre respuestas en el tiempo. Desde un punto de vista teórico, también es deseable diseñar un marco apropiado de análisis que permita el eventual rechazo de hipótesis relacionadas con la respuesta a cambios. Mientras que esto no se logre, seguirán existiendo dudas sobre la validez de los estudios realizados con datos de sección transversal. La discusión anterior ha llevado a que muchas personas consideren que para construir modelos predictivos más fiables, siempre que sea posible deberían usarse datos longitudinales o series temporales. Este tipo de datos, por definición, incorpora información sobre la respuesta del sistema frente a variaciones en la situación actual. Por lo tanto, en principio puede proveer los instrumentos



Introducción

necesarios para testear directamente y quizás también refutar hipótesis relativas a la respuesta a cambios. Los datos longitudinales pueden tomar la forma de paneles o, más sencillamente, de información antes y después. Desgraciadamente, los modelos construidos a partir de este tipo de datos también presentan serios problemas técnicos; de hecho, hasta finales de los 90 el progreso en este campo había sido bastante limitado. En los Capítulos 3 y 7 se discutirán algunos de los temas relacionados con la recogida y uso de este tipo de información.

1.4.4.

Preferencias Reveladas y Declaradas

Puede ser bastante complicado desarrollar modelos aceptables y robustos si el analista no puede diseñar experimentos que permitan observar el comportamiento del sistema bajo un amplio rango de condiciones. En el sector transporte las experimentaciones de este tipo no son ni prácticas ni viables y el analista, como el astrónomo, se encuentra obligado a hacer observaciones sobre situaciones y elecciones que no puede controlar. Hasta mediados de los 80 era casi axiomático que la modelización de la demanda de transporte se basara en información acerca de elecciones y decisiones observadas, es decir, de datos de preferencias reveladas. Dentro de este enfoque, la evaluación de proyectos requiere que la política de intervención sea expresada en términos de variaciones en los atributos que se consideran influyentes en los comportamientos actuales. Sin embargo, tiene limitaciones prácticas básicamente asociadas a los costes de la muestra y a la dificultad de distinguir los efectos de atributos que no sean fáciles de observar, por ejemplo, aquellos relacionados con conceptos como calidad o conveniencia. Otro problema práctico tradicional ha sido cómo tratar “alternativas nuevas”, dónde se requiere pronosticar el comportamiento de una instalación que no está disponible en la actualidad y qué puede ser radicalmente diferente de las existentes. Las técnicas de preferencias/intenciones declaradas, provenientes del campo de los estudios de mercado surgieron a finales de los 70 como un instrumento para realizar experimentos con elecciones relacionadas con sistemas de transporte, y por tanto para resolver algunos de los problemas anteriormente descritos. Las técnicas de preferencias declaradas basan la estimación de la demanda en un análisis de las respuestas a elecciones hipotéticas; éstas naturalmente, pueden comprender una gama de atributos y condiciones mayor que las del sistema real. Sin embargo, estas técnicas se desacreditaron en sus

MODELOS

DE

TRANSPORTE



comienzos porque no se sabía cómo descontar el excesivo entusiasmo de ciertos encuestados; por ejemplo, ni siquiera la mitad de los individuos que declaraban que tomarían un curso de acción determinado, realmente lo hacían cuando eventualmente tenían la oportunidad. Esta situación tardó una década en cambiar pero, a finales de los 80, los métodos de preferencias declaradas llegaron a ser percibidos por muchos como una oportunidad real de solucionar las dificultades anteriormente mencionadas. Además, se ha encontrado que, en ciertos casos, los métodos y datos de preferencias declaradas y reveladas se pueden utilizar de forma complementaria, evidenciando y combinando las ventajas de ambos enfoques. En particular, se considera que ofrecen una herramienta invaluable para ayudar a la modelización de alternativas completamente nuevas. En el Capítulo 3 se examinan los aspectos relativos a la recogida de datos en los métodos de preferencias declaradas, y en el capítulo 8 se examinan cuestiones referentes a su modelización.

1.5.

ESTRUCTURA DEL MODELO CLÁSICO DE TRANSPORTE

Años de experimentación y desarrollo han dado como resultado la definición de una estructura general de modelización denominada modelo clásico de transporte. Esta estructura es, en efecto, el resultado de la práctica en los 60, pero ha permanecido relativamente inalterada a pesar de las importantes mejoras experimentadas en las técnicas de modelización durante los últimos 40 años. La forma general del modelo puede verse en la figura 1.6. El enfoque comienza considerando una zonificación y un sistema de redes así como la recogida y codificación de datos de planificación, calibración y validación. Estos datos deberían incluir información para el año base sobre la población de diferentes tipos en cada zona del estudio así como niveles de actividad económica, incluyendo empleo, espacio dedicado a la actividad comercial, instalaciones de educación y recreativas. A continuación estos datos se utilizan como variables independientes de la función de demanda, para estimar modelos que reproduzcan el número total de viajes atraídos y generados (variable dependiente) por cada zona del área de estudio (generación de viajes). El paso siguiente es asignar estos viajes a diferentes destinos, en otras palabras, su distribución en el espacio, dando lugar a una matriz de viajes origen-destino (O-D). La etapa siguiente consiste en modelizar la elección del modo, y esto tiene como resultado el reparto o distribución modal, es decir, la asignación de los viajes de la matriz O-D según los diferentes modos de transporte. Finalmente, la última etapa del



Introducción

Zonificación

Datos años base

Datos futuros de Planificación

Base de datos: Año base Futuro

iteraciones

Generación

Distribución Reparto modal

Asignación a la red Evaluación

Figura 1.6.

El modelo clásico de transporte de cuatro etapas.

modelo clásico consiste en la asignación de los viajes en cada modo a su red correspondiente: típicamente de transporte público o de transporte privado. El modelo clásico se presenta como una secuencia de cuatro etapas o submodelos: generación de viajes, distribución, reparto modal y asignación. Actualmente se reconoce que las decisiones de viaje no se toman realmente siguiendo este tipo de secuencia; una visión contemporánea es que el posicionamiento de cada submodelo depende de la forma de la función de utilidad asumida para explicar todas estas elecciones de viaje (véase Williams, 1977). Más aún, se critica que el modelo de cuatro etapas concentra la atención en sólo un espectro limitado de las decisiones que pueden adoptar los usuarios. La tendencia actual requiere analizar una gama más amplia de respuestas a los problemas y proyectos de transporte. Por ejemplo, ante una situación de congestión creciente, un viajero puede responder con una serie de cambios simples en: • El recorrido seguido, para evitar la congestión o aprovechar nuevos enlaces; esto incluye la elección de aparcamiento o una combinación de servicios en el caso de transporte público.

MODELOS

• • • •

DE

TRANSPORTE



El modo utilizado para llegar al destino. La hora de salida para evitar los momentos más congestionados. El destino del viaje hacia una zona menos congestionada. La frecuencia de los viajes, haciéndolos otro día, o quizás combinándolos con otras actividades.

Además, a más largo plazo pueden tener lugar otras respuestas más complejas, por ejemplo, cambio de lugar de empleo, de localización residencial, de áreas comerciales, etc.; todos estos aspectos son sensibles, al menos en parte, a cambios en la accesibilidad del sistema de transporte. A pesar de estos comentarios, el modelo secuencial de cuatro etapas constituye un punto de referencia respecto a métodos alternativos. Por ejemplo, algunos de los enfoques actuales intentan tratar de forma simultánea la elección de frecuencia de viaje (viajes por semana), destino y modo de viaje en un modelo único que colapsa estas tres etapas. Otros enfoques ponen el énfasis en el papel de las actividades familiares y en las elecciones de viaje que ellas originan; conceptos como circuitos, presupuestos de tiempo y dinero se utilizan en este contexto para modelizar las decisiones y restricciones de viaje. Estas estrategias de modelización son más difíciles de plantear en términos de los cuatro submodelos o decisiones anteriormente descritas. Hasta el momento, estos nuevos enfoques han jugado un papel más bien de investigación y su uso operativo parece aún lejano. Sin embargo, estos modelos basados en las actividades permiten una mejor comprensión del comportamiento respecto a viajes y probablemente en el futuro mejoren los enfoques de modelización más convencionales. La secuencia generación-distribución-elección modal-asignación es la más común pero no es la única posible. Por ejemplo, algunos estudios en el pasado han situado la elección modal antes que la distribución e inmediatamente después de (o junto con) la generación de viajes. Esto permite dar un mayor énfasis a las variables decisionales que dependen de la unidad que genera el viaje, quizás el hogar. Sin embargo, situar la elección modal antes de que se conozca la distribución dificulta la inclusión en el modelo de los atributos del viaje y del modo y le resta relevancia en términos de análisis de políticas al modelo de reparto modal. Quizás un mejor enfoque sería tratar simultáneamente la distribución y elección del modo, tal y como se discute en el Capítulo 6. Obsérvese también que el modelo clásico considera a la generación de viajes como inelástica, es decir, es independiente del nivel de servicio proporcionado por el sistema de transporte. Probablemente, ello no es demasiado realista pero



Introducción

solamente en los últimos años se han desarrollado técnicas que pueden tener en cuenta estos efectos de forma sistemática. Una vez calibrado y validado el modelo según las condiciones del año base es cuando puede ser aplicado a uno o más horizontes de planificación. Para hacer esto se deben plantear escenarios y planes que describan las características relevantes del sistema de transporte y las variables de planificación en situaciones futuras. La elaboración de escenarios realistas y consistentes no es tarea fácil, ya que es muy sencillo caer en la trampa de construir alternativas futuras que no sean financieramente factibles ni realistas en cuanto al probable desarrollo de los usos del suelo y de las actividades en la zona de estudio. A pesar de estas dificultades, establecer escenarios es aún más un arte que una técnica y requiere mucha experiencia ingenieril combinada con un sólido juicio político; desgraciadamente, éstos son recursos escasos que no suelen encontrarse al mismo tiempo en los equipos de planificación. Una vez definidos un conjunto de escenarios y planes realistas para su verificación, se activa nuevamente la misma secuencia de modelos para simular sus prestaciones. A continuación se realiza una comparación entre los costes y beneficios de los diferentes proyectos bajo diferentes escenarios, con el objetivo final de elegir el programa de inversión más rentable y la política de transporte más adecuada que satisfaga la demanda por desplazamientos en la zona de estudio. Una cuestión importante en el modelo clásico de cuatro etapas es la necesidad de verificar la utilización consistente de las variables que influyen sobre la demanda. Por ejemplo, al final de la fase de asignación de tráfico se obtendrán nuevos niveles de flujo y, por lo tanto, nuevos tiempos de viaje que, probablemente, no sean los mismos tiempos de viaje supuestos al estimar la distribución de viajes y elección de modo. Por ello parecería necesario volver a ejecutar los modelos de distribución y elección modal basándose en los nuevos tiempos de viaje deducidos de la asignación, recalcular las nuevas matrices modales y utilizarlas para la aplicación, también de nuevo, del modelo de asignación y así sucesivamente. Desafortunadamente, en general este proceso iterativo ingenioso, no conduce a un conjunto estable de modelos de distribución, elección modal y asignación con tiempos de viaje consistentes. En el Capítulo 11 se tratará este problema en detalle; su particular importancia está en el riesgo de elegir un plan equivocado dependiendo solamente del número de iteraciones que se esté dispuesto a realizar.

MODELOS

1.6.

DE



TRANSPORTE

PLANIFICACIÓN CONTINUA DEL TRANSPORTE

Por sí mismos los modelos de planificación de transporte no solucionan los problemas del transporte. Para que sean útiles deben ser utilizados dentro de un proceso decisorio adaptado al leal estilo de toma de decisiones elegido. El modelo clásico de transporte fue desarrollado originalmente como un enfoque normativo idealizado para la toma de decisiones. Su papel en la planificación del transporte puede ser descrito como una contribución a las fases clave de un proceso decisional de tipo “racional”, como puede verse en la figura 1.7: 1. Formulación del problema. Un problema puede definirse como una discrepancia entre lo que se espera y la realidad percibida. La definición formal de un problema de transporte requiere fijar objetivos, estándares y restricciones. Los primeros reflejan los valores implícitos en el proceso decisional, es decir, la definición de un estado ideal pero posible de conseguir en una situación futura. Los estándares sirven para confrontar, en un Formulación del problema

Recolección de datos Construcción analítica del modelo y calibración Generación de soluciones a testear

Previsión de las variables de planificación Test del modelo y Solución

Evaluación de soluciones y recomendación de la mejor Implementación de la solución

Figura 1.7. Un marco para la toma de decisiones racional utilizando modelos.



2.

3.

4.

5.

6.

Introducción

momento dado, si se están alcanzando las prestaciones mínimas a diferentes niveles de interés. Por ejemplo, el hecho de que muchas intersecciones semaforizadas en una ciudad operen a un grado de saturación del 90% es una indicación de red sobrecargada. Las restricciones pueden ser de muchos tipos, financieras, geográficas, temporales, técnicas, o simplemente que existan algunas áreas o tipos de edificios que deberían ser salvaguardados en los nuevos proyectos. Recogida de datos sobre la situación actual del sistema para apoyar el desarrollo del modelo analítico. Evidentemente, la recogida de datos no es independiente del desarrollo del modelo, ya que éste define el tipo de datos necesarios: la recogida de los datos y el desarrollo del modelo están estrechamente relacionados. Construcción de un modelo analítico del sistema de interés. Las herramientas proporcionadas en este libro pueden ser utilizadas para construir modelos de transporte que incluyan procesos para la demanda y para las prestaciones del sistema desde un punto de vista táctico y estratégico. Por lo general, el objetivo consiste en seleccionar el enfoque de modelización más simple que permita elegir entre diferentes proyectos de forma consistente. La construcción de un modelo analítico implica su especificación, su estimación o calibración de parámetros y la validación de sus prestaciones con datos no utilizados durante su calibración. Generación de soluciones para ser verificadas. Esto puede lograrse de varias formas, desde aprovechar la experiencia y creatividad de los planificadores de transporte y grupos interesados, hasta la construcción de modelos de diseño a gran escala con la ayuda de técnicas de optimización, por ejemplo. Ello puede implicar la introducción de métodos de minimización de oferta y costes, que quedan fuera del alcance de este libro. Para verificar las soluciones provenientes de los proyectos propuestos en el epígrafe anterior, es necesario predecir los valores futuros de las variables de planificación, las cuales han de utilizarse como entradas o inputs del modelo. Ello requiere la preparación de descripciones cuantitativas precisas o escenarios, acerca del ordenamiento futuro de la zona de interés, normalmente utilizando predicciones que provengan de otros sectores y/o unidades de planificación. Este aspecto será tratado en el Capítulo 13. Verificación del modelo y de las soluciones. El rendimiento del modelo debe ser verificado, para así confirmar su razonabilidad, bajo diferentes escenarios de planificación; también se utiliza el modelo para simular dife-

MODELOS

DE

TRANSPORTE



rentes soluciones y estimar sus resultados en términos de un conjunto de indicadores idóneos, coherentes con los objetivos identificados y con la definición del problema mencionado anteriormente. 7. Evaluación de soluciones y recomendaciones de un plan de estrategia y/o política. Esta fase considera la valoración de estrategias de acción alternativas en términos operativos, económicos, financieros y sociales en base a los indicadores obtenidos del modelo. Esto requiere una combinación de habilidades que van desde el análisis económico hasta el juicio político. 8. Implementación de soluciones y búsqueda de nuevos problemas a afrontar. Esta fase requiere la reutilización del procedimiento descrito en estos pasos comenzando de nuevo por el punto 1. Aunque se basa en conceptos propios del enfoque de teoría de decisiones normativas, este marco de referencia puede ser utilizado también dentro de estilos correspondientes a la teoría del comportamiento, con el objetivo de formular planes generales o simplemente para generar argumentos en las licitaciones asociadas a la toma de decisiones adoptada. Supone, de forma implícita, que el problema puede ser especificado por completo, que las restricciones y el espacio de soluciones pueden ser definidas y que la función objetivo puede ser identificada aunque no necesariamente cuantificada completamente. Sin embargo, uno de los principales aspectos que este libro trata de destacar es que los sistemas reales de transporte no siguen las restricciones anteriormente descritas: a menudo es difícil definir las funciones objetivo así como sus restricciones. Además, si bien uno puede hacerse la ilusión de que, acotando un problema de transporte, se puede ser capaz de resolverlo, desgraciadamente los problemas de transporte tienen la “costumbre” de reaparecer en lugares distintos y bajo formas diferentes; al mismo tiempo que aumenta el conocimiento propio del sistema de transporte se incorporan nuevos aspectos y perspectivas; los cambios en los factores externos y en las variables de planificación sacan de su curso a los planes muy detallados. Un proceso decisional normativo bien estructurado pero fijo puede ser apto para problemas sencillos, bien definidos y restringidos, pero difícilmente resulta apropiado para tratar los problemas de transporte que son más ricos, complejos, multidimensionales y multifacéticos. ¿Cómo se puede mejorar este enfoque general para afrontar un mundo en permanente mutación? Parece esencial reconocer que el futuro es mucho más cambiante de lo que nos harían creer nuestros modelos predictivos. Si



Introducción

éste es el caso, los planes estratégicos deberían ser revisados a intervalos de tiempo regulares y las estrategias de decisión deberían ser apoyadas mediante la inclusión de información “al día”, recogida regularmente, para verificar la evolución del proceso y corregir su curso cuando sea necesario. En este sentido, los procedimientos decisionales, adaptativos o mixtos, aparecen como más flexibles y apropiados a las características de los problemas relacionados con el transporte. Éstos reconocen la necesidad de redefinir constantemente los problemas, escenarios y objetivos a medida que los entendemos mejor, identificamos nuevas estrategias de solución, respondemos a cambios políticos y tecnológicos y mejoramos nuestras capacidades de modelización mediante entrenamiento, investigación y experiencia. La introducción de una función de seguimiento es un añadido importante al esquema de la figura 1.7. Un sistema de monitoreo no se restringe a la recogida de datos regular; también debería facilitar todas las demás etapas en el marco de toma de decisiones, tal y como se señala en la figura 1.8. El sistema Formulación del problema Recolección de datos

Generación de soluciones a testear

Previsión de las variables de planificación Test del modelo y Solución

Función de seguimiento

Construcción analítica del modelo y calibración

Evaluación de soluciones y recomendación de la mejor Implementación de la solución

Figura 1.8. Planificación y seguimiento con la ayuda de los modelos.

MODELOS

DE

TRANSPORTE



de seguimiento tiene dos funciones principales: en primer lugar, debería proporcionar datos para identificar cuándo el sistema de transporte y las variables exógenas clave, como población y crecimiento económico, se alejan de su comportamiento estimado. En segundo lugar, los datos recogidos deberían ser útiles para continuar validando y mejorando el enfoque de modelización utilizado en la preparación de los planes. Un buen sistema de seguimiento también debería facilitar el aprendizaje del equipo de planificación y proporcionar ideas acerca de cómo mejorar y modificar los modelos. En este sentido, la ocurrencia de problemas serios en el sistema de transporte, como, por ejemplo, huelgas de transporte público, escasez temporal de combustible o grandes obras viales que temporalmente cambien la estructura de la red y sus características, deberían constituir una importante fuente de información acerca del comportamiento del sistema que puede ser contrastado con las previsiones del modelo. Estos experimentos no planificados, deberían permitir que los analistas verificaran y mejoraran sus modelos. Un sistema de seguimiento encaja muy bien con la idea de un enfoque de planificación de transporte regular o continua. Por lo tanto, si no existe un sistema de seguimiento, éste debería establecerse como parte de cualquier estudio de planificación de transporte. El seguimiento de las prestaciones (rendimiento) de un sistema y planes de transporte es una función tan importante que merece influir en la elección de los modelos de transporte a utilizar para apoyar la planificación y la toma de decisiones. En particular, el uso de modelos que puedan ser reutilizados y actualizados usando datos de bajo coste y relativamente fáciles de obtener, parecen particularmente apropiados para esta tarea. No obstante, como se verá en los capítulos siguientes, estos modelos más simples no pueden considerar toda la riqueza de comportamiento de enfoque más detallados. Sin embargo, existe la posibilidad de combinar las dos técnicas, aplicando las herramientas con mayor resolución a las partes más críticas del problema y utilizando las más gruesas y sencillas que son más fáciles de actualizar para seguir el proceso e identificar dónde y cuándo hace falta un esfuerzo de modelización más detallado. Se han hecho intentos por identificar el potencial de compromisos de este tipo en el resto de este libro. La adopción de una función de seguimiento permite establecer un proceso de planificación continua que contrasta con el enfoque convencional en el que se gastan recursos considerables durante un período de uno o dos años para realizar un estudio de transporte a gran escala. Este intenso esfuerzo puntual



Introducción

puede ser seguido por un período mucho más largo de esfuerzos limitados en la planificación y puesta al día de los planes. Así, rápidamente los informes y planes estratégicos quedan obsoletos o sencillamente se olvidan, y en la unidad de planificación no queda nadie capaz de activar los modelos nuevamente. Luego, puede que algunos años más tarde se emprenda un nuevo gran esfuerzo de planificación y modelización y el ciclo se repite. Este estilo de planificación derrocha recursos, no motiva ni el aprendizaje ni la adaptación como habilidades de planificación y aliena a los analistas de los problemas reales. Este enfoque es especialmente doloroso en países en vías de desarrollo: no tienen recursos que desperdiciar y los rápidos cambios socio-económicos que los caracterizan aceleran el proceso de obsolescencia de planes y datos. En el Capítulo 12 se plantea el uso de modelos más sencillos y fáciles de actualizar para ayudar a la implantación de una función de seguimiento robusta pero de bajo coste.

1.7.

SOBRE LA TEORÍA VERSUS LA PRÁCTICA

Uno de los temas recurrentes en la práctica de la modelización del transporte es la distancia y, algunos dirían, desconfianza que existe entre los investigadores que desarrollan las teorías detrás de los modelos y los profesionales que los aplican en la práctica. Los profesionales a menudo hacen referencia a la necesidad de elegir entre un conjunto de modelos teóricamente sólidos pero difíciles de implementar y un enfoque de modelización más pragmático que refleje las limitaciones en cuanto a datos, tiempo y recursos disponibles para un estudio. La sugerencia es que el método “pragmático” puede producir las respuestas necesarias dentro del período de tiempo disponible para el estudio, aunque se deban tomar atajos para realizarlo. Los autores de este libro no tienen nada en contra de los enfoques pragmáticos siempre y cuando proporcionen las respuestas necesarias para tomar decisiones correctas. No hay razón para utilizar modelos sofisticados y caros (pero presumiblemente más sólidos desde el punto de vista teórico) sólo con el objetivo de adquirir mejor prestigio dentro de la comunidad académica. Sin embargo, existen varias razones para preferir un modelo teóricamente robusto, por ejemplo: 1. Garantiza resultados estables. Las recomendaciones que emanan de un estudio no deberían depender del número de iteraciones del modelo. Pres-

MODELOS

2.

3.

4.

5.

DE

TRANSPORTE



cripciones como “partir siempre de los costes de flujo libre” o “iterar solamente dos veces”, no son razones suficientes para suponer un resultado estable: la vez siguiente alguien podría sugerir hacer dos iteraciones más o utilizar, justificadamente, un punto de partida diferente pero ello no debería ser suficiente para justificar un cambio en la recomendación, a favor o en contra, de un determinado proyecto. Garantiza la coherencia. Hay que tener precaución en no utilizar un modelo particular de elección en una parte de un sistema y otro diferente en otra parte. A veces los modelos pragmáticos no superan este test. La consistencia del modelo es necesaria para superar el test de “razonabilidad” así como el juicio público. Proporciona confianza en las predicciones. Casi siempre es posible ajustar un modelo a una situación existente. Sin embargo, hay muchos ejemplos de modelos con buen ajuste que no tienen demasiado sentido, quizás porque están basados en variables correlacionadas. En este sentido, variables que están correlacionadas hoy puede que no lo estén mañana; por ejemplo, una fuerte correlación entre la producción de plátanos y la tasa de motorización en un país determinado, puede desaparecer si se descubre petróleo allí. Por lo tanto, los modelos deberían apoyarse en alguna teoría de comportamiento del viajero con la finalidad de poder interpretarlos correctamente y tener alguna confianza en que seguirán siendo válidos en el futuro. Permite comprender las propiedades del modelo y desarrollar mejores algoritmos para su solución. Cuando se está en posición de plantear un problema en términos de programación matemática o de maximización de la verosimilitud, por citar dos enfoques populares para generar modelos, se dispone de una variedad de herramientas técnicas que ayudan a desarrollar buenos algoritmos de solución. Éstos han sido mejorados con el paso de los años por investigadores trabajando en muchos campos además del de transporte. Facilita la comprensión de lo que se puede suponer constante y lo que se debe aceptar como variable, en un contexto particular de decisión y un cierto nivel de análisis. Un aspecto clave en la modelización económica es la identificación de variables exógenas y endógenas, y aquellas que se pueden suponer que permanecerán constantes. Por ejemplo, en algunos estudios de planificación táctica a corto plazo, tal y como sucede en muchos esquemas de gestión de tráfico, puede ser razonable suponer una matriz



Introducción

de viajes fija. Sin embargo, esta suposición podría no ser válida, incluso a corto plazo, si las políticas de interés implicasen variaciones significativas en el precio o en la accesibilidad. Por otra parte, los profesionales a menudo han renunciado al esfuerzo de utilizar modelos teóricamente mejores, por varias razones, entre otras: 1. Son demasiados complejos. Esto implica que enfoques heurísticos, reglas empíricas y procedimientos ad hoc son más fáciles de entender y, por lo tanto, preferibles. Éste es un argumento razonable; aquí no se propone usar modelos del tipo “caja negra” sino todo lo contrario. Los resultados de un modelo necesitan ser interpretados y esto sólo puede conseguirse si existe un nivel de comprensión razonable de las bases sobre las que el modelo está construido. Sin ignorar la importancia del papel de la literatura académica en avanzar el “estado del arte”, existe la necesidad de contar con un mayor número de publicaciones que expliquen las bases de los modelos sin recurrir a notaciones difíciles o a conceptos oscuros para el profesional. La mayoría de los modelos no son tan complicados, aunque algunas de las implantaciones estadísticas e informáticas que se necesitan pueden ser bastante sofisticadas. Buenas publicaciones, que tiendan a disminuir la brecha entre profesionales y académicos, son una urgente necesidad. 2. Requieren datos que no están disponibles o que son costosos de obtener. Esta afirmación no siempre es correcta; muchos modelos avanzados aprovechan mejor los datos correspondientes a muestras pequeñas de lo que lo hacen algunos de los enfoques más pragmáticos. Las mejoras en los métodos de recogida de datos también han reducido estos costes y mejorado la precisión de la información. 3. Es mejor trabajar con matrices “reales” que con modelos del comportamiento de los usuarios. Esto equivale a decir que es mejor trabajar con matrices de viaje fijas, incluso si hay que expandirlas al horizonte de planificación considerado. Se verá, no obstante, que los errores de muestreo y otros errores asociados a la recogida de datos ponen en duda la precisión de esas matrices “reales”; es más, es imposible que reaccionen frente a la mayoría de las políticas (p. ej., mejoras en la accesibilidad, nuevos servicios, variaciones de precios) ni son razonables bajo condiciones futuras de sobresaturación en escenarios del tipo “hacer lo mínimo”. Solamente el usar observaciones puede conducir a tomar decisiones “obtusas”, a tener una falsa sensación de precisión y a subestimar el potencial de cambio.

MODELOS

DE

TRANSPORTE



4. Los modelos teóricos no se pueden calibrar al nivel de detalle necesario para el análisis de algunos proyectos. Esta afirmación tiene algo de cierto, por lo menos en algunos casos en los que las limitaciones de los datos y el tiempo disponibles, requieren negociar el nivel de detalle requerido si se desea utilizar un modelo mejor. Sin embargo, puede ser preferible equivocarse de esta forma antes que trabajar con la ilusión de tener un nivel de detalle suficiente, pero encontrarse debilitados por resultados potencialmente patológicos (previsiones con errores de signo o de sentido) o inelásticos, producto de procedimientos ad hoc. 5. Es mejor utilizar el mismo modelo (o software) para la mayor parte de los problemas porque esto asegura la consistencia de los métodos de evaluación. En principio esta afirmación es correcta, siempre que el modelo siga siendo apropiado para estos problemas. Tiene la ventaja de ser un método consistente, fácil de usar e interpretar y con costes de formación reducidos. Sin embargo, esta estrategia falla cuando los problemas no son de la misma naturaleza. Hipótesis acerca de matrices de viaje fijas o insensibles a la elección del modo o a políticas de tarificación, pueden ser razonables en algunos casos pero difíciles de aceptar en otros. El uso del mismo modelo con las mismas hipótesis puede ser apropiado en un caso y completamente desorientador en otro. La importancia de estos criterios depende, naturalmente, del contexto decisional y del nivel de análisis implícito en el estudio. En este libro se recomienda utilizar el nivel de resolución apropiado para cada problema de interés. Los autores consideran que, siempre que sea posible, es preferible utilizar modelos buenos y sólidos incluso si hubiera que sacrificar cierto nivel de detalle. Debe, por tanto, encontrarse para cada caso particular y para cada contexto decisional, el mejor equilibrio entre coherencia teórica y conveniencia práctica. Este libro se esfuerza en proveer el material necesario para ayudar al lector en esta elección.

2. Prerrequisitos matemáticos

2.1.

E

INTRODUCCIÓN

ste libro va dirigido a profesionales y estudiantes en el campo de la modelización y planificación de transporte. Algunos de estos lectores dispondrán de un conocimiento matemático sólido al respecto y pueden saltarse este capítulo sin pérdida de continuidad. Otros lectores poseerán una base de conocimiento más endeble o desearán refrescar sus ideas y conceptos. Este capítulo está dirigido a estos últimos lectores. Todo ello bajo la perspectiva de perfilar los requisitos previos matemáticos más importantes necesitados para una mejor comprensión de esta obra. Cabe destacar que los requisitos matemáticos aquí expuestos no son, en ningún modo, demasiado exigentes y que el lector puede resolver la comprensión de lo que sigue, con conocimientos de álgebra y cálculo modestos. Primeramente se introduce la idea del concepto de función así como su notación especial utilizada para, entre otros aspectos, poder diseñar e interpretar dichas funciones (en coordenadas cartesianas ortogonales). Después de introducir el concepto de series, se trata un tema fundamental, tal cual es el álgebra matricial; esto es particularmente importante en el transporte ya que a menudo se trabaja con matrices de viajes, de varianza-covarianza, etc. Posteriormente se tratan elementos de cálculo integral y diferencial. Merecen cierta atención las funciones logarítmicas y exponenciales pues con frecuencia nos las encontramos en los modelos de transporte. Del mismo modo, es usual tener que analizar máximos y mínimos de funciones en el desarrollo de modelos y en la generación de algoritmos de solución. Finalmente, se presentan algunos conceptos elementales de estadística en la última sección de este capítulo ya que su tratamiento interviene también en una parte importante de las técnicas de modelización. A parte de ello, se introducirán otros conceptos estadísticos en capítulos posteriores, en la medida que sea necesario.



Prerrequisitos matemáticos

Las referencias bibliográficas a este respecto son muy abundantes tanto para el lector informado como para lectores que necesiten una cierta puesta a punto. Es recomendable revisar los trabajos realizados por Morley (1972), Stone (1966) y Wilson y Kirby (1980). Por otro lado, se puede comprobar que el futuro de la práctica de la modelización del transporte se basará cada vez menos en el uso de modelos simples y rápidos e irá adoptando modelos que tengan un fuerte soporte teórico. Esta tendencia es el resultado de la necesidad de proporcionar, en muchos casos, soluciones y consejos consistentes para los que toman las decisiones de planificación; estos consejos no deben depender, por ejemplo, de un número arbitrariamente elegido de iteraciones o de un punto de partida particular, ni de modelos que probablemente producirían resultados erróneos cuando se intenta pronosticar nuevas opciones. Por tanto, el rigor que demanda la modelización del transporte dependerá del planteamiento de mejores representaciones matemáticas y estadísticas de los problemas a analizar, lo cual implica inevitablemente lecturas adicionales en estas áreas.

2.2. ÁLGEBRA Y FUNCIONES 2.2.1.

Introducción

El álgebra elemental consiste en construir expresiones utilizando las cuatro operaciones básicas de la matemática ordinaria que relacionan letras las cuales representan números determinados. Es útil distinguir entre las variables (generalmente denotadas por x, y, z), que representan medidas cuantitativas y constantes o parámetros (generalmente denotados por letras como a,b,c,…, k,m,n,…, o por letras del alfabeto griego). El valor de una constante se supone que permanece invariante para una situación particular determinada. Variables y constantes, están relacionadas a través de ecuaciones como: y = a + bx

(2.1)

y si estuviéramos interesados en la variable x, podemos obtenerla despejándola de la ecuación (2.1), así: x = (y – a) / b

(2.2)

Las variables x e y en (2.1) y (2.2) están relacionadas por el signo “=”. Sin embargo, en el álgebra también pueden aparecer desigualdades de los siguientes tipos:

MODELOS

DE



TRANSPORTE

> significa mayor que < significa menor que ≤ significa menor o igual que ≥ significa mayor o igual que y que se utilizan para restringir variables, como por ejemplo: x + 2y ≤ 5

(2.3)

Esta expresión (inecuación), no puede ser resuelta para x e y, sin embargo, denota que ambas variables pueden tomar sólo un rango restringido de valores. Por ejemplo, si se establece que sus valores han de ser enteros y positivos, puede verse fácilmente que x no puede ser mayor que 3 y que y no puede ser mayor que 2. Las inecuaciones se pueden manipular de la misma forma que se hace con las ecuaciones, es decir: • Se puede sumar a ambos lados de la inecuación la misma cantidad y el resultado no varía. Lo mismo sucede con la resta. • Se puede multiplicar o dividir cada lado por la misma cantidad sin variar la inecuación pero, si el número por el que está multiplicándose o dividiéndose fuera negativo, la desigualdad se invertiría. Por ejemplo, si se resta 5 en ambos lados de (2.3) resulta: x + 2y – 5 < 0 que es ciertamente la misma restricción. Sin embargo, si se multiplica por –2 a ambos lados, lo que queda es: –2x – 4y ≥ –10 El lector puede verificar que esta inecuación proporciona la misma restricción y el mismo resultado que la (2.3). El uso de letras para denotar variables sólo es conveniente desde un cierto punto de vista. Pronto aparecerá la necesidad de utilizar índices (subíndices o superíndices) para definir variables adicionales, como, por ejemplo, x1, x2 , x3,…, xn, que pueden ser resumidas así: xi, i = 1,2,…,n; y carece de importancia si se utiliza otra letra para el índice si tiene el mismo rango numérico. Por ejemplo, se podría definir también de esta manera: xk, k = 1,2,…,n.



Prerrequisitos matemáticos

La utilización de índices facilita una muy conveniente notación para las sumas y productos: in

¤x

i

 x1 x2 x3 ... xn

(2.4)

i 1

o bien: m

”y

j

 y1 y2 y3 ... ym

(2.5)

j 1

En ciertos casos no es suficiente un solo índice, pudiendo entonces utilizarse dos o más. Por ejemplo, se podrían definir las seis variables siguientes, T11, T12 , T21, T22 , T31, T32 como Tij, i = 1,2,3, y j =1,2. Con variables de dos subíndices se pueden establecer dobles sumas o dobles productos, como en: 3

2

3

¤ ¤ Tij ¤ (Ti1 Ti 2 )  T11 T12 T21 T22 T31 T32 i 1 j 1

(2.6)

i 1

2.2.2. Funciones y gráficas Hasta aquí se ha hecho referencia a cómo están relacionadas las variables mediante igualdades y desigualdades; en general éstas pueden denominarse relaciones funcionales. Por otra parte, una función particular consiste en algún tipo específico de relación entre dos o más variables. Por ejemplo, la función de poder: y = ϕxn

(2.7)

en la que los valores de la variable dependiente y vienen dados por los valores de los parámetros ϕ y n, y de los de la variable independiente x; una función requiere que, para cada valor de x en algún rango, se especifique un valor correspondiente de la variable y. A menudo no deseamos referirnos a una función particular, sino sólo señalar que y es “algún tipo de función de x” o viceversa; esto puede escribirse como: y = f (x)

(2.8)

Existe un gran abanico de funciones de diferentes tipos y formas y consecuentemente, los lectores deben familiarizarse con ellas. Es conveniente,

MODELOS

DE



TRANSPORTE

y x3 x2

x

2

x x1/2

1

1

x

x

x3

Figura 2.1. Gráficas de funciones de poder.

normalmente, graficar las funciones en un sistema de coordenadas Cartesianas (ver Figura 2.1). Una variable dependiente puede ser una función de varias variables independientes, por ejemplo: y = f (x1, x2 ,…, xn)

(2.9)

pero se requieren n + 1 dimensiones para proceder a su representación gráfica (n para las variables independientes y 1 para la variable dependiente). Las coordenadas cartesianas se pueden utilizar para tres o más dimensiones; en el caso de tres dimensiones, el tercer eje, en la figura 2.1, saldría del papel hacia fuera. Más de tres dimensiones no pueden visualizarse físicamente, sin embargo, su tratamiento algebraico es semejante que en el caso de una, dos o tres dimensiones. Por ejemplo, en el caso de n = 2 la función puede representar una superficie que, evidentemente, se sale del plano conformado por las dimensiones (x1,x2). Generalmente, cualquier ecuación puede ser representada de la forma f(x) = 0 por ejemplo, la ecuación lineal: ax = b es equivalente a la ecuación ax – b = 0



Prerrequisitos matemáticos

en que f(x) = ax – b. Resolver esta ecuación es equivalente a encontrar los puntos en los que la curva y = f(x) intersecciona con el eje x. Estos puntos se denominan soluciones reales o ceros de la ecuación f(x); son, por ejemplo, los puntos (0,x1) y (0,x2) de la figura 2.2. También puede estarse interesado en ver qué sucede con el valor de la función f(x), cuando x tiende a infinito (x → ∞). Fácilmente puede comprobarse que las posibilidades son las siguientes: • f (x) tiende a infinito cuando x → ∞ [p. ej., en la función f(x) = x2]. • f (x) tiende a menos infinito cuando x → ∞ [p. ej., en la función f(x) = –x]. • f (x) oscila entre más infinito y menos infinito, cuando x → ∞ [p. ej., en la función f(x) = (–1)x x2]. • f (x) tiene límite finito cuando x → ∞ [p. ej., en la función f(x) = 1 + 1 / x]. y

y = f(x)

x1

Figura 2.2.

x2

x

Soluciones reales a una función genérica.

Para funciones más complejas también podría intentar calcularse si el límite de f(x) cuando x → ∞ tiene un valor finito o no. También se podría estar interesado en conocer el límite cuando x se aproxima a un valor finito. Por ejemplo, para la función y = f(x) = 1 / (x + 3), podría comprobarse fácilmente que su límite cuando x → 0, es 1/3. En general si existe un valor α tal que si x → α resulta que f(x) → ∞, entonces la recta de ecuación x = α es una asíntota de la función y = f(x) (ver Figura 2.3).

MODELOS

DE



TRANSPORTE

y

y = f(x)

α

x

Figura 2.3. Función genérica con asíntota en x = α.

Una de las funciones más importantes es la línea recta (ver Figura 2.4), cuya ecuación general es la especificada en (2.1), toma el valor a cuando x = 0 y se denomina normalmente intercepto de la función con el eje y. La constante a se denomina pendiente de la función, cuyo valor fácilmente se demuestra que es: y 2 – y1 a = x2 – x1 (2.10) donde (x1, y1) y (x2, y2) son dos puntos cualesquiera de la recta (ver Figura 2.4a). Aunque una línea recta tiene por definición su pendiente (gradiente) constante, ésta puede ser positiva o negativa (Figura 2.4b). y = ax+b

y

y1

y

Q

y2

b

P

P

y = ax+b b (a)

Figura 2.4.

x1

x2

x

(b)

x

Representaciones de la recta y = ax + b con pendiente positiva (a) y con pendiente negativa (b).



Prerrequisitos matemáticos

Dos rectas no paralelas se cortan siempre en un punto (ver Figura 2.5) que se calcula resolviendo el sistema de ecuaciones como en el ejemplo siguiente: y=x+2

(2.11a)

y = –x + 4

(2.11b)

Despejando x en (2.11b) y sustituyéndolo en (2.11a), resulta el punto solución de coordenadas (x = 1, y = 3). y

y=x+2

4 3 2

y = –x + 4

1 –2

–1

0

1

2

3

4

x

Figura 2.5. Intersección de dos líneas rectas.

2.2.3.

Sumas de series

Una serie se define simplemente como una secuencia de números un, n = 1,2,…, N. En muchos casos puede ser interesante encontrar su suma:

S N  u1 u2 ... u N  ¤ un

(2.12)

n

Una serie muy conocida es la progresión aritmética en que cada término se obtiene del anterior añadiéndole un número d. un = un–1 + d

(2.13)

Se puede deducir fácilmente que la suma de N términos de una progresión aritmética en la que el primer término es b, viene dada por la siguiente expresión:

MODELOS

DE



TRANSPORTE

S N  Nb

N ( N 1)d 2

(2.14)

Otra serie muy común es la denominada progresión geométrica (2.15) en que cada término se obtiene del anterior multiplicándole por un factor fijo r (razón de la progresión geométrica). Si el primer término es b, la suma finita de N términos viene dada por la expresión (2.16). un = run–1

SN 

b(1 r n ) 1 r

(2.15) (2.16)

En el caso de la serie (progresión aritmética) representada por un = n, la suma finita de N términos es:

SN 

N ( N 1) 2

Y en el caso de una progresión geométrica cuyos términos vienen representados por la expresión un = xn, la suma finita, también de N términos es:

SN 

x(1 x N ) para x ≠ 1 (1 x)

Pero cuando N → ∞, la suma de la serie anterior tiende también a infinito. Lo mismo sucede para la serie un = n; y para la serie un = xn si x > 1; sin embargo, para esta misma serie, si 0 < x < 1, su suma es finita y su expresión es:

SN 

2.3. 2.3.1.

x 1 x

ÁLGEBRA MATRICIAL Introducción

Cualquier variable con dos subíndices puede denominarse matriz. Aquí se expresan las matrices por la notación B = {Bij}, donde las variables Bij, tal que



Prerrequisitos matemáticos

i = 1,2,…, N; y tal que j = 1,2,…, M son los elementos de la matriz B. Por tanto, puede escribirse que:

¥ B11 ¦ B21  B ¦ ¦M ¦ § BN 1

B12 B22 BN 2

B13 L B1M ´ µ B23 L B2 M µ µ µ BN 3 L BNM ¶

(2.17)

Como puede verse, la matriz B tiene N filas y M columnas; por esta razón se la denomina matriz de N × M. Un vector es un caso especial e importante de matriz. Sería una matriz N × 1 denominada matriz columna (otros autores utilizan también las matrices fila). En aquel caso, el segundo índice es redundante, y su representación matricial es {Vi}, es decir:

¥ V1 ´ ¦ µ ¦ V2 µ V  [Vi ]  ¦ V3 µ ¦ µ ¦M µ ¦ VN µ § ¶

(2.18)

Formalmente, una variable sin índices, o incluso una constante, puede considerarse como una matriz de 1 × 1 y se la conoce como un escalar. Intercambiando filas (N) y columnas (M) de la matriz inicial B, se obtiene la matriz traspuesta BT de B, dada por

¥ B11 ¦ B12 BT  ¦ ¦M ¦ § B1M

B21 B22 B2 M

B31 L BN 1 ´ µ B32 L BN 2 µ µ µ B3 M L BNM ¶

(2.19)

De la misma manera para un vector “columna” (N × 1)su traspuesta sería un vector “fila” (1 × N), así: VT = [V1,V2,V3,… V N]

(2.20)

MODELOS

DE



TRANSPORTE

Una matriz cuadrada S es una matriz B tal que el número de filas es el mismo que el de columnas (N = M); una matriz cuadrada es simétrica si S = ST. Una matriz diagonal D = {Dij} es aquella en la que i ≠ j → Dij = 0 es decir, todos los elementos de la matriz son cero excepto el o los de la diagonal principal (i=j). La matriz unidad o Matriz Unitaria (I) es una matriz diagonal cuadrada con todos los elementos = 1, es decir:

¥ 1 0 L0 ´ ¦ µ 0 1 L0 µ I¦ ¦M µ ¦ µ § 0 0 L1 ¶

(2.21)

2.3.2. Operaciones básicas en el Álgebra Matricial Dadas dos matrices A y B, la matriz C representará las diferentes combinaciones que a continuación se van a establecer. Véase primero la suma de matrices: C=A+B=B+A

(2.22)

Los elementos de la matriz C se definen así: Cij = Aij + Bij. Por ello se requiere que ambas matrices tengan la misma dimensión, así: N × M. Lo mismo sucede con la diferencia de matrices: C=A–B

(2.23)

Además, para multiplicar un escalar por una matriz, se multiplican todos los elementos de la matriz por dicho escalar, es decir, Cij = kAij: C = kA

(2.24)

Multiplicar dos matrices es algo más complejo: C = AB

(2.25)

Para ello se define el elemento de la matriz producto C ij como: Cij = Ʃk Aik Bkj, donde A es una matriz N × M y B es otra matriz cualquiera M × L (es decir, el número de columnas de A es el mismo que el de filas de B). En este caso, la matriz producto C es de dimensión N × L.



Prerrequisitos matemáticos

Es fácil de comprobar que, en general, AB no es igual a BA, es decir, el producto de matrices no es conmutativo, como sin embargo ocurre en el álgebra elemental. Pero éste no es el caso de la multiplicación de dos matrices en el que una de ellas es la matriz unitaria I. Es fácil verificar que: IA = AI = A

(2.26)

Así, para definir en general el producto de cualquier número de matrices, el orden siempre debe respetarse. De hecho, se especifica la pre-multiplicación de A por B para formar el producto BA, y la postmultiplicación para formar AB. Para definir la división es conveniente utilizar el concepto de matriz inversa. Desafortunadamente, ello sólo es posible para matrices cuadradas y no siempre. Si la matriz inversa existe se denotará por B -1 y es la matriz que satisface: B -1B = BB -1 = I

(2.27)

En este caso la matriz B es no-singular. Se proporcionará un procedimiento para el cálculo de los elementos de la matriz inversa que, como podrá comprobarse, es bastante complicado. Es suficiente saber que bajo las condiciones convenientes, dicha matriz existe. La división es entonces simplemente pre o postmultiplicación por B -1. En este libro se utiliza la notación matricial para representar sintéticamente los sistemas de ecuaciones así como para obtener su solución, para lo cual se necesita obtener la matriz inversa.

2.4.

ELEMENTOS DE CÁLCULO

Las dos ramas principales de cálculo son la diferenciación y la integración; su naturaleza básica puede identificarse intuitivamente por referencia a la función y = f(x) dibujada en la figura 2.6. Considere los puntos P y Q y el segmento por ellos definido. La diferenciación se ocupa en el cálculo de la pendiente de una curva en un punto. Para ello, es útil considerar Q próximo a P; en el límite el segmento PQ llega a ser la tangente a la curva en P = Q (es decir, cuando la “distancia” horizontal h es 0) y por definición su pendiente es igual a la pendiente de la curva en ese punto. La integración, por otro lado, se ocupa de calcular el área bajo una curva considerada, tal cual es el área sombreada en la figura 2.6; como más adelante puede observarse, ambos conceptos están estrechamente relacionados.



MODELOS

DE

TRANSPORTE

2.4.1.

Diferenciación

Utilizando la ecuación (2.10), la pendiente (gradiente) del segmento PQ en la figura 2.6 puede escribirse como: δ(x) = [ f(x0 + h) – f(x0)] / h Si el límite de δ(x) cuando h → 0 existe y es el mismo si h tiende a cero desde ambos lados del punto considerado, entonces a este límite se le denomina derivada de la función y o f(x) con respecto a x en xo y usualmente se escribe como f '(x0) o dy / dx en xo. El proceso de encontrar la derivada se denomina diferenciación. Si f(x) viene dada como una función de x, normalmente no es difícil calcular f '(x) como otra función de x. La tabla 2.1 proporciona las derivadas de las funciones más usuales. A partir de aquí, también se pueden definir las derivadas de segundo orden, tercero y en general derivadas de orden superior (p. ej., f 0"(x) o d 2 x / dx2 d 2y / dx2 y así sucesivamente). Por ejemplo, si se diferencia la derivada primera de la función y = xb en la tabla 2.1, resulta:

d2 y  b( b 1) x b 2 dx2

(2.28)

y y = f(x)

Q

f(x0 + h) f(x0)

P

x0

x0 + h

x

Figura 2.6. Gradiente en un punto y área bajo una curva.



Prerrequisitos matemáticos

Tabla 2.1.

Derivadas más comunes Función f(x)

Derivada f '(x)

K

(k constante)

0

xb

(b constante, x > 0)

bxb–1

ku(x)

(k constante)

ku'(x)

u(x) + v(x)

u'(x) + v'(x)

u(x)v(x)

u '(x)v(x) + u(x)v'(x)

u[v(x)]

u'[v(x)]v'(x)

2.4.2.

Integración

Ésta es la operación inversa de la diferenciación; si se conoce la pendiente de una curva en cada punto de ella, entonces a la ecuación de la propia curva se la denomina integral. Por ejemplo, si g = g(x) es la ecuación de la pendiente, la ecuación de la curva es:

y  ° g ( x)dx x

y este resultado depende siempre de una constante arbitraria aditiva; por ejemplo, si g = bxb–1 (ver Tabla 2.1), la integral indefinida de g(x) viene dada por:

y  G ( x)  ° bx b 1dx  x b C

(2.29)

x

donde C es la constante arbitraria de integración (es decir la derivada de xb + C es bxb–1 sin importar el valor de C). El uso elemental más práctico de la integración es obtener el área bajo una curva como una integral definida, tal y como se muestra en la figura 2.7a. b

b

b

Área abcd  ; F ( x) =a  F (b) F ( a )  °a ydx  °a f ( x) dx

(2.30)

Por ejemplo, si se toma el caso simple de una línea recta paralela al eje x, de ecuación y = f(x) = h y se quiere proceder a su integración entre los valores a y b (ver Figura 2.7b), resulta: F(x) = hx + C

MODELOS

DE



TRANSPORTE

y

y y = f(x)

c d

c

a

b

d

a

(a)

x

b

(b)

x

Figura 2.7. Áreas bajo curvas: (a) caso general, (b) recta paralela al eje x.

y por tanto: Área = F(b) – F(a) = h(b – a) que es, de hecho, el área del rectángulo sombreado en la figura 2.7(b). Como ejemplo, pueden utilizarse las derivadas de la tabla 2.1 para calcular sus integrales indefinidas; en particular, si:

° u ( x)dx  U ( x) C

1

y

° v( x)dx  V ( x) C

2

entonces:

° u ;v( x)= v '( x)dx  U ;v( x)= C

3

y

° U ( x)v( x)dx  U ( x)V ( x) ° u ( x)V ( x)dx Evidentemente no todas las funciones, ni siquiera algunas que pueden parecer simples, tienen integrales indefinidas que sean expresiones simples también. Sin embargo, como se verá más adelante, pueden calcularse las integrales definidas de forma numérica.



Prerrequisitos matemáticos

2.4.3.

Funciones logarítmicas y exponenciales

La integral de la función y = f(x) = 1 / x (Figura 2.8) se ha definido como el logaritmo natural de x, o loge(x), donde e es la constante de Nepper. Su valor es aproximadamente 2,7183 y corresponde a los puntos del eje x, (1,0) y (e,0) de la figura 2.8, tal que el área sombreada entre ellos y la curva es 1, es decir, loge(e) = 1. Como en este libro sólo se utilizan logaritmos naturales, se prescinde de la notación subíndice e en lo sucesivo. y

1,0

0,5

0

y = 1/x

0

0,5

1,0

1,5

2,0

2,5 e 3,0

x

Figura 2.8. Función inversa de x y constante de Nepper.

Como otras funciones logaritmo, el log (x) tiene las siguientes propiedades: log (1) = 0 lim log (t) → ∞ t→∞ lim log (t) → –∞ t→0 log (uv) = log (u) + log (v) Otra función muy utilizada es la función exponencial exp (x) o ex, definida como el número w tal que log (w) = x, y como se sabe: e(x + y) = ex e y

MODELOS

DE



TRANSPORTE

Por otro lado:

elog(x) = x

Ambas funciones log (x) y exp (x) son fáciles de diferenciar; por definición:

d 1 log ( x)  dx x

(2.31)

Y por tanto no es difícil de demostrar que:

d x (e )  e x dx

(2.32)

Es decir, la función exp (x) permanece inalterada ante la diferenciación.

2.4.4.

Máximos y mínimos de funciones

Una de las más importantes utilizaciones de la diferenciación es calcular máximos y mínimos de funciones. Considérese el ejemplo de la figura 2.9; la función representada tiene un máximo en el punto (x1,0) y un mínimo en (x2 ,0). Ambos puntos se caracterizan porque las pendientes (gradiente) de la curva en esos puntos son cero; por lo tanto, para encontrarlos, es necesario resolver la ecuación f '(x) = 0. Es importante destacar, sin embargo, que no todos los ceros ( f '(x) = 0) que tuviera la función f(x) son máximos o mínimos; un ejemplo de ello es el y y = f(x)

x1

x2

x3

x

Figura 2.9. Máximo, mínimo y punto de inflexión.



Prerrequisitos matemáticos

caso de los puntos de inflexión como el (x3,0) de la figura 2.9. Para averiguar si un cero de la función f(x) es máximo, mínimo o inflexión, hay que analizar las derivadas segundas así: La función f(x) presenta un máximo si f '(x) = 0, y además: f "(x) < 0

(2.33)

La función f(x) presenta un mínimo si f '(x) = 0, y además: f "(x) > 0

(2.34)

La función f(x) presenta un punto de inflexión si f '(x) = 0, y además: f "(x) = 0

(2.35)

Estos casos se ilustran en la figura 2.10 y para evitar errores puede utilizarse la siguiente regla nemotécnica. Imagínese la función como si fuera una copa con líquido; si estuviera “boca abajo”, el líquido se derramaría (signo menos) y entonces se trataría de un máximo. Recíprocamente si la copa estuviera “boca arriba”, el líquido permanecería (signo más) y se trataría de un mínimo. y

y

P

(a)

Figura 2.10.

x

(b)

y

+

+

P

P

x

(c)

x

Puntos estacionarios: (a) máximo, (b) mínimo, (c) punto de inflexión.

En orden a desarrollar una teoría directamente dirigida hacia una caracterización global de los ceros locales de funciones, los matemáticos consideran necesario introducir nociones complementarias sobre convexidad y concavidad. Ambos conceptos son importantes y además proporcionan una interpretación

MODELOS

DE



TRANSPORTE

geométrica interesante de las condiciones de segundo-orden expuestas en (2.33) a (2.35). y

y

x

(a)

Figura 2.11.

y

x

(b)

x

(c)

Funciones convexas: (a) convexa, (b) convexa, (c) no-convexa.

La figura 2.11 presenta algunos ejemplos de funciones convexas y noconvexas. Geométricamente, una función es convexa si la línea que une dos puntos cualesquiera de dicha función, no intercepta a la curva más que en esos dos puntos. Véase como en la figura 2.11(a), en dos dimensiones, una función convexa tendría un gráfico en forma semejante a la de un “cuenco”. Entonces, de la misma manera, se dice que una función g es cóncava si la función f = –g es convexa. Una propiedad interesante de las funciones convexas es que la suma de dos funciones convexas también es convexa.

2.4.5.

Funciones de varias variables

Es muy útil realizar aplicaciones de la diferenciación y del cálculo integral a este nuevo tipo de funciones con más de una variable. Supóngase que se tiene la función: y = f(x1,x2,…,xn)

(2.36)

Entonces para derivar dicha función respecto a una de estas variables xi, se deriva normalmente respecto de ella suponiendo constantes las demás. Se conoce con el nombre de derivada parcial de la función con respecto a la variable considerada y se escribe así: ∂y / ∂xi. Por ejemplo, si: y = 2x1 + x23x3



Prerrequisitos matemáticos

resulta que:

uy 2 ux1 uy  3x22 x3 ux2 uy  x23 ux3 Los máximos y mínimos de una función (2.36) se obtendrían igualando a cero todas las derivadas parciales:

uy  0 i = 1, 2,..., n uxi

(2.37)

que proporciona un sistema de n ecuaciones a resolver. Un caso particularmente interesante es el de los máximos y mínimos restringidos. Imagínese que se desea maximizar la ecuación (2.36) sujeta a las siguientes restricciones:

r1 ( x1 , x2 ,..., xn )  b1 r2 ( x1 , x2 ,..., xn )  b2 M

(2.38)

rK ( x1 , x2 ,..., xn )  bK Para su resolución pueden aplicarse los multiplicadores de Lagrange λ1, λ2 ,…, λ K sobre cada una de las ecuaciones (2.38) y, a su vez, maximizar la función Lagrangiana así definida: kK

L  f ( x1 , x2 ,...xn ) ¤ L k ¨ªrk ( x1 , x2 ,..., xn ) bk ·¹

(2.39)

k 1

como una función de x1,x2,…,xn y λ1,λ2,…,λ K. Entonces se procede a resolver los siguientes sistemas de ecuaciones:

uL  0 i = 1, 2,..., n uxi

(2.40)

MODELOS

DE



TRANSPORTE

y ∂L = 0 ∂λk

k = 1,2,…,K

(2.41)

Las ecuaciones (2.41) son simplemente las restricciones (2.38) expresadas de otra forma; el artificio de introducir los multiplicadores como las variables adicionales permite encontrar el máximo restringido.

2.4.6.

Integración múltiple

En el caso de la integración, puede definirse el concepto de integrales múltiples. Por ejemplo, dada la ecuación (2.36), se podría escribir:

V  °° L ° f ( x1 , x2 ,...xn )dx1dx2 ,..., dxn

(2.42)

con n integrales. Para comprender intuitivamente su significado, puede ser útil considerar el caso bidimensional, es decir, sea la función:

S  f ( x1 , x2 )

(2.43)

que representa una superficie en un sistema Cartesiano tridimensional. La integral doble sería:

V  °° f ( x1 , x2 )dx1dx2

(2.44)

y representa el volumen bajo esta superficie entre los límites que se consideren, de la misma manera que para el caso de una sola variable representaría el área bajo la curva entre los límites fijados.

2.4.7.

Elasticidades

La elasticidad de una variable dependiente y con respecto a otra variable xi en una función como la que representa (2.9), viene dada por la expresión:

uy uy xi y E ( y , xi )   u xi uxi y xi

(2.45)



Prerrequisitos matemáticos

y puede interpretarse como el cambio porcentual que experimenta la variable dependiente con respecto a un cambio porcentual dado en la variable independiente correspondiente. En los temas econométricos, se centrará el interés, a menudo, en las elasticidades de una función de demanda dada con respecto a los cambios en los valores de algunas variables explicativas o atributos. Generalmente se distingue entre elasticidades directas y cruzadas; las primeras se relacionan con los atributos del servicio o de la mercancía bajo consideración y las segundas, con los atributos de servicios o mercancías alternativas. Por ejemplo, se afirma a menudo que la elasticidad de demanda de transporte público respecto de las tarifas está alrededor de –0,33; esto significa que si se aumentan las tarifas un 1% se debe esperar una disminución relativa de la demanda en un 0,33%, es decir:

uD uD uD E ( D, T )  D  D  0, 33 m  0, 0033 uT 0, 01 D T

2.4.8.

Desarrollos en serie

Dada una función f(x), a veces es necesario estimar su valor en el entorno de un punto x0 y de sus derivadas en este punto. Para ello puede utilizarse el desarrollo en serie de Taylor; primeramente se define el concepto de número factorial (n!), el cual se aplica a números enteros no negativos:

n !  n(n 1)(n 2)...3 – 2 –1 0!  1

(2.46)

La serie de Taylor se define así:

f ( x0 h)  f ( x0 )

h0 h1 h2 h3 f '( x0 ) f ''( x0 ) f '''( x0 ) L 0! 1! 2! 3!

(2.47)

y es muy útil cuando h es bastante pequeño ya que pueden despreciarse los términos de orden superior al ser prácticamente nulos. Así, simplemente podría considerarse una aproximación suficiente utilizando al menos dos o tres términos del desarrollo en serie de Taylor como representativos de la función considerada.

MODELOS

DE



TRANSPORTE

Un caso especial del desarrollo en serie de Taylor es cuando x0 = 0 y se le conoce entonces como desarrollo en serie de Maclaurin, que a partir de la ecuación (2.47) quedaría:

f ( x )  f ( 0)

h0 h1 h2 h3 f '(0) f ''(0) f '''(0) L 0! 1! 2! 3!

(2.48)

Esto proporciona un método de expresión de ciertas funciones como la serie de “poder” ex, así:

e x  1 x x 2 / 2! x 3 / 3! ...

2.5.

ESTADÍSTICA MATEMÁTICA ELEMENTAL

En esta sección se proporciona sólo una revisión básica de los conceptos estadísticos más fundamentales. En el resto del libro, se supone que el lector no sólo tiene conocimiento de las distribuciones más importantes (p. ej., la Binomial, Normal, Student, Chi-cuadrado y Fisher) sino que también dispone de cierto conocimiento sobre la inferencia estadística básica (p. ej., estimadores, intervalos de confianza y contraste de hipótesis). Existen multitud de libros al respecto pero en cualquier caso se recomiendan específicamente los siguientes: Wonnacott y Wonnacott (1977) y el Capítulo 7 de Wilson y Kirby (1980). Se presentan ciertos tópicos especializados como elementos esenciales teóricos y básicos, tales como el análisis de regresión lineal y la estimación de la máxima verosimilitud, los cuales se desarrollan más profundamente en los capítulos pertinentes (es decir 3, 4 y 8 respectivamente).

2.5.1.

Probabilidades

La definición más intuitiva del concepto de probabilidad es que la medida de que un cierto resultado ocurra (p. ej., obtener un seis lanzando un dado) viene dada por el límite de su frecuencia relativa:

P (ei )  pi  lim x md

ni n

(2.49)

donde ei es el resultado deseado, n es el número de veces que se repite el experimento y ni el número de veces que ocurre ei. La expresión (2.49) permite deducir ciertas propiedades básicas de las probabilidades:



Prerrequisitos matemáticos

0 ≤ pi ≤ 1

(2.50)

como ni puede tomar valores entre 0 y n, resulta que:

¤p

i

1

(2.51)

i

con n1 + n2 + … = n. Una visión alternativa de la probabilidad esperada de un resultado puede expresarse en el ejemplo denominado “realizar una apuesta justa”. Sea pi la probabilidad de ganar una apuesta (que el resultado ei se produzca), y por tanto sea (1-pi) la probabilidad de no ganarla (que el resultado ei no se produzca), si la apuesta se gana, se perciben 35$ y si se pierde, deben pagarse x$. La denominación “apuesta justa” proviene del hecho de iguales pérdidas y ganancias, es decir:

35 pi  x(1 pi ) Por lo tanto, de aquí se obtiene la probabilidad de ganar la apuesta, despejando pi, es decir:

pi 

x x 35

En muchas ocasiones las probabilidades de ciertos experimentos no son tan simples de calcular. Si se define un suceso (en inglés event), como un subconjunto del conjunto de resultados de un experimento

E  [e1 , e2 ,..., ei ] se puede ver que la probabilidad de un suceso es la suma de las probabilidades de los resultados que lo componen, esto es:

P( E )  ¤ pi ,

ei  E

i

Ejemplo 2.1: dado el suceso E: {obtener por lo menos dos caras en tres lanzamientos de una moneda}, los resultados que se pueden dar de los ocho posibles son cuatro: (c, c, c), (c, c, s), (c, s, c), (s, c, c), (s, s, c), (s, c, s), (c, s, s) y (s, s, s). Como cada resultado de los ocho tiene una probabilidad de 1/8 (si las probabilidades de conseguir caras y cruces son iguales, es decir, si la moneda no está trucada), la probabilidad del suceso E es 1/2.

MODELOS

DE



TRANSPORTE

Para combinaciones de eventos (es decir, dos caras pero de tal forma que no todos los lanzamientos proporcionan el mismo resultado) llega a ser necesario trabajar con los conceptos de unión (ƛ) e intersección (Ƙ) representados en la figura 2.12. El rectángulo en la figura representa el espacio del evento y A y B son eventos dentro de él. En general, es cierto que:

P ( A U B )  P ( A) P( B) P( A I B)

(2.52)

y si A y B son mutuamente excluyentes;

P ( A U B )  P ( A) P( B)

A

(2.53)

B Unión

C

D Intersección

Figura 2.12. Diagrama de Venn para sucesos y probabilidades.

P(A / B) es la probabilidad de A condicionada por B y es:

P( A / B) 

P( A I B) P( B)

(2.54)

Un evento F es estadísticamente independiente de otro evento E, si y sólo si (abreviadamente se escribe iff ) la probabilidad de F condicionada por E es igual a P(F). Por consiguiente, para los eventos independientes se tiene que:

P( E I F )  P( E ) P( F )

(2.55)

que anteriormente se aplicó intuitivamente al estimar la probabilidad de evento en el ejemplo 2.1.



Prerrequisitos matemáticos

2.5.2. Variables aleatorias Pueden ser definidas como aquéllas que toman valores siguiendo una cierta distribución de probabilidad (ver Figura 2.13). S = espacio muestral

Rx = rango de la variable X X = variable aleatoria (mapeo)

s = suceso

x = valor específico de X

EϵS

X(S) ϵ Rx

Figura 2.13. Variable aleatoria.

Ejemplo 2.2: al lanzar una moneda al espacio dos veces, se tiene que los posibles resultados son: S = {cc, cs, sc, ss}. Si se define la variable aleatoria X = número de caras, es fácil ver que sólo puede tomar los tres siguientes valores:

x = Nº de caras →

{

x(cc) = 2 x(cs) = x(sc) = 1 x(ss) = 0

Puede verse que una ventaja importante de utilizar el concepto de variable aleatoria es que el conjunto de los resultados (espacio muestral) se reduce a un conjunto numérico más pequeño y conveniente. Cabe destacar que los valores de probabilidad de la variable aleatoria en este caso serán: P(x = 1) = P(cs ƛ sc) = P(cs) + P(sx) = 1 / 2 P(x = 2) = P (x = 0) = 1 / 4 Las variables aleatorias pueden ser discretas o continuas. En el primer caso, x toma valores de un conjunto finito numerable, con probabilidades que pertenecen a un conjunto p(x) que satisface (2.51) y p(xi) ≥ 0. En el segundo caso es necesario definir una función de densidad f(x), tal que:

MODELOS

DE



TRANSPORTE

°

x

f ( x) dx  1

f ( x) r 0,

2.5.3.

x

(2.56)

Estadística descriptiva

Cuando se trata con datos estadísticos, la información puede ser proporcionada convenientemente mediante la especificación de ciertos aspectos importantes en lugar de toda una distribución de esos datos. Por ejemplo, la distribución de una variable aleatoria puede ser descrita con referencia al valor medio y a su dispersión alrededor de él. La estadística descriptiva puede utilizarse para hacer comparaciones simples entre funciones de distribución y/o de densidad, sin entrar en todos los detalles. Es más, ciertas distribuciones estándares pueden ser completamente especificadas con sólo unos pocos estadísticos. La estadística descriptiva más usual intenta indicar “el medio” en el que se desenvuelven las funciones de distribución: para ello, normalmente se definen tres medidas o momentos en torno a cero, como son: 1. Si x es una variable aleatoria, entonces el valor esperado E(X) es la función que se obtiene como promedio ponderado de los xi por sus probabilidades, así:

E ( X )  ¤ xi pi ( xi ), para el caso discreto i

b

E ( X )  ° xf ( x)dx, para el caso continuo

(2.57)

a

donde f(x) se define para el rango [a,b]. El valor esperado corresponde al concepto de media en estadística descriptiva, y en el caso de la población total suele denotarse con la letra griega μ. Una de las propiedades más importantes del valor esperado es:

E (a bX cY )  a bE ( X ) cE (Y )

(2.58)

2. La moda X* es el valor de X que maximiza pi(xi) es decir, cualquier máximo relativo de la distribución de frecuencias o cualquier valor de la variable que posea una frecuencia mayor que su anterior y posterior. 3. La mediana X0,5: considérese una variable discreta X, cuyas observaciones en una tabla estadística han sido ordenadas de menor a mayor. Se deno-



Prerrequisitos matemáticos

mina mediana al primer valor de la variable que deja por debajo de sí al 50% de las observaciones, por tanto, si n es el número de observaciones, la mediana corresponderá a la observación |n / 2| + 1, donde se representa por | | la parte entera de un número, es decir: X 0 ,5

para el caso discreto.

P( X 0 ,5 )  ¤ P( X )  0, 5 x 1

P( x  X 0 ,5 )  °

X 0 ,5 a

f ( x ) dx  0, 5

para el caso continuo

(2.59)

Otro importante estadístico de una distribución es su dispersión o anchura; para su medición se utilizan los siguientes estadísticos más comunes: 1. La varianza Var(X) de una variable aleatoria se define como:

[

2

Var ( X )  E ; X E ( X )=

]

(2.60)

Desarrollando la anterior expresión, resulta:

[

2

Var ( X )  E X 2 2 XE ( X ) ; E ( X )= 2

]

2

2

(2.61)

 E ( X )2 2 ; E ( X )= ; E ( X )=  E ( X 2 ) ; E ( X )= Evidentemente la varianza no es un operador lineal:

• Var (a + bX) = b2 Var (X), es decir, sumar una constante no afecta a la dispersión de la distribución. • Var (aX + bY) = a2 Var (X) + b2 Var (Y) + 2ab Cov (X,Y), donde la covarianza de X e Y viene dada por: Cov (X,Y) = E(XY) – E(X)E(Y)

(2.62)

donde la covarianza de dos variables aleatorias independientes es cero. 2. La desviación estándar se(x) es la raíz cuadrada de la varianza y, en contraposición a la variación, tiene las mismas dimensiones que la variable aleatoria X y que los momentos centrales. 3. El coeficiente de variación CV, que está dado por el cociente entre la desviación estándar y la media, es una medida adimensional de la dispersión de la distribución.

3. Datos y rol del espacio

E

ste capítulo está dedicado a la problemática de la toma de datos y su representación, para ser utilizados en la modelización de transportes. Se consideran cuatro aspectos que son requisito previo para el resto del libro. En primer lugar se proporciona una breve introducción a la teoría estadística del muestreo, que complementará en parte los conceptos elementales tratados en el apartado 2.5. A los lectores interesados se les remite a un libro completo sobre el tema (Stopher y Meyburg, 1979) que puede consultarse para más detalles. En el apartado 3.2 se discute la tipología e importancia de los errores que pueden surgir durante la estimación de modelos y en su uso en modalidad predictiva; se menciona asimismo la interesante disyuntiva entre precisión de los datos y complejidad y coste del modelo. En el apartado 3.3 se presentan los distintos tipos de encuestas utilizados en planificación de transporte. Merecen un especial interés los problemas referidos a la corrección, expansión y validación de los datos de encuestas. También se tratarán temas relativos a la toma de datos de preferencias declaradas y longitudinales (p. ej., un panel). Finalmente en el apartado 3.4 se afrontarán los problemas prácticos más importantes en la representación de redes y en el diseño de la zonificación de un área de estudio. Es aquí donde realmente se deciden las “capacidades espaciales” del modelo, es decir, su capacidad de tratar correctamente el espacio. Representaciones pobres de la red o sistemas zonales demasiado gruesos, pueden invalidar los resultados del modelo teórico más atractivo.

3.1. 3.1.1.

TEORÍA BÁSICA DE MUESTREO Consideraciones estadísticas

La estadística puede definirse como la ciencia que trata sobre la recogida, análisis, tratamiento e interpretación de datos con objeto de obtener la máxima



Datos y rol del espacio

cantidad de información útil para describir un fenómeno. También puede ser descrita como una de las disciplinas relacionadas con la toma de decisiones bajo condiciones de incertidumbre. En este caso su objetivo sería ayudar a determinar el nivel de incertidumbre asociado a datos medidos para contribuir a mejorar el proceso de toma de decisiones. Normalmente los datos consisten en una muestra de observaciones tomadas de una cierta población de interés, la cual no es económicamente (o quizás ni siquiera técnicamente) susceptible de ser observada en su integridad. Estas observaciones se realizan sobre uno o más atributos de la población (p. ej., el ingreso) y permiten, después, realizar inferencias sobre el valor medio de estos atributos, a menudo llamados parámetros de la población. El diseño muestral ha de estar encaminado a asegurar que los datos que se van a obtener, ofrezcan la mayor cantidad de información útil sobre la población de interés, al menor coste posible. El resto del problema consiste en cómo utilizar dichos datos (p. ej., expandir los valores de la muestra) para realizar inferencias correctas sobre la población. Se presentan entonces dos dificultades: • cómo asegurar que la muestra sea representativa; y • cómo extraer conclusiones válidas de una muestra que satisfaga la condición anterior. Ninguna de estas dificultades constituiría un problema si no hubiera variabilidad en la población. Para resolver la segunda dificultad (extracción de conclusiones válidas) existe un procedimiento perfectamente establecido que no presenta graves problemas si se mantienen ciertas hipótesis y condiciones. La identificación de una muestra representativa puede suponer una tarea más delicada en ciertos casos, como se verá a continuación. 3.1.1.1.

Definiciones básicas

• Muestra: se define como el conjunto de unidades que han sido especialmente seleccionadas para representar a una población más grande con ciertos atributos de interés (p. ej., altura, elección zonal o modal, etc.). Tres aspectos de esta definición tienen particular importancia. Primero: qué población trata de representar la muestra. Segundo: cuál debe ser el tamaño de la muestra. Tercero: qué significa “especialmente seleccionada”. • Población de interés: es el grupo completo sobre el que se busca información. En muchos casos su definición se obtiene directamente de los objetivos

MODELOS

DE

TRANSPORTE



del estudio. La población de interés se compone de elementos individuales. Sin embargo, la muestra se selecciona habitualmente sobre la base de unidades muestrales no equivalentes a los elementos individuales, ya que la agregación de éstos últimos se considera a menudo necesaria. Por ejemplo, una unidad muestral utilizada con frecuencia es el hogar, mientras que los elementos de interés son los individuos que lo componen. • Método de muestreo: la mayoría de los métodos comúnmente aceptados se basan en alguna forma de muestreo aleatorio. Para ello lo fundamental es que la selección de cada unidad se lleve a cabo independientemente, de forma que cada unidad de muestreo tenga la misma probabilidad de ser incluida en la muestra. Los métodos más interesantes son: – Muestreo aleatorio simple, que no es solamente el método más sencillo, sino que también constituye la base del resto. Consiste en asociar a cada unidad de la población un identificador (un número) y después seleccionar estos números al azar para obtener la muestra. En algunos casos pueden necesitarse muestras demasiado grandes para asegurar información suficiente sobre opciones minoritarias de interés especial. Por ejemplo, puede ocurrir que una muestra de unidades familiares tomadas al azar en un país en vías de desarrollo ofrezca muy poca información sobre hogares con más de un vehículo. – Muestreo aleatorio estratificado, en el cual se utiliza en primer lugar información previa para subdividir la población en estratos homogéneos (respecto a las variables de estratificación), y después se efectúa un muestreo aleatorio simple dentro de cada estrato utilizando la misma tasa de muestreo. El método permite obtener las proporciones correctas de cada estrato en la muestra. Esto puede ser importante cuando existen subgrupos de la población relativamente pequeños, que pudieran no quedar bien representados en un muestreo aleatorio simple. Es posible también estratificar con respecto a más de una variable, creando de esta forma una matriz n-dimensional de celdas grupales. No obstante debe tenerse especial cuidado con el número de celdas creado, ya que se incrementa geométricamente con el número de estratos. Un número excesivo de celdas puede llevar a que el número medio de unidades muestrales por celda sea demasiado pequeño. Ni siquiera el muestreo estratificado es de gran utilidad cuando se requiere información sobre opciones con una baja probabilidad de elección dentro de la población. En estos casos se



Datos y rol del espacio

utiliza un tercer método, denominado muestreo basado en la elección, que es en realidad un subconjunto del anterior. El método consiste en estratificar la población en base a los resultados del proceso de elección. Este método es muy común en estudios de transporte, como se verá en la sección 3.3. Una ventaja considerable es que los datos pueden ser obtenidos con un coste mucho menor que con los otros métodos de muestreo. Su principal desventaja es que la muestra global así obtenida, puede no ser aleatoria y de aquí que sea mayor el riesgo de sesgo a la hora de expandir los valores obtenidos. • Error muestral y sesgo de muestreo: éstos son los dos tipos de errores que pueden darse al obtener una muestra; su combinación contribuye al error de medición de los datos. El primer tipo de error se debe simplemente al hecho de que se está tratando con una muestra y no con el total de la población, y por lo tanto siempre estará presente debido a efectos aleatorios. Este tipo de error no afecta a los valores expandidos de las medias de los parámetros estimados, solamente afecta a la variabilidad en torno a ellas, determinando así el grado de confianza que puede asociarse a las mismas. Básicamente es función del tamaño muestral y de la variabilidad intrínseca de los parámetros a investigar. El sesgo muestral, por otra parte, se produce por errores cometidos bien al definir la población de interés o bien al seleccionar el método de muestreo, la técnica de toma de datos o cualquier otra parte del proceso. Se diferencia del error muestral en dos aspectos importantes: – Puede afectar no sólo a la variabilidad en torno a la media de los parámetros estimados sino también a los valores mismos. Por ello puede ocasionar una distorsión más grave de los resultados de la encuesta. – Mientras que el error muestral no puede ser evitado (solamente puede reducirse incrementando el tamaño de la muestra), el sesgo puede eliminarse en la práctica tomando precauciones especiales durante las distintas fases del diseño muestral y la toma de datos. • Tamaño de la muestra: desafortunadamente no hay respuestas simples ni directas para el cálculo del tamaño de la muestra en cada situación. Esto ocurre porque muchos de sus inputs son inciertos y relativamente subjetivos, a pesar de que los cálculos involucrados se basan en precisas fórmulas estadísticas. Por ello el analista sólo puede obtener el tamaño de la muestra después de analizar cuidadosamente el problema estudiado.

MODELOS

DE

TRANSPORTE



La determinación del tamaño de la muestra es un problema de compromiso, ya que: – una muestra demasiado grande puede implicar una toma de datos y un proceso de análisis demasiado caros dados los objetivos del estudio y el grado de precisión requerido, pero – una muestra demasiado pequeña puede implicar resultados sujetos a un grado de variabilidad inaceptable, reduciendo el valor de todo el ejercicio. Entre estos dos extremos se encuentra el tamaño de muestra más eficiente (en términos de coste) para los objetivos de un estudio concreto. A partir de ahora se supone que dicho objetivo consiste en la estimación de ciertos parámetros de la población mediante estadísticos calculados a partir de los datos de la muestra. Como estos estadísticos están sujetos al error de muestreo, es también necesario incluir una estimación de la confianza asociada al valor de cada uno de ellos. 3.1.1.2.

Tamaño de la muestra para estimar los parámetros de la población

Ésta depende de tres factores principales: variabilidad de los parámetros en la población estudiada, grado de exactitud requerido para cada uno de ellos y tamaño de la población. Sin duda los dos primeros son los más importantes. Esto puede resultar sorprendente a primera vista, porque parece intuitivamente necesario tomar muestras más amplias en poblaciones más grandes con el fin de mantener el grado de exactitud de las estimaciones. Sin embargo, según se verá a continuación, el tamaño de la población no afecta significativamente al tamaño de la muestra, excepto en el caso de poblaciones muy pequeñas. El Teorema Central del Límite, que es la base primordial del problema de estimación del tamaño muestral, postula que la estimación de la media de una muestra tiende a una distribución Normal a medida que el tamaño de la muestra (n) aumenta. Esto se cumple para cualquier distribución de la población si n es mayor o igual a 30. El teorema se cumple, incluso en el caso de muestras más pequeñas, si la población original tiene una distribución similar a la Normal. Considérese una población de tamaño N y una propiedad específica que distribuye con media μ y varianza σ2. El Teorema Central del Límite indica que la distribución de la media (xˉ ) de muestras sucesivas es una distribución



Datos y rol del espacio

Normal con media μ y desviación estándar se (xˉ ), conocida como el error estándar de la media, y viene dada por:

se ( x ) 

( N n)s 2 ( N 1) n

(3.1)

Si sólo se considera una muestra, la mejor estimación de μ es ˉx y la mejor estimación de σ2 es S2 (la varianza de la muestra). En este caso el error estándar de la media puede estimarse como:

se ( x ) 

( N n) S 2 Nn

(3.2)

y, según se mencionó anteriormente, es función de tres factores: la variabilidad del parámetro (S2), el tamaño de la muestra (n) y el tamaño de la población (N). Sin embargo para poblaciones grandes y tamaños de muestra pequeños (el caso más frecuente), el factor (N – n) / N es muy próximo a 1 y la ecuación (3.2) se reduce a:

se ( x ) 

S n

(3.3)

De esta forma, por ejemplo, aumentando cuatro veces el tamaño de la muestra únicamente se reduce a la mitad el error estándar, siendo un caso típico de retornos decrecientes a escala. El tamaño de la muestra necesaria puede ser estimado resolviendo la ecuación (3.2) para n. Pero normalmente es más sencillo realizarlo en dos pasos, primero calculando n de la ecuación (3.3) de la forma:

n' 

S2 se ( x ) 2

(3.4)

y después, si es necesario, se corrige por tamaño de población finita mediante:

n

n' n' 1 N

(3.5)

MODELOS

DE



TRANSPORTE

Aunque el procedimiento descrito parece ser objetivo y relativamente simple tiene dos inconvenientes importantes que debilitan su aplicación: la estimación de la varianza de la muestra S2 y la elección de un error estándar aceptable para la media. El primero es obvio: S2 solamente puede calcularse una vez que se ha tomado la muestra, por lo que ha de estimarse desde otras fuentes. El segundo problema está relacionado con el grado de confianza que se desea asociar al uso de la media muestral como estimador de la media poblacional. La práctica habitual no especifica un valor único del error estándar sino un intervalo alrededor de la media para un determinado nivel de confianza. Por tanto se necesitan dos hipótesis para calcular un error estándar aceptable: • En primer lugar se debe elegir un nivel de confianza para el intervalo. Éste expresa cuán frecuentemente el analista está dispuesto a cometer un error al aceptar que la media muestral es una medida de la verdadera media (el nivel de confianza típico del 95% implica una disposición a errar en el 5% de los casos). • En segundo lugar es necesario especificar los límites del intervalo de confianza alrededor de la media en términos absolutos o relativos. En este último caso, como el intervalo se expresa como una proporción de la media, se necesita una estimación de la misma para calcular los valores absolutos del intervalo. Una opción útil consiste en expresar el tamaño muestral como función del coeficiente de variación esperado (CV = σ / μ) de los datos. Por ejemplo, si se supone una distribución Normal y se considera un nivel de confianza del 95%, significa que un valor máximo de 1,96 se (xˉ ) se aceptaría para el intervalo de confianza (μ ± 1,96σ contiene el 95% de la distribución de probabilidad Normal). Si se especifica un error del 10% se obtiene un intervalo (μ ± 0,1μ) y puede observarse que: se (xˉ ) = 0,1μ / 1,96 = 0,051μ y reemplazando este valor en (3.4) se obtiene: n' = (S / 0,051μ)2 = 384 CV2

(3.6)

Obsérvese que si el intervalo se especifica como (μ ± 0,05μ), es decir, con la mitad de error, n’ se incrementaría cuatro veces hasta 1.536 CV2. Para completar este punto es importante enfatizar que el desarrollo anterior es relativamente subjetivo. Por ejemplo, es posible asignar intervalos de



Datos y rol del espacio

confianza más pequeños y/o niveles de confianza mayores a parámetros más importantes. No obstante, cada una de estas acciones producirá errores estándar aceptables más pequeños y, en consecuencia, mayores muestras y costes. Si se necesita estimar varios parámetros, la muestra puede ser elegida a partir de aquel parámetro que requiera un tamaño muestral mayor. 3.1.1.3.

Obtención de la muestra

El último paso del proceso de muestreo es la extracción de la muestra en sí. En algunos casos el procedimiento puede ser fácilmente automatizable, tanto en terreno como en gabinete (en cuyo caso se debe prestar especial atención a que el proceso se cumpla realmente en la práctica), pero debe realizarse siempre con referencia a un proceso aleatorio. Aunque los únicos procedimientos verdaderamente aleatorios son aquellos de naturaleza física (p. ej., tirar un dado o lanzar una moneda), son por lo general demasiado costosos para ser utilizados en la selección de la muestra. Por esta razón normalmente se utilizan procedimientos pseudo-aleatorios, capaces de generar fácil y rápidamente un conjunto de números aleatorios. Ejemplo 3.1: considérese una determinada área cuya población puede clasificarse en grupos según: posesión de vehículo (con y sin coche) y tamaño familiar (hasta cuatro y más de cuatro miembros). Supóngase que se necesitan m observaciones por celda para garantizar un nivel de confianza del 95% en la estimación de, por ejemplo, la tasa de viajes. Supóngase también que la población tiene la siguiente distribución (obtenida de datos históricos). Posesión de vehículo

Con coche Sin coche

Tamaño familiar

% de población

4 o menos

9

Más de 4

16

4 o menos

25

Más de 4

50

En este caso hay dos formas posibles de proceder: 1. Obtener una muestra con m observaciones por celda mediante muestreo aleatorio. Así, sería necesario seleccionar el tamaño de muestra que ga-

MODELOS

DE



TRANSPORTE

rantice este número de observaciones para cada celda, incluyendo la clase con la proporción más pequeña de la población. Por tanto el tamaño de celda debería ser:

n  100m / 9  11,1m 2. Alternativamente se puede llevar a cabo una muestra aleatoria preliminar de 11,1m hogares donde únicamente se pregunte el grupo o clase al que pertenece. Esta encuesta, de bajo presupuesto, puede utilizarse para obtener las direcciones de m hogares incluso para el grupo menor. Como sólo se necesitan m observaciones por celda sería suficiente seleccionar aleatoriamente una muestra estratificada de 3m hogares en los otros grupos para ser encuestada en detalle (junto con las m ya detectadas para la celda más restrictiva). Como puede observarse en el primer caso se obtiene una muestra mayor; su coste (aproximadamente tres veces más encuestas) debe compararse con el coste de la encuesta preliminar.

3.1.2. Conceptualización del problema de muestreo En esta parte se asumirá que el objetivo final de la toma de la muestra es calibrar un modelo de elección para toda la población. Siguiendo la notación de Lerman y Manski (1976) se denomina P y f a las características de la población y de la muestra respectivamente. También se supone que cada observación muestral puede describirse en base a las dos siguientes variables: i = elección observada del individuo encuestado (p. ej., ha tomado un autobús). X = vector de características (atributos) del individuo (edad, sexo, ingreso, posesión de vehículo) y de las alternativas de su conjunto de elección (tiempo andando, de espera y de viaje, coste). Finalmente se supone que el proceso de elección subyacente en la población puede representarse mediante un modelo con parámetros θ. En este caso la distribución conjunta de i y X está dada por: P(i, X / θ)



Datos y rol del espacio

y la probabilidad de elegir la alternativa i entre el conjunto de opciones con atributos X es: P(i / X, θ) Dependiendo de la forma en que se extraiga cada observación, la muestra tendrá su propia distribución conjunta de i y de X que puede escribirse como f(i,X / θ). En base a esta notación el problema de muestreo puede formalizarse como se muestra a continuación (Lerman y Manski, 1979). 3.1.2.1.

Muestreo aleatorio

En este caso la distribución de i y X en la muestra y en la población debería ser idéntica, esto es: f(i, X / θ) = P(i, X / θ) 3.1.2.2.

(3.7)

Muestreo estratificado

En este caso la muestra no es aleatoria respecto a ciertas variables independientes del modelo de elección (p. ej., una muestra con el 50% de familias de ingreso bajo y el 50% de familias con ingreso alto es estratificada sólo si se toma una muestra aleatoria dentro de cada estrato). El proceso de muestreo se define mediante una función f(X), que da la probabilidad de encontrar una observación con las características X. En el conjunto de la población, esta probabilidad es por supuesto P(X). La distribución de i y X en la muestra viene dada por: f(i, X / θ) = f(X)P(i, X / θ)

(3.8)

Es sencillo comprobar que una muestra aleatoria es un caso especial de muestra estratificada en la que f(X) = P(X), ya que: f(i, X / θ) = P(X) P(i / X, θ) = P(i, X / θ) 3.1.2.3.

(3.9)

Muestreo basado en la elección

En este caso el procedimiento de muestreo se define mediante una función f(i), que da la probabilidad de encontrar una observación que elija la opción i. Ahora, la distribución de i y X en la muestra viene dada por:

MODELOS

DE



TRANSPORTE

f(i, X / θ) = f(i)P(X / i, θ)

(3.10)

Si bien la última probabilidad, P(X / i, θ) no se había definido, se puede obviar a partir del teorema de Bayes que señala: P(X / i, θ) = P(i / X / θ)P(X) / P(i / θ)

(3.11)

La expresión del denominador, P(i / θ) que tampoco había sido definida, puede obtenerse suponiendo valores discretos de X de la forma: P(i / θ) =

¤ P(i/ X , Q ) P( X ) X

(3.12)

Por tanto la expresión final de la probabilidad conjunta de i y X para una muestra basada en la elección, es claramente más compleja:

f ( i,X / Q )  f ( i ) P( i/ X ,Q ) P( X ) / ¤ P( i/ X , Q ) P( X )

(3.13)

X

y sirve para ilustrar no solamente que el muestreo basado en la elección es intuitivamente más problemático que los otros, sino también para constatar que posee un potencial de sesgo más alto precisamente en aquello que más importa: la elección. De todo lo anterior se puede señalar que cada método de muestreo conduce a una distribución diferente de elecciones y características de la muestra, y que no hay razones a priori para esperar que un único método de estimación de los parámetros sea aplicable en todos los casos. Ejemplo 3.2: supóngase que para los objetivos de un estudio de transporte, la población de un área determinada ha sido clasificada según dos categorías de ingreso, y que sólo hay dos modos de transporte disponibles (coche y autobús) para efectuar el viaje al trabajo. Supóngase también que la distribución de la población es la siguiente: Ingreso Bajo (IB)

Ingreso Alto (IA)

Total

Usuario Bus

0,45

0,15

0,60

Usuario Coche

0,20

0,20

0,40

Total

0,65

0,35

1,00



Datos y rol del espacio

1. Muestreo aleatorio. Está claro que si la muestra es al azar, se debería obtener la misma distribución en la muestra que en la población. 2. Muestreo estratificado. Considérese una muestra con el 75% de viajeros de Ingreso Bajo (IB) y el 25% de viajeros con Ingreso Alto (IA). De la tabla anterior es posible calcular la probabilidad de que un viajero de ingreso bajo utilice el autobús, así: P (Bus/IB) =

P (IB y Bus) 0,45 = = 0,692 P (IB y Bus) + P (IB y Coche) 0,45 + 0,2

Ahora, como la muestra estratificada tiene el 75% de individuos con ingreso bajo, la probabilidad de encontrar un usuario de autobús de ingreso bajo en la muestra es: 0,75 × 0,692 = 0,519. Procediendo análogamente se puede construir la siguiente tabla de probabilidades para la muestra estratificada: Ingreso Bajo

Ingreso Alto

Total

Usuarios de coche

0,519

0,107

0,626

Usuarios de autobús

0,231

0,143

0,374

Total

0,750

0,250

1,000

3. Muestreo basado en la elección. Supóngase que ahora se toma una muestra del 75% de usuarios de autobús y 25% de usuarios de coche. En este caso la probabilidad de encontrar un usuario de autobús con ingreso bajo puede calcularse de la forma: P (IB/Bus) =

P (IB y Bus) 0,45 = = 0,75 P (IB y Bus) + P (IA y Bus) 0,45 + 0,15

Por tanto la probabilidad de encontrar en la muestra un viajero de ingreso bajo que utilice el autobús es 0,75 veces 0,75, es decir 0,563. Procediendo análogamente, se obtiene la siguiente tabla de probabilidades: Ingreso Bajo

Ingreso Alto

Total

Usuarios de coche

0,563

0,187

0,75

Usuarios de autobús

0,125

0,125

0,25

Total

0,688

0,312

1,00

MODELOS

DE



TRANSPORTE

Como se esperaba, cada método de muestreo produce, en general, una distribución diferente en la muestra. La importancia del ejemplo anterior es mayor cuando se consideran las implicaciones de utilizar las distintas muestras obtenidas en la estimación de modelos. Para ello es necesario, primeramente, entender lo que hacen los programas de calibración estándar; ellos simplemente buscan los coeficientes del modelo (θ), asociados a un conjunto de variables explicativas, que mejor repliquen las elecciones observadas en la muestra. Para el total de la población, la probabilidad de observar un conjunto de datos determinados, se puede encontrar –en forma conceptual– simplemente calculando las probabilidades de que distintos tipos de viajeros (con alternativas y atributos dados) elijan la alternativa observada. Por ejemplo, en la primera tabla del ejemplo 3.2 (muestreo aleatorio simple) la probabilidad de que un viajero de ingreso alto elija coche viene dada por la razón entre la probabilidad de tener ingreso alto y usar coche y la probabilidad de tener ingreso alto, esto es: 0,20 = 0,572 0,15 + 0,20 Si se considera la segunda tabla (muestreo estratificado), la probabilidad anterior es ahora: 0,143 = 0,572 0,107 + 0,143 Esto no es coincidencia. De hecho fue una de las conclusiones más importantes obtenidas en una investigación llevada a cabo por Lerman et al. (1976) en Estados Unidos. En la práctica significa que se puede utilizar software estándar para la estimación de modelos con datos obtenidos de una muestra estratificada. Es también importante destacar que esto no ocurre para el caso de muestras basadas en la elección. Para demostrarlo se calcula, a continuación, la misma probabilidad anterior pero utilizando información de la tercera tabla: 0,125 = 0,400 0,187 + 0,125 Como puede verse, el resultado es completamente diferente. Para finalizar con este tema, es interesante mencionar que Lerman et al. (1976), propusieron



Datos y rol del espacio

un método para utilizar datos de muestras basadas en elección en la estimación de modelos evitando el sesgo, a expensas únicamente de tener un conocimiento previo de los repartos reales del mercado. Esto implica ponderar las observaciones por factores calculados mediante: P (elegir la alternativa en una muestra aleatoria) P (elegir la alternativa en una muestra basada en la elección) De esta forma, en el ejemplo anterior, el factor de ponderación para las observaciones de autobús debería ser: 0,45 + 0,15 = 0,8 0,563 + 0,187 y para usuarios de coche: 0,20 + 0,20 = 1,6 0,125 + 0,125 Nótese que es necesario conocer los datos basados en la elección para cada alternativa. No sería posible calibrar un modelo para coche y autobús basándose solamente en observaciones para este último modo de transporte.

3.1.3. 3.1.3.1.

Consideraciones prácticas del muestreo El problema de la extracción de la muestra

El muestreo estratificado (así como el basado en la elección), requiere muestreo aleatorio dentro de cada estrato. Para llevarlo a cabo es necesario, en primer lugar, aislar al grupo de interés y esto, en la práctica, puede no ser tan sencillo. Considérese, por ejemplo, un caso en el que la población de interés esté formada por todos los viajeros potenciales de una ciudad. Si se estratifica por área de residencia, puede ser relativamente simple aislar la subpoblación de residentes dentro de la ciudad (p. ej., utilizando datos de una encuesta anterior). El problema reside en que es extremadamente difícil aislar y tomar una muestra del resto, esto es, aquellos que viven fuera de la ciudad. Un problema adicional es que, en ciertos casos, incluso aunque sea posible aislar todas las subpoblaciones y conformar estratos, es difícil asegurar una muestra aleatoria dentro de cada uno. Por ejemplo, si se está interesado en realizar una muestra basada en la elección de modo de los viajeros de una ciudad,

MODELOS

DE

TRANSPORTE



sería necesario entrevistar a usuarios de autobús y para ello, en primer lugar, hay que decidir qué rutas deberían incluirse en la muestra. El problema es que ciertas rutas podrían tener proporciones de estudiantes y/o viajeros de la tercera edad más altas que la media, por lo que se introducirían sesgos. 3.1.3.2.

Obtención del tamaño de cada subpoblación

Éste es un elemento clave y de gran importancia para determinar el número de personas a muestrear posteriormente. Dada una cierta estratificación, hay varios métodos disponibles para averiguar el tamaño de cada subpoblación, tales como: 1. Medición directa. Esto es posible en ciertos casos; por ejemplo, en una muestra basada en la elección de modo para viajes al trabajo, el número de billetes de metro y autobús vendidos, y aforos de tráfico en la hora punta en un corredor de la ciudad, pueden ofrecer una medida adecuada (aunque imperfecta, ya que no todos los viajes durante el período punta son al trabajo), del número de personas que eligen cada modo. Por otro lado, si interesa una estratificación geográfica (p. ej., zonal), se puede utilizar el último censo para estimar el número de habitantes de cada zona. 2. Estimación a partir de una muestra aleatoria. Si se realiza un muestreo aleatorio simple, la fracción en la muestra correspondiente a cada estrato es un estimador consistente de la fracción del total correspondiente a cada subpoblación. Es importante señalar que el coste de este método es bajo, ya que la única información registrada es la necesaria para establecer el estrato al cual pertenece el entrevistado. 3. Resolución de un sistema de ecuaciones simultáneas. Supóngase que se trata de estratificar por el modo elegido (coche, bus y metro) y que se conocen datos sobre ciertas características de la población como el ingreso medio (I) y la tasa de motorización promedio (TM); entonces bastaría con realizar una pequeña encuesta en cada modo para obtener el I y TM en cada uno y plantear un sistema de ecuaciones que tenga las proporciones de subpoblación como incógnitas. Finalmente, cuando se diseña un muestreo, debe tenerse en cuenta la “tasa de fallo” de los diferentes tipos de encuestas. El tamaño de la muestra anteriormente discutido se corresponde con el número de respuestas válidas en todo el proceso de toma de datos. Algunos procedimientos de encuesta generan tasas



Datos y rol del espacio

de respuesta bajas (p. ej., algunas encuestas postales), pero se utilizan debido a su menor coste. Ejemplo 3.3: en una población a estudiar, se sabe que su ingreso medio (I) es de 33.600 $/año y que su tasa de motorización media (TM) es de 0,44 coches/familia. Además se realizaron pequeñas encuestas en los diferentes modos, con los siguientes resultados: Modo

I ($ / año)

TM (coches / familia)

Vehículo privado

78.000

1,15

Autobús

14.400

0,05

Metro

38.400

0,85

Si Fi denota la fracción que es cada subpoblación del total, se puede plantear el siguiente sistema de ecuaciones:

33.600  78.000 F1 14.400 F2 38.400 F3 0, 44  1,15 F1 0, 05 F2 0, 85 F3 1  F1 F2 F3 cuya solución es:

F1  0, 2451 F2  0, 6044 F3  0,1505 Esto significa que si la población total del área es de 180.000 habitantes, habría aproximadamente 44.100 usuarios de coche, 108.800 usuarios de autobús y 27.100 de metro.

3.2.

ERRORES EN LA MODELIZACIÓN Y EN LA PREDICCIÓN

Los procedimientos estadísticos normalmente utilizados en la modelización de la demanda de viajes suponen no sólo que se conoce a priori la especificación funcional correcta del modelo, sino también que los datos utilizados durante

MODELOS

DE

TRANSPORTE



la estimación no contienen errores. En la práctica estas dos condiciones no son frecuentemente respetadas. Incluso, aunque se satisficieran, las estimaciones realizadas con los modelos están sujetas a errores debidos a imprecisiones en los valores supuestos para las variables explicativas en el año horizonte. El objetivo final de la modelización es, en la mayor parte de los casos, el poder realizar previsiones (p. ej., el número de personas que elegirían diversas opciones). Un problema importante con el que se enfrenta el diseñador de modelos es encontrar cuál es la combinación adecuada entre la complejidad del modelo y la exactitud de los datos que se adapta mejor a la confiabilidad requerida en la prognosis y a los recursos disponibles para el estudio. Con este fin, es importante distinguir entre los diferentes tipos de errores, en particular entre: • aquellos que pueden ocasionar resultados incorrectos a partir de modelos correctos, p. ej., errores en la predicción de las variables explicativas, errores de transferencia y agregación, y • aquellos que llevan a la estimación incorrecta de los modelos, p. ej., errores de medida, de muestreo o de especificación. En la siguiente sección, se presta especial atención a los tipos de errores que pueden surgir y los efectos que ellos pueden causar. A continuación se examinará el equilibrio entre la complejidad del modelo y la exactitud de los datos, haciendo especial énfasis en el rol que tienen los modelos simplificados en determinados contextos.

3.2.1.

Clasificación de errores

Durante el proceso de construcción, calibración y prognosis de modelos, pueden producirse los siguientes tipos de errores: 3.2.1.1.

Errores de medición

Éstos aparecen debido a las imprecisiones inherentes al proceso de medida de los datos en el año base, tales como: preguntas mal planteadas en las encuestas, respuestas mal interpretadas por el encuestador, errores de medida en las redes, errores de codificación y digitalización, etcétera. Estos errores tienden a ser más altos en países menos desarrollados, pero siempre pueden reducirse mejorando las precauciones y calidad de la toma de



Datos y rol del espacio

datos (p. ej., utilización apropiada de ordenadores como apoyo a la realización de encuestas), o simplemente destinando más recursos para controlar la calidad de los datos. Ambas soluciones cuestan dinero. Los errores de medición, tal como se definen aquí, deben distinguirse de la dificultad de definir las variables a medir. La complejidad que puede aparecer en este tema se indica en la figura 3.1. Idealmente, la modelización debe basarse en información percibida realmente por los viajeros, pero mientras que los datos registrados ofrecen alguna aproximación a su percepción, su empleo introduce la dificultad de estimar lo que los usuarios van a percibir en el futuro. Así, parece inevitable que los modelos se caractericen por tener errores de percepción que tienden a ser más grandes para aquellas alternativas no elegidas, debido a la existencia de sesgos de auto-selección (los atributos de la Errores de medición Valores verdaderos

Datos ingenieriles Errores de percepción, información y tiempo de respuesta

Datos percibidos

Errores de registro, redondeo y comunicación Restricciones

Modo elegido

Datos registrados

Figura 3.1. Medida de los atributos y proceso de elección.

MODELOS

DE

TRANSPORTE



opción elegida por el individuo son percibidos como mejores y los de la opción rechazada como peores de lo que ambos son en la realidad, de forma que se refuerza la racionalidad de la elección efectuada). 3.2.1.2.

Errores de muestreo

Estos errores aparecen porque los modelos han de estimarse a partir de un conjunto finito de datos en lugar de la población completa. Los errores de muestreo tienden a ser inversamente proporcionales a la raíz cuadrada del número de observaciones (esto es, para reducirlos a la mitad es necesario cuadriplicar el tamaño de la muestra), por lo que su reducción puede resultar muy costosa. Daganzo (1980) ha estudiado el problema de definición de estrategias de muestreo óptimas para tratar de incrementar la exactitud de la estimación. 3.2.1.3.

Errores de cálculo

Este tipo de error aparece porque los modelos generalmente se basan en procesos iterativos para los cuales la solución exacta, si existe, no se logra obtener, debido a su excesivo tiempo de cálculo computacional. En general estos errores son más pequeños en comparación con el resto, excepto en casos tales como asignación en redes congestionadas y problemas de equilibrio entre oferta y demanda en sistemas completos de modelización, donde pueden llegar a ser muy grandes (ver ESTRAUS, 1989). 3.2.1.4.

Errores de especificación

Aparecen cuando el fenómeno que se está intentando modelizar no se comprende bien, o porque necesita ser simplificado por alguna razón, y ello se debe a que ningún modelo puede representar la realidad de forma exacta. Un mejor modelo, más sofisticado, puede reducir este tipo de errores mediante una mayor inversión en la etapa de recolección de datos y su procesamiento. Dentro de este tipo, los errores más importantes son los siguientes: • Inclusión de una variable irrelevante (p. ej., una variable que no afecte al proceso de elección modelizado). Este error no producirá sesgo en el modelo (o sus estimaciones) si los parámetros aparecen de forma lineal, pero tenderá a incrementar el error muestral. En un modelo no lineal, por el contrario, puede producir sesgos (ver Tardiff, 1979). • Omisión de una variable relevante. Es quizás el error de especificación más común. Es interesante destacar que los modelos que incorporan un



Datos y rol del espacio

término de error aleatorio (como los que se verán en los Capítulos 4 y 7) están diseñados para acomodar este error. Sin embargo pueden surgir problemas cuando la variable excluida está correlacionada con variables del modelo o cuando su distribución en la población relevante es diferente de su distribución en la muestra utilizada para la estimación del modelo (ver Horowitz, 1981b). • Exclusión de las variaciones en los gustos por parte de los individuos. Esto siempre produce modelos sesgados, como se indica en el Capítulo 8. Desafortunadamente éste es el caso de la mayoría de los modelos de elección más prácticos. Notables excepciones son los modelos Probit Multinomial y logit mixto, de los cuales se hablará también en el Capítulo 8. • Otros errores de especificación, en particular la utilización de formas funcionales que no sean apropiadas, tales como funciones lineales para representar efectos no lineales, modelos compensatorios para representar comportamientos que pueden ser no compensatorios (Capítulo 8) o la omisión de efectos tales como el hábito o la inercia. En Williams y Ortúzar (1982a) puede encontrarse una discusión completa de estas formas de error. Todos los errores de especificación pueden reducirse, en principio, incrementando la complejidad del modelo. Sin embargo el coste ocasionado por esto no es fácil de estimar, ya que está relacionado con la operación del modelo, pero, puede inducir otros tipos de error que, en ocasiones son imposibles o costosos de eliminar (p. ej., al hacer prognosis sobre un mayor número de variables y con un alto nivel de desagregación). Más aún, la eliminación de algunos errores de especificación puede requerir una investigación más profunda sobre el comportamiento de los usuarios, por lo que debe aceptarse que ellos pueden estar presentes en todos los modelos factibles. 3.2.1.5.

Errores de transferencia

Éstos aparecen cuando un modelo que ha sido desarrollado en un contexto (tiempo y/o lugar) se aplica en otro contexto diferente. Aunque se puede realizar algún ajuste para compensar dicha transferencia, en último término se debe tener en cuenta que el comportamiento puede ser diferente en situaciones distintas. En el caso de transferencia espacial, los errores pueden reducirse o eliminarse mediante una re-estimación parcial o completa del modelo para el nuevo contexto (aunque una re-estimación completa implicaría desechar los ahorros sustanciales producidos por la transferencia). Sin embargo, en el caso

MODELOS

DE

TRANSPORTE



de transferencia temporal (p. ej., prognosis), esta re-estimación no es posible y no queda más que aceptar algunos errores potenciales. 3.2.1.6.

Errores de agregación

Aparecen básicamente de la necesidad de realizar prognosis (previsiones) para grupos de personas, mientras que la modelización a menudo se lleva a cabo al nivel del individuo, con objeto de capturar mejor su comportamiento. Las clases más importantes de errores de agregación son: • Agregación de datos. En la mayor parte de los estudios prácticos, los datos utilizados para definir la elección de viaje de los individuos se agregan de una u otra forma. Incluso al preguntar al individuo sobre las características de sus alternativas disponibles, éste sólo puede haber realizado su elección modal basándose en los valores esperados de estas características. Cuando se utilizan modelos de redes, existe agregación en las rutas, horas de salida, e incluso en las zonas; esto significa que los valores de las variables explicativas así obtenidos son, en el mejor de los casos, medias para cada grupo de usuarios, en vez de valores exactos para cada viajero individual. Los modelos estimados con datos agregados tienen algún tipo de error de especificación (ver Daly y Ortúzar, 1990) y su reducción implica la realización de mediciones bajo muchos más tipos de circunstancias: más zonas, más horas de salida, más rutas, más categorías socioeconómicas. Todo esto aumenta el coste y el plazo de ejecución e incrementa la complejidad del modelo. • Agregación de alternativas. Debido de nuevo a consideraciones prácticas, puede ser inviable considerar el espectro completo de alternativas u opciones disponibles para cada usuario. Incluso en casos relativamente más sencillos, tales como la elección modal, aparece algún tipo de agregación ya que, por ejemplo, la gran variedad de servicios que abarca una opción como autobús (autobuses de un piso con conductor, autobuses de dos pisos con dos empleados, minibús, servicios express, etc.), raramente se plantean como opciones separadas. • Agregación del modelo. Puede ocasionar graves dificultades al analista, excepto en el caso de modelos lineales, en los que es un problema trivial. Cantidades agregadas tales como el flujo de tráfico en arcos de la red, son un resultado básico de la modelización en la planificación del transporte, pero los métodos para obtenerlas están sujetos a errores de agregación que



Datos y rol del espacio

son a menudo imposibles de eliminar. Este problema será examinado con cierto detalle en los Capítulos 4 y 9.

3.2.2. Compromiso entre complejidad del modelo y exactitud de los datos Teniendo en cuenta las dificultades expuestas anteriormente, parece razonable considerar el problema dual de cómo optimizar la inversión necesaria para aumentar la exactitud de los datos, a partir de un presupuesto fijo para el estudio y un cierto nivel de complejidad del modelo, para alcanzar un nivel razonable de confianza en la prognosis. Para abordar este problema hay que comprender en primer lugar, la influencia que tienen los errores en las variables de entrada sobre la exactitud de los modelos utilizados. Sean x las variables observadas y ex sus errores asociados (p. ej., desviación típica). Para obtener el error final derivado de la propagación de los errores de las variables de entrada en una función como la siguiente:

z  f ( x1 , x2 , ... , xn ) se puede utilizar la siguiente fórmula: 2

¥u f ´ 2 uf uf ez2 = ¤ ¦ ex + ¤ ¤ ex ex ríj µ i § u xi ¶ i j x i u xi u x j i

i

j

(3.14)

donde rij es el coeficiente de correlación entre xi y xj. La fórmula es exacta para funciones lineales y constituye una aproximación razonable para otros casos. Alonso (1968) la utiliza para postular algunas reglas simples a seguir, con objeto de evitar grandes errores finales durante la construcción de modelos; por ejemplo, una bastante obvia es no utilizar variables correlacionadas ya que de esta forma el segundo término de la parte derecha de la ecuación (3.14) se reduce a cero. Si se toman derivadas parciales de ez respecto a exi y se ignora el término de correlación, se obtiene: 2

uez ¥ uf ´ exi ¦ µ uexi § uxi ¶ ez

(3.15)

MODELOS

DE



TRANSPORTE

Mediante la utilización de estas tasas marginales de mejora y de una estimación de los costes marginales resultantes para mejorar la exactitud de los datos, es posible, en principio, determinar un presupuesto óptimo para mejorar los datos. En la práctica, el problema no es de fácil resolución, entre otras cosas debido a la ley de rendimientos decrecientes (cada porcentaje adicional de reducción en el error de una variable tenderá a costar proporcionalmente más), resultando un complejo proceso iterativo. Sin embargo, de la ecuación (3.15) se pueden deducir dos reglas lógicas: • se debe concentrar el esfuerzo de mejora en aquellas variables que posean un error mayor y • se debe concentrar el esfuerzo en las variables más relevantes, es decir, aquellas que posean un valor superior de la derivada parcial del término (∂f / ∂xi), ya que tienen un mayor efecto sobre la variable dependiente. Ejemplo 3.4: sea el modelo z = xy + w, y las siguientes medidas de las variables independientes: x = 100 ± 10; y = 50 ± 5; w = 200 ± 50 y suponiendo que los costes marginales de mejora de cada medida sean los siguientes: Coste marginal de mejora de la variable x (a 100 ± 9) = $5,00 Coste marginal de mejora de la variable y (a 50 ± 4) = $6,00 Coste marginal de mejora de la variable w (a 200 ± 49) =$0,02 Aplicando la ecuación (3.14) se obtiene:

ez2  y 2 ex2 x 2 ey2 ew2  502.500 donde ez = 708,87. Procediendo análogamente, los valores de mejora de ez en los casos de mejorar x, y ó w son respectivamente 674,54, 642,26 y 708,08. También de la ecuación (3.15) se obtiene: 10y2 ∂ez = = 35,2; ∂ex 708,87

∂ez = 70,5; ∂ey

∂ez = 0,0705 ∂ew

Estos tres últimos valores son las tasas de mejora marginal correspondientes a cada variable. Para obtener las mejoras marginales de ez, se deben dividir los



Datos y rol del espacio

costes marginales de mejora de cada variable por sus tasas de mejora marginales respectivas. Los costes marginales de perfeccionar ez debido a las diferentes mejoras de las variables son los siguientes: Mejora marginal en x = 5/35,2 = $0,142 Mejora marginal en y = 6/70,5 = $0,085 Mejora marginal en w = 0,02/0,0705 = $0,284 A partir de estos valores debería decidirse mejorar la exactitud de medición de la variable y si la reducción marginal en ez fuera al menos de $0,085. Se definamos la complejidad como un incremento en el número de variables del modelo y/o un aumento del número de operaciones algebraicas con dichas variables. Parece obvio que para reducir el error de especificación (es) se debe aumentar la complejidad del modelo. No obstante también es claro que al existir más variables que medir y/o al haber mayores problemas para su medida, el error de medición de los datos (em), también crecerá. 2 2 Si el error total de modelización se define como E  (es em ) , se puede observar que el valor mínimo de E no tiene que estar necesariamente en el punto de máxima complejidad (es decir, máximo realismo). La figura 3.2 demuestra gráficamente no sólo que ello es cierto intuitivamente, sino también que según se incrementa el valor del error de medición, el valor óptimo únicamente puede alcanzarse con niveles decrecientes de complejidad del modelo.

Error

E

em

es Complejidad

Figura 3.2. Variación del error con la complejidad.

MODELOS

DE



TRANSPORTE

Ejemplo 3.5: sea una situación en la que se debe elegir entre un modelo extremadamente simple, del cual se conoce que el error total en la prognosis es del 30%, y un nuevo modelo que posee una especificación perfecta (es decir es = 0), dado por: z = x1 x2 x3 x4 x5 donde las variables xi son independientes y tienen un error de medición del 10% (es decir, em = 0,1xi). Para decidir qué modelo es más conveniente, se puede aplicar la ecuación (3.14):

ez2  0 ,01 ¨ª x12 ( x2 x3 x4 x5 )2 x22 ( x1 x3 x4 x5 )2 L x52 ( x1 x2 x3 x4 )2 ·¹ 2

ez2  0 ,05 ¨ª x1 x2 x3 x4 x5 ·¹  0 ,05z 2 es decir, e z = 0,22z o lo que es lo mismo, un error del 22%, en cuyo caso se elegiría el segundo modelo. Es interesante mencionar que repetir los cálculos anteriores en una situación donde los errores de medición fuesen más elevados, produciría resultados diferentes. El lector interesado puede comprobar que si se asume que las variables xi sólo pueden ser medidas con un error del 20%, el error total del segundo modelo aumenta hasta el 44,5%, en cuyo caso se elegiría el primer modelo (incluso si su error total aumentara hasta el 44%). La figura 3.3 ilustra este fenómeno, que puede resumirse de la siguiente forma (Alonso, 1968): si los datos no son de muy buena calidad, puede ser Error E* e*m E em

es Países pobres Países ricos

Figura 3.3.

Complejidad

Influencia del error de medición.



Datos y rol del espacio

más conveniente realizar la prognosis con modelos más sencillos y robustos. Sin embargo, para aprender y entender el fenómeno, es siempre preferible un modelo con mejor especificación. Por otro lado y como se sabe, la mayor parte de los modelos son utilizados para efectuar prognosis, de forma que los valores de las variables de planeamiento xi no son observadas sino estimadas. Es cierto que algunas variables de planeamiento son más fáciles de proyectar que otras y que la desagregación hace aún más incierta la tarea de predecir sus valores futuros. Por tanto, al elegir un modelo para su utilización en la prognosis futura, se debe dar especial preferencia a aquellos en los que las variables de planeamiento puedan ser proyectadas con un nivel de confianza superior.

3.3.

MÉTODOS DE RECOLECCIÓN DE DATOS

3.3.1.

Consideraciones prácticas

La determinación del enfoque de recolección de datos más apropiado para una situación dada, está fuertemente influenciada por limitaciones prácticas. El diseño de una encuesta no es una tarea simple y requiere considerable experiencia y habilidad. Se remite al lector al muy buen libro de Moser y Kalton (1989 y 1971) para información básica sobre temas relativos a la contratación de encuestadores, entrenamiento de los mismos, diseño de cuestionarios, supervisión y control de calidad. También se puede encontrar información sobre procedimientos de encuesta con aplicaciones específicas a la planificación de transportes, en el libro de Stopher y Meyburg (1979). A continuación se tratarán someramente algunas de las restricciones prácticas más usuales en estudios de transporte. 3.3.1.1.

Duración del estudio

Obviamente tiene gran importancia ya que determina indirectamente el tiempo y el esfuerzo que es posible dedicar a la etapa de toma de datos. Es muy importante lograr un estudio bien equilibrado (en cuanto a sus distintas etapas), evitando el problema demasiado frecuente de que la mayor parte del presupuesto (y tiempo) sea utilizado en la toma de datos, análisis y validación (ver Boyce et al., 1970). 3.3.1.2.

Horizonte del estudio

Hay dos tipos de situaciones que se pueden considerar a este respecto:

MODELOS

DE

TRANSPORTE



• Si el año de diseño es muy cercano al año base, como sucede en los estudios tácticos de transporte, no existirá mucho tiempo para llevar a cabo el trabajo. Esto probablemente implicará la utilización de un tipo particular de herramienta de análisis, que tal vez requiera datos de algún tipo especial. • En los estudios estratégicos de transporte, por otra parte, el horizonte habitual es de 20 años o más hacia el futuro. Aunque, en principio, esto permite tener tiempo para la utilización de cualquier tipo de herramienta analítica (con su trabajo de campo asociado), también significa que los errores en la prognosis sólo se conocerán al cabo de 20 años o más. Se debe tender entonces hacia la flexibilidad y la adaptación, si se desea implantar un proceso exitoso de seguimiento y reevaluación. 3.3.1.3.

Límites del área de estudio

Es importante aquí olvidarse de los límites políticos formales (p. ej., municipio, distrito) y centrarse en el área de interés total. Es también necesario distinguir entre área de interés y área de estudio definida en las bases del proyecto. La primera es normalmente más grande ya que se espera que el área de estudio se desarrolle en un período de unos 20 años. La definición del área de estudio depende tanto del tipo de políticas a examinar como de la toma de decisiones prevista. Se insistirá sobre este punto más adelante. 3.3.1.4.

Recursos dedicados al estudio

Es necesario conocer lo más claramente posible y con el nivel más profundo de detalle, cuántas personas y de qué nivel estarán disponibles para el estudio. También hay que conocer, qué recursos informáticos estarán disponibles y qué restricciones existirán para su uso. En general, el tiempo y los recursos disponibles deben ser acordes con la importancia de las decisiones que van a ser tomadas a partir de los resultados del estudio. Cuanto mayor sea el coste de una decisión equivocada, mayores deben ser los recursos que hay que dedicar para lograr que la decisión sea tomada correctamente. Otros tipos posibles de restricciones van desde las puramente físicas (p. ej., dimensión y topografía de la localidad), hasta restricciones sociales y medioambientales (p. ej., resistencia de la población a responder cierto tipo de preguntas) que necesitan tenerse en cuenta por su influencia en el diseño muestral. Una consideración práctica general es que los viajeros son reacios a contestar “otro cuestionario más”. La respuesta a encuestas consume tiempo y muchas



Datos y rol del espacio

veces puede ser considerada como una cierta intromisión de la privacidad. Ello puede traer como consecuencia que el encuestado simplemente rehúse a contestar o bien que ofrezca respuestas simplistas pero creíbles, lo que es aún peor. En muchos países es necesario obtener permiso de las autoridades antes de realizar cualquier encuesta que implique algún tipo de molestia a los viajeros.

3.3.2.

Tipos de encuestas

Durante los sesenta y hasta la mitad de los setenta se llevaron a cabo un gran número de encuestas domiciliarias origen-destino (O-D) en áreas urbanas de países industrializados y en muchas ciudades importantes de países en desarrollo, utilizando técnicas de muestreo aleatorio simple. Este gran esfuerzo era muy costoso, y demandaba a su vez, enormes cantidades de tiempo (un problema en la recogida de gran cantidad de información es que debe dedicarse también mucho tiempo y dinero a su análisis); de hecho como ya se ha señalado, la fase de toma de datos consume tradicionalmente una parte vital de los recursos disponibles para estos estudios dejando, en muchos casos, poco tiempo y dinero para las tareas cruciales de preparación y evaluación de planes. En muchas áreas urbanas, y en particular en las grandes áreas metropolitanas, la recolección de datos de viajes juega un papel destacado en este tipo de estudios. En algunos casos estos datos son adquiridos principalmente para ser utilizados en las previsiones y, posteriormente, en la modelización; mientras en otros casos los datos son utilizados mayoritariamente para representar un cuadro más rico de la situación existente. El conocimiento de cómo se utilizarán los datos es uno de los puntos clave en la determinación de la metodología de cualquier encuesta de viajes. Por ejemplo, los modelos basados en actividades (Beckman et al., 1995) requieren, no sólo grandes cantidades de datos sobre las actividades que desarrolla la gente sino también sobre la “infraestructura” de actividades (p. ej., el horario de apertura de los comercios). En todo caso, la utilización normal de los datos de una encuesta de movilidad es proporcionar las bases para realizar previsiones más exactas, típicamente mediante modelos de planificación estratégica. En esta situación, los datos clave son los viajes entre orígenes y destinos más que los elementos que determinan este comportamiento, y de ahí el término estudios de “origen-destino”. Los requisitos de una buena metodología de encuestas son: un diseño, muestreo y análisis del estado del arte, coste-eficacia y fiabilidad para pre-

MODELOS

DE

TRANSPORTE



decir en el medio y largo plazo. También, dado que la mayor parte de sus usos se relacionan con el transporte, la mejor práctica actual sugiere que el banco de datos debería tener las siguientes características: • Los datos deben ser recolectados considerando las diferentes etapas del viaje, asegurándose de que es posible relacionar modos específicos a diferentes localizaciones, diferentes horarios del día y longitudes de viajes. • Han de incluirse todos los modos de viaje, incluso los no motorizados. • Los datos sobre los propósitos o motivos de los viajes deben recolectarse a nivel altamente desagregado. • El período temporal de referencia debe ser lo más amplio posible y enteramente cubierto, por ejemplo, 24 horas en un día, siete días en una semana y quizás 365 días al año (a fin de cubrir las cuatro estaciones anuales). • Los datos relevantes han de ser relativos a todos los miembros de la familia. • Los datos tienen que ser de elevada calidad y suficientemente robustos como para poder ser utilizados a nivel disgregado (Daly y Ortúzar, 1990). • Deben ser utilizados sistemas de recolección integrales que comprendan tanto encuestas en hogares como datos referentes al origen-destino que provengan de otras fuentes como encuestas en cordón. Desdichadamente, la recolección de datos a través de este método, que propicia un alto nivel de exactitud, no es tarea simple y a menudo es obstaculizado por la dificultad de convencer en las entrevistas a un conjunto suficientemente amplio de individuos, a que participen en este esfuerzo. Por tanto, en función de los objetivos de la modelización (es decir, análisis estratégico versus estudios detallados de planificación táctica), e1 analista puede decidir simplificar la carga sobre los entrevistados contentándose con adquirir información menos detallada. 3.3.2.1.

Ámbito de la encuesta

La figura 2.4 puede ser útil a la hora de describir el ámbito de referencia de un estudio para capturar todos los viajes que afecten a un área metropolitana. Ante todo es necesario definir el área de interés del estudio. Su límite exterior es conocido como cordón externo. Una vez que éste ha sido definido, el área se subdivide en zonas (se verán algunas reglas básicas sobre la zonificación en la sección 3.4) para disponer de una idea clara y espacialmente desagregada sobre los orígenes y destinos de los viajes, de forma que variables como la población y el empleo puedan ser cuantificadas espacialmente.



Datos y rol del espacio

Viajes con origen y destino externo al área Hogares

Desplazamientos de los residentes

Desplazamientos de los no-residentes entrando y saliendo del área de estudio

Figura 3.4. Alcance y recolección de datos para una encuesta OD en un área metropolitana.

El área fuera del cordón externo también debe ser subdividida en zonas pero con un nivel de detalle más bajo (zonas más amplias). En el interior del área de estudio también pueden existir cordones internos y líneas pantalla (es decir, una subdivisión ficticia que siga límites naturales o artificiales en los que existan pocos cruces para atravesarlos, como pueden ser un río o una línea ferroviaria), cuyos objetivos serán discutidos a continuación. No existen reglas simples y rápidas para decidir la localización del cordón externo y, por ende, qué áreas deberían ser consideradas como externas al estudio; eso depende del ámbito y de los niveles de decisión adoptados para el estudio, es decir, es un problema sumamente contextual. De la figura 3.4 se deduce que son necesarios los siguientes datos: • Encuestas domiciliarias: deben obtenerse los desplazamientos efectuados por todos los miembros de la familia en todos los modos de transporte, tanto dentro del área de estudio como entrando y saliendo de dicha área, durante el período temporal de referencia. Asimismo, esta investigación también debería incluir información socio-económica (renta, posesión de coche, tamaño y estructura de la familia, etc.). Esta información es muy eficiente para generar datos que permitan la estimación de modelos de generación de viajes así como de elección modal; además, los datos sobre los desplazamientos de los hogares proporcionan buena información sobre la distribución de la longitud de los viajes en la ciudad, que es un elemento importante para la estimación de los modelos de distribución de los viajes. • Encuestas de interceptación, cordón externo: proporcionan datos relativos a las personas que atraviesan los límites del área de estudio, en par-

MODELOS

DE

TRANSPORTE



ticular sobre las no domiciliadas en el área objetivo. Estos datos también pueden ser utilizados para verificar y ampliar la información relativa a los viajes de la encuesta a hogares que atraviesan el área de estudio, dado que la cantidad de datos recogidos (número de personas que responden) generalmente es muy reducida incluso en una encuesta amplia. Estas encuestas de interceptación son muy breves y, normalmente, se realizan en puntos “a pie de calle” interceptando los desplazamientos de llegada/ salida del área de estudio, por ejemplo, a la vera del camino para conductores de coches (un buen sitio para una encuesta rápida es aquél en el que el coche ha de parase por obligación: cruces, semáforos, etc.), en medios de transporte público o en puntos de intercambio modal (p. ej., aeropuertos). • Encuestas de interceptación en cordones internos y en líneas pantalla: éstas se utilizan para medir los viajes de los no-residentes y también para verificar, en parte, la validez de los datos obtenidos de las encuestas domiciliarias. Estos datos son importantes entradas para otros modelos. • Conteos de tráfico y personas: los conteos proporcionan información de verificación. La integración de esta información en la metodología de encuestas será discutida más abajo. • Otras informaciones: para construir modelos robustos capaces de realizar eficientes previsiones, especialmente en áreas metropolitanas, también es importante contar con una metodología de encuestas que permita la integración de datos, que tengan su influencia sobre el comportamiento de viajes (Richardson et al., 1995). En esta categoría se incluyen: – Inventario de datos relativos al uso del suelo, zonas residenciales (densidad de viviendas), zonas comerciales e industriales (por tipología de empresa), inventario de aparcamientos, etc.; estos datos son particularmente útiles para la estimación de modelos de generación de viajes. – Inventario de datos relativos a las infraestructuras y a los servicios existentes (redes de transporte público y privado, tarifas, frecuencia, etc.; ubicación y ciclos semafóricos): medición de flujos de tráfico (aforos), velocidades y tiempos de viaje para construir curvas flujo-velocidad, lo cual no es una tarea simple. Estos datos son esenciales también para la calibración de modelos, especialmente los modelos de distribución y asignación. – La información de encuestas especiales sobre actitudes y elasticidades de la demanda (es decir, Preferencias Declaradas y otros métodos).



Datos y rol del espacio

Cada uno de estos componentes de encuesta requiere un detallado diseño junto con una cuidadosa selección de la estrategia de muestreo. A continuación se ahondará en el diseño metodológico completo y se proporcionarán indicaciones sobre las medidas necesarias para integrar los diferentes componentes de la encuesta. 3.3.2.2.

Encuestas O-D

Aunque las encuestas O-D más complicadas y costosas son las domiciliarias, también son las que ofrecen, por lo general, la posibilidad de obtener información más útil. A veces el interés no se centra en la recogida de datos para un sistema completo de modelos sino sólo para algunas partes del mismo: el caso más típico es el de elección modal y asignación en estudios a corto plazo. Un método interesante, particularmente recomendable para estudios de viajes en corredores por motivo trabajo, y que ha sido probado eficientemente en la práctica, es la realización de encuestas en el lugar de trabajo (ver Dunphy 1979, Ortúzar y Donoso, 1983). Este tipo de encuestas implica solicitar permiso a una muestra de instituciones y/o empresas en, por ejemplo, el Área Central de Negocios (CBD) para entrevistar a una muestra de sus empleados. En ciertos casos ha resultado muy eficiente solicitar que la muestra distribuya según el lugar de residencia del trabajador (p. ej., aquellos que viven en un determinado corredor). Cabe destacar que, contrariamente al caso de las encuestas aleatorias domiciliarias, los datos obtenidos por este método están basados en la elección del destino; no obstante son aleatorios respecto al modo de transporte. Todo lo que se muestra a continuación hace referencia principalmente a las encuestas domiciliarias, aunque la mayor parte de los aspectos generales y especialmente el diseño de instrumentos de medida son aplicables a cualquier otro tipo de encuestas O-D. Consideraciones generales. Es ampliamente reconocido que los procedimientos e instrumentos de medida utilizados en la recogida de información in situ tienen una influencia directa y profunda en los resultados que se desprenden de cualquier trabajo de toma de datos. Ésta es la razón por la que se recomienda incluir el procedimiento de medición como otro elemento a considerar explícitamente en el diseño de cualquier proyecto que requiera datos empíricos para su desarrollo. Wermuth (1981), por ejemplo, realizó incluso una categorización de las distintas fases involucradas en un procedimiento

MODELOS

DE

TRANSPORTE



de medición. En esta parte se hará referencia sólo a dos de estas categorías: el desarrollo y la utilización de instrumentos de medición diseñados para medir los patrones de actividad fuera del domicilio. Se ha mencionado anteriormente que la medición empírica del comportamiento de viajes es uno de los principales inputs en el proceso de toma de decisiones para la planificación de transporte urbano. De hecho, constituye la base para la formulación y estimación de modelos que expliquen y predigan actividades de viajes futuros. Por esta razón las deficiencias metodológicas en esta fase tienen repercusiones directas sobre las sucesivas fases del proceso de planificación de transporte. Las críticas más frecuentes que aparecen sobre las encuestas O-D domiciliarias o en los lugares de trabajo son: • Las encuestas únicamente miden el comportamiento promedio (y no el real) de los viajeros. • Solamente se puede investigar una parte de los desplazamientos de las personas. • La información (p. ej., respecto de los tiempos de viaje) suele ser mal estimada por el entrevistado. De hecho, se ha constatado que los resultados provenientes de encuestas O-D tradicionales (p. ej., variables relativas a tiempos, distancias y costes de viajes) han resultado inadecuados al compararlos con los valores medidos de forma objetiva. Esto es, se ha detectado que las características reportadas referentes al comportamiento respecto a viajes han tendido a diferir de forma sustancial con la realidad, a pesar de que las personas que contestan las encuestas experimentan los valores “reales” de estas características de nivel de servicio dos veces al día. También se ha demostrado que los sesgos tienen naturaleza sistemática y están aparentemente relacionados con las actividades del usuario respecto a cada modo de transporte. Por ejemplo, en el caso del transporte público, los tiempos de acceso, espera y trasbordo (que son aparentemente bastante molestos) tienden a ser severamente sobreestimados. Es importante destacar que desde un punto de vista conceptual estos resultados indicarían que la percepción subjetiva hacia las variables de nivel de servicio constituye un determinante importante en la elección modal (discusión de Ortúzar et al., 1983). Un análisis metodológico de estas críticas conduce a dos conclusiones evidentes. En primer lugar la información sobre los comportamientos en relación



Datos y rol del espacio

a los viajes no debería recolectarse (preguntarse) de manera general (esto es, en términos de valores promedio), sino haciendo alusión a un hito temporal de referencia concreto. En segundo lugar, no es recomendable examinar aisladamente las diversas actividades sino que debería considerarse el patrón de actividades completo como base para el análisis. Por ejemplo, puede demostrarse que preguntar por las horas de comienzo y finalización de un viaje produce resultados más precisos que preguntar sobre su duración total (Ampt, 1981). Este análisis crítico ha producido dos importantes consecuencias: • Una mejora sustancial de los procedimientos de medición asociados a las encuestas domiciliarias y otras O-D, que ha permitido superar la mayor parte de las deficiencias antes mencionadas (Brög y Ampt, 1982). • El desarrollo de métodos de recolección alternativos o complementarios, tales como el diario de viajes, que se discutirá brevemente más adelante. Un proceso de adquisición continua de datos. El enfoque contemporáneo de recolección de datos OD a través de encuestas domiciliarias señala que la información debe ser obtenida para cada día de la semana durante el año completo y durante varios años sucesivos (Richardson et al., 1995). Por otro lado y con el objetivo de permitir la utilización de datos que puedan ser utilizados a cualquier nivel de agregación y para no depender de un sistema estándar de zonificación, la metodología también recomienda que la información correspondiente a orígenes y destinos sea geocodificada. La recolección de datos para cada día de un determinado año permite capturar variaciones estacionales tales como la diferencia entre los días de la semana y del fin de semana. Por lo tanto el enfoque presenta numerosas ventajas: • Permite medir las variaciones de la demanda en el tiempo y, en particular, correlacionar estos cambios con cambios de la oferta del sistema. • Ya que los entrevistados sólo informan sus datos para uno o dos días, su tarea es más simple y fiable, y al mismo tiempo proporciona datos con respecto a un período de tiempo más largo. • Como el estudio se extiende a lo largo de un año se consiguen costes operativos más bajos. • Permite un mejor control de calidad. Por otra parte, al recomendar este nuevo enfoque, se debe también reconocer la aparición de algunos problemas específicos de diferentes casos, los cuales deben ser por tanto, considerados. Por ejemplo:

MODELOS

DE

TRANSPORTE



• Es necesario esperar un año al menos, antes de que se tengan datos suficientes para alcanzar los objetivos planteados en el estudio (típicamente un modelo estratégico completo). • Si se emplean encuestadores, es necesario mantenerlos motivados por un largo período de tiempo. • Es pertinente desarrollar procesos de ponderación de los datos que tengan en cuenta las variaciones estacionales. • Es menester desarrollar métodos especiales de ponderación de los datos anuales al combinar datos de encuestas continuas. Más adelante se discutirá este tema. Actualización periódica de matrices y modelos. Las matrices y los modelos asociados a sistemas de adquisición continua de datos deberían ser puestos al día periódicamente para maximizar el beneficio de contar con información continua. Así, aunque sea posible elaborar matrices parciales de viajes debido a exigencias particulares, las matrices y los modelos para el área completa de estudio no deberían ser puestos al día más de una vez cada 12-18 meses, en función del tipo de ciudad en estudio. Implicaciones sobre la recolección de datos. Puede ser que la puesta al día periódica de modelos y matrices O-D tenga efectos sobre la recolección de los datos. Por ejemplo, ¿qué información es más sensible para la puesta al día? En este contexto, pueden existir varios elementos que merece la pena actualizar periódicamente: • Los modelos de generación y atracción de viajes. • Las matrices O-D que reflejan el crecimiento diferencial de determinadas zonas del área de estudio. • La distribución o reparto modal, incluyendo los modos no motorizados, que refleja el posible impacto de diferentes políticas de transporte. • Los niveles de servicio (tráfico) en diferentes puntos de la red, ya que permiten la identificación de crecimientos diferenciados en las redes primarias, secundarias, de acceso y locales. • La posesión de coche y las tendencias de crecimiento de las familias en determinados municipios de las ciudades. La prioridad asociada a cada uno de estos indicadores dependerá del tipo de política de transporte considerada así como de la necesidad de hacer el



Datos y rol del espacio

seguimiento de sus efectos y de las necesidades generales de modelización. También dependerá de los valores esperados de sus tasas de variación, de su importancia y de los costes asociados a la adquisición de datos para su puesta al día, incluido el coste social de posibles molestias a los usuarios del sistema de transporte (DICTUC, 1998). Además es importante destacar la conveniencia de tener en cuenta otros tipos de modelos que, probablemente pueden ser necesarios en el futuro, como los modelos de elección de la hora (del día) del viaje o los modelos dinámicos. Por otra parte, la disponibilidad de datos adquiridos de forma continua, permite realizar el seguimiento del comportamiento de los usuarios con respecto a posibles intervenciones radicales en el sistema de transporte. Algunos ejemplos son: las situaciones de emergencias medioambientales en las que se incrementan las restricciones de los accesos vehiculares al centro, trabajos en los principales viales, huelgas en el transporte, variaciones en el precio del carburante, en las tarifas de los buses y en los costes del aparcamiento. La respuesta a tales políticas (previsibles o no tanto) proporciona información de base acerca de los umbrales del comportamiento de los usuarios y crea un banco de datos temporal que debería facilitar el desarrollo de modelos más sofisticados. Diseño y formato del cuestionario. Desde el momento en que uno de los objetivos del muestreo es conseguir la tasa más alta posible de respuestas, para minimizar el sesgo de no-respuesta, se recomienda utilizar métodos mixtos de recolección de datos es decir, encuestas de auto-llenado y entrevistas personales (Goldenberg, 1996). En particular el sistema de auto-llenado parece más apropiado en los barrios donde las personas tienen mayor costumbre de “rellenar cuestionarios” (convalidándose con entrevistas personales posteriores), o donde los hogares no puedan ser contactados sin una previa llamada de seguridad, siendo ésta la causa por la que los intentos de realizar entrevistas personales tienen bajas tasas de respuesta. Esta combinación aprovecha el coste-eficacia de los formularios de auto-llenado de alta calidad y minimiza la carga de respuesta de los entrevistados (Richardson et al., 1995). En términos de formato, el orden en el que se formulan las preguntas, busca minimizar la resistencia a responder del encuestado, por lo que las preguntas difíciles (p. ej., las relacionadas con el ingreso) son formuladas al final de la entrevista. En cuanto a su aspecto formal, el instrumento de medición (y cualquier entrevista personal) debería tratar de satisfacer los siguientes criterios: • Las preguntas deben ser simples y directas.

MODELOS

DE

TRANSPORTE



• Debe minimizarse el número de preguntas abiertas (no precodificadas). • La información sobre los viajes debe incluir el motivo del viaje. También es interesante recopilar datos sobre todas las etapas del desplazamiento (p. ej., todos los movimientos sobre la vía pública), para asegurar que los análisis posteriores permitan relacionar modos específicos con localizaciones específicas, horarios del día, longitudes de desplazamiento, etcétera. • A causa del crecimiento de modos diferentes al coche, la búsqueda de información debe referirse a todos los modos de viaje, incluidos aquellos no motorizados. • Debido a la creciente importancia de los desplazamientos independientes por parte de los niños y de los modos no motorizados (ver punto anterior), todas las personas de la familia deberían ser incluidas en la encuesta incluyendo a los miembros que no pertenezcan a la familia, como, por ejemplo, los trabajadores que realizan labores domésticas puertas adentro, que son típicas de países en vías de desarrollo. • Para facilitar la tarea de recordar todos los desplazamientos de los encuestados, se recomienda utilizar un marco de recuerdo de actividades, es decir, el que las personas recuerden los viajes efectuados en el contexto de las actividades realizadas, ha demostrado que resulta ser de mucha mayor exactitud en la medición de los viajes (Stopher, 1998). • Como las personas tienen dificultad en recordar actividades infrecuentes o discrecionales, aunque sean recientes, se recomienda asignar uno o más días de viaje a cada familia y solicitarles que registren los viajes realizados en dichos días en los diarios de viaje; así, en los días anteriores a la realización de la encuesta, deberían entregarse breves diarios de viaje para los días asignados y la información registrada en ellos ha de ser facilitada al entrevistador al final de éstos (o lo antes posible), en el nivel de detalle requerido en la encuesta. El instrumento de encuesta debe ser diseñado de forma que minimice la carga del entrevistado y que logre la máxima tasa de respuesta y, por tanto, la mayor robustez de los datos: • En el diseño de encuestas de auto-llenado se necesita focalizar la atención sobre el formato completo del formulario porque éste representa el único contacto con los entrevistados. El formato tiene que ser claro y conciso y en general debería guiar a los entrevistados a través de las diferentes preguntas. Los formatos generalmente deben ser diseñados con el fin de animar a



Datos y rol del espacio

responder a cada entrevistado sin importar si están acostumbrados a rellenar cuestionarios. • El valor de las entrevistas personales está en el hecho de que para los encuestados es fácil contestar. Por lo tanto, en este punto es clave el entrenamiento de los entrevistadores, para que comprendan el contexto de estudio y para asegurar que el diseño de la encuesta es simple de administrar para ellos. Para ambos tipos de encuestas domiciliarias (entrevista personal y autollenado) se recomienda que la investigación sea dividida en dos partes: (1) identificación y características de los individuos y de los hogares y (2) datos sobre los viajes. Se comenta, brevemente, a continuación, la información a adquirir en cada uno de los dos puntos citados: • Características e identificación de los individuos y de los hogares: esta parte incluye aquellas preguntas dirigidas a clasificar a los miembros de la familia en relación a su posición respecto al jefe de familia (p. ej. mujer, hijo), y posteriormente información acerca del sexo, la edad, la posesión de permiso de conducir, el nivel de estudio y la ocupación. Al objeto de reducir la posibilidad de clasificaciones subjetivas es importante definir un conjunto completo de ocupaciones laborales (cuando se trata de encuestas no domiciliarias éstas conciernen sólo a las personas entrevistadas, sin embargo las preguntas relevantes son las mismas o similares). En esta parte también se incluyen preguntas para conocer la situación socio-económica de los hogares, como, por ejemplo, las características de la vivienda, la identificación de los vehículos del hogar (incluyendo un código para identificar a sus habituales usuarios), la posesión de la vivienda y el ingreso familiar. • Datos de viajes: esta parte de la encuesta tiene por objetivo detectar y caracterizar todos los viajes hechos por los miembros de la familia, identificados en la primera parte. Un viaje se define como cualquier desplazamiento fuera de un edificio o local con un propósito dado; pero la información que se necesita considera los viajes por etapas, donde una etapa se define por un cambio de modo (incluyendo el modo andando). Cada etapa está caracterizada por una serie de atributos tales como el origen y destino (expresado normalmente por su intersección vial más cercana o el código postal, si se conoce), propósito o motivo de viaje, hora de inicio y fin del viaje, modo utilizado, coste del viaje, etcétera. Definición del marco muestral. El ámbito de las encuestas de movilidad normalmente incluye a todos los viajeros del área de estudio (Figura 3.4). Por

MODELOS

DE

TRANSPORTE



lo tanto, incluye no sólo a los residentes sino también a visitantes de los hogares y a los que pernoctan en hoteles, y otras personas que no residan en viviendas privadas (como hospitales) así como a los viajeros que atraviesan el área de estudio en los días de la encuesta. Una vez que el ámbito de la investigación ha sido definido, es necesario determinar el marco muestral. En otras palabras, qué tipo de lista podría proporcionar la información correspondiente a todos los residentes, visitantes y personas que circulan a través del área, para así elegir una muestra de dichas personas y de sus viajes respectivos. Aunque hay varias alternativas, el marco muestral de hogares, si bien complejo, es normalmente el más directo. Si existe información censal actualizada y se dispone de una base de datos sobre todas las viviendas, esto puede ser perfecto; alternativamente, podría utilizarse un listado de direcciones del área completa (llevada a cabo por otras razones, por ejemplo, por una compañía de suministro de servicios o por anteriores encuestas), a condición de que estén al día. Por otra parte, escoger un marco muestral para los viajes de los no-residentes es más complicado, por lo que es recomendable que esto se haga de la siguiente forma: • Consígase una lista de las viviendas no-privadas y seleccionar una muestra (posiblemente estratificada por tamaño o por tipo de huésped o visitante). • Obténgase una lista de las estaciones de intercambio de los diferentes modos de transporte público que representen el probable punto de llegada y salida del área metropolitana (p. ej., aeropuertos, estaciones ferroviarias, estaciones de autobuses de largo recorrido). Idealmente ello proporcionará una muestra de viajes, en cada punto de interceptación, aunque en algunos casos puede que sólo sea necesario utilizar una muestra de todos los puntos. • Localícese y confórmese una lista con todos los puntos que sean cruces de carreteras o viales en el cordón externo al área. Entonces y tal y como en el caso anterior, deberían incluirse todos los cruces, aunque en algunos casos puede que también sea necesario muestrearlos. Tamaño de la muestra. Las encuestas sobre viajes siempre están basadas en algún tipo de muestreo. Sin embargo, aunque fuera posible entrevistar a todos los viajeros sobre un servicio específico en un día dado, ésta sólo sería una muestra de los viajeros que realizan viajes en una semana dada, mes o año. El desafío en el diseño de muestras consiste en identificar estrategias de muestreo y tamaños muestrales que permitan alcanzar conclusiones razonables



Datos y rol del espacio

y modelos fiables e insesgados, sin gastar excesivos recursos en la adquisición de los datos. A menudo existe más de una manera de adquirir la información relevante. Para algunos datos puede ser posible obtener información a través de encuestas domiciliarias y/o a través de encuestas de interceptación. En estas situaciones lo mejor es utilizar el método que permita obtener los datos más precisos al más bajo coste (DICTUC, 1998). Hoy en día se acepta que, seleccionar un tamaño de muestra óptimo tal que sus datos puedan ser utilizados eficazmente en todos sus usos potenciales, es prácticamente imposible. El tamaño de muestra óptimo normalmente está restringido por su coste, y por lo tanto es necesario decidir cuáles son las variables más importantes a adquirir para que dicho coste no exceda el presupuesto disponible. Como el uso final de los datos obtenidos es servir de entrada para los diferentes modelos y tipologías de análisis, no es posible definir un único output como más importante que otros, por ello no es posible establecer un criterio natural de optimización del problema. Además, como normalmente se tienen múltiples usuarios y objetivos así como diferentes tipos de instrumentos de encuesta, la tarea de optimizar el tamaño muestral parece no sólo impracticable sino sencillamente imposible. Tradicionalmente se han realizado encuestas domiciliarias O-D a partir de muestras aleatorias muy grandes. La tabla 3.1 muestra los valores que han sido recomendados en encuestas realizadas durante más de 20 años (ver Bruton, 1985), pero que son raramente utilizados en la práctica. Tabla 3.1.

Tamaños muestrales recomendados en encuesta tradicionales

Población del área

Tamaño de la muestra (viviendas) Recomendado

Mínimo

Menos de 50.000

1 de 5

1 de 10

50.000-150.000

1 de 8

1 de 20

150.000-300.000

1 de 10

1 de 35

300.000-500.000

1 de 15

1 de 50

500.000-1.000.000

1 de 20

1 de 70

Más de 1.000.000

1 de 25

1 de 100

Los problemas creados por estas enormes muestras han sido empeorados porque muchos organismos, especialmente en países en vías de desarrollo,

MODELOS

DE

TRANSPORTE



creen que estos tamaños son esenciales y por lo tanto requieren muestras hasta 20% más grandes para afrontar pérdidas eventuales debidas a la validación de los datos (ver Gárate, 1988). Los métodos para estimar el tamaño de la muestra a partir de un enfoque estadístico más lógico y con mayor aprovechamiento, requieren el conocimiento de la variable a estimar, su coeficiente de variación y la exactitud de medición deseada, así como el nivel de significación asociado a la misma. El primer requisito, aunque obvio y fundamental, ha sido ignorado muchas veces en el pasado. La mayoría de las encuestas domiciliarias O-D se han diseñado a partir de objetivos demasiado generales, tales como “reproducir los patrones de viaje del área”. ¿Qué significa esto? ¿Son los elementos de la matriz O-D los que se buscan y, si éste es el caso, ¿se desean por motivo, por modo y hora del día, o solamente son de interés los grandes flujos de viajes entre macrozonas? Si se quieren obtener únicamente tasas de generación de viajes, se puede demostrar que muestras compuestas por unos mil individuos garantizan un 5% de tolerancia (error) y un 90% de confianza en los valores. La situación cambia drásticamente si se centra el interés en el número de viajes de cada celda de una matriz O-D típica (esto es con muchas zonas; obviamente el nivel de detalle afecta). Por ejemplo, si cada celda tiene alrededor de 1.000 viajes, una muestra del 4,3% garantiza errores de menos del 25% con un 90% de nivel de confianza. Sin embargo, para volúmenes de 20 ó 30 viajes entre zonas, que son muy comunes en la práctica, el mismo nivel de exactitud requeriría muestras del 100% (esto es, toda la población). El ejemplo anterior demuestra que la elección del tamaño muestral no es una tarea fácil. En primer lugar, es necesario que los objetivos de la encuesta estén suficientemente claros, y en segundo lugar, se debe tomar una decisión sobre el esfuerzo (generalmente económico) que se va a dedicar para alcanzar un grado de exactitud concreto en los resultados (Brög y Ampt, 1982). El segundo elemento (coeficiente de variación de la variable que va a ser medida) solía ser una incógnita en el pasado, pero actualmente puede estimarse a partir de la información obtenida del gran número de encuestas domiciliarias O-D que se han llevado a cabo en años recientes. Finalmente, el nivel de exactitud (porcentaje de error aceptado por el analista) y su nivel de confianza son conceptos dependientes del contexto que el analista debe especificar en base a su experiencia personal. Cualquier muestra puede llegar a ser muy grande si el nivel de exactitud requerido es demasiado estricto. Puede decirse que,



Datos y rol del espacio

en este aspecto, es donde descansa el “arte” de la determinación del tamaño muestral. Una vez que se conocen estos factores, el tamaño de la muestra (n) puede calcularse utilizando la siguiente fórmula (M.E. Smith, 1979):

n

CV 2 Z2 E2

(3.16)

donde CV es el coeficiente de variación, E es el nivel de exactitud (expresado como proporción) y Zα es el valor de la variable Normal estandarizada (N(0,1)) para el nivel de confianza (α) requerido. Ejemplo 3.6: se desea medir el número de viajes por hogar de una determinada área, y se tienen datos sobre el coeficiente de variación de esta variable para varias localidades de los Estados Unidos, según la siguiente tabla: Área

CV

Media para Estados Unidos (1969)

0,87

Pennsylvania (1967)

0,86

New Hampshire (1964)

1,07

Baltimore (1962)

1,05

Por conveniencia y dado que todos los valores son próximos a la unidad, se elige CV=1. Como se ha mencionado anteriormente, la decisión a adoptar sobre la exactitud y el nivel de confianza es la más complicada. La ecuación (3.16) señala que si se escogen niveles muy estrictos, el tamaño de muestra se incrementa exponencialmente. Por otra parte, es conveniente fijar niveles estrictos para este caso, ya que el número de viajes por hogar es una variable crucial (si este número se estima pobremente, la exactitud de los modelos posteriores podría verse gravemente afectada). En este ejemplo se elige un 0,05 de exactitud con un nivel de confianza del 95%. Para α = 95%, el valor de Zα es de 1,645, por lo que se obtiene: n = 1,0 (1,645)2 / (0,05)2 = 1.084 es decir, sería suficiente tomar una muestra de aproximadamente 1.100 observaciones para asegurar tasas de generación de viajes con un 5% de tolerancia,

MODELOS

DE

TRANSPORTE



en un 95% de las ocasiones. El lector interesado puede consultar M.E. Smith (1979) para otros ejemplos de este enfoque. La situación se modifica, sin embargo, cuando se intenta estimar una matriz O-D. En este caso, M.E. Smith (1979) demuestra que para estimar valores de 1.100 viajes entre parejas O-D al 90% de confianza con un error estándar del 25%, sería necesaria una muestra del 4% de todos los viajes en un área de estudio dada. Esto significa que si hubiera menos de 1.100 viajes, un tamaño de muestra inferior al 4% no sería suficiente para detectarlos. Ortúzar et al., 1993, analizaron el número de viajes por celda de la matriz O-D en la ciudad de Santiago, en Chile, para una agrupación de, solamente, 34 zonas (es decir, a nivel de municipalidades) y detectaron que sólo el 58% de las celdas O-D tenían más de 1.000 viajes. Por tanto, para estimar una matriz O-D a nivel de municipalidad con un 25% de error y 90% de confianza en Santiago, sería necesario postular un tamaño de muestra del 4% de viajes (y consecuentemente, el 4% de los hogares). Si se considera el efecto de la tasa de respuesta (incluso si llega al 75%), y teniendo en cuenta que en Santiago habría cerca de 1.240.000 hogares, eso implicaría una muestra de 62.000 familias. ¿Realmente es necesario un tamaño de muestra tan grande (con lo que implica en costes y en los niveles de eficiencia asociados) para alcanzar un objetivo tan precario? Claramente, la razón que subyace en la elección de muestras grandes es la necesidad de conseguir matrices de viajes a nivel zonal. También se ha demostrado que es muy difícil reducir el error de medición a un nivel aceptable en aquellas áreas que cuentan con más de 100 zonas, en cuanto a que, para ese número de zonas (más de 100), el tamaño de la muestra requerida se aproxima al tamaño de toda la población (M.E. Smith, 1979). En tal caso, si el objetivo del estudio comprende la estimación de matrices O-D, es deseable utilizar una combinación de diferentes métodos de muestreo, que incluyan tanto encuestas domiciliarias como encuestas de interceptación, para así poder explotar las ventajas de uno y otro método y alcanzar los objetivos del estudio. Estrategias de optimización en el diseño muestral. Para obtener un diseño muestral que logre una muestra de menores dimensiones, es necesario proponer las estrategias que estimen, por ejemplo, las tasas de generación de viajes de acuerdo a estatus socioeconómicos. Un enfoque consiste en utilizar una heurística de muestreo multi-etapa, que pueda producir resultados mejores que el método clásico propuesto por M.E. Smith (1979), aunque ello



Datos y rol del espacio

requiera un esfuerzo mayor por parte del analista y no garantice una solución única (DICTUC, 1998). La heurística se inicia ordenando las clases sociodemográficas en relación al grado en el que éstas se encuentran representadas en la población. A continuación, a las zonas del área de estudio se les asigna una clase en base al grupo socio-económico que presente la frecuencia más alta en su interior. Sucesivamente se selecciona una muestra aleatoria de zonas para cada tipología socioeconómica (es decir, del orden del 1% de todos los hogares). Las restantes zonas se clasifican en orden de prioridad y entre ellas se eligen las necesarias para llenar la diferencia entre la muestra ya seleccionada y el mínimo requerido por cada nueva clase. El procedimiento se repite hasta que todas las clases alcancen la mínima dimensión requerida (más o menos unas 30 ó 50 observaciones). Este procedimiento fue aplicado en Santiago para el sistema de 264 zonas definido en la encuesta O-D de 1991 (Ortúzar et al., 1993) y para una estratificación de 14 clases en base al ingreso (renta) y a la posesión de coche. El resultado final fue que una muestra de 1.312 hogares localizados en sólo 15 zonas garantizaba un mínimo de 30 observaciones por clase. Sin embargo, en ciertas zonas, en particular en las que contenían a personas de ingreso alto, esta solución implicó tamaños muestrales no muy razonables (p. ej. cerca del 20% de la población de la zona). Se halló finalmente una solución mejor resolviendo el siguiente problema de optimización (Ampt et al., 1998): Minimizar

s.a.

¤ ¤

 jij

i[clases] j[ zonas]

0 bj b

¤

 jij r i

j[ zonas]

donde αj es la proporción de hogares a entrevistar en la zona j, δ un límite razonable (p. ej. un máximo del 5%), ηij es el número de hogares de la clase i en la zona j y μi es la mínima dimensión aceptable de la muestra para cada clase i (es decir, 30 ó 50 observaciones). Utilizando la misma información del caso anterior, se encontró que el problema podría haber sido resuelto óptimamente generando una muestra de sólo 482 familias. Aún más interesante, para una estratificación en 26 clases (es decir añadiendo el tamaño del hogar como variable para estratificar), se

MODELOS

DE



TRANSPORTE

concluyó que un tamaño óptimo de muestra de 1.372 hogares, garantizaría un mínimo de 30 observaciones por cada clase específica, adquiriendo los datos únicamente en 17 de las 264 zonas. Sin embargo, al no aplicar ningún límite para δ, algunos valores de α se aproximaron de nuevo al valor del 20% de la población zonal. Así aplicando la restricción de que δ fuera menor que 5%, se consiguió finalmente una muestra de 1.683 familias en sólo 27 zonas. Un aspecto a destacar es que este método permite segmentaciones diferentes a las socioeconómicas hasta el momento consideradas. De ahí que también sea posible identificar diferencias espaciales en términos de área física (p. ej., distancia desde el centro de la ciudad) o de acceso a la red de transporte público y, por tanto, incrementar el número de clases consideradas en la optimización (DICTUC, 1998). En fin, cabe destacar que el diseño de la muestra puede ser también mejorado permitiendo diferentes tasas de respuesta para diferentes grupos. En línea con el principio de esta exposición, es posible estimar el número de hogares necesarios para una muestra gruesa (μi ) de forma que se consiga un número mínimo establecido de respuestas para cada clase; así se garantiza también que el diseño produzca datos de generación de viajes de calidad aún más elevada. Tamaño muestral para encuestas continuas. Un desafío final consiste en planificar una estrategia de muestreo para encuestas continuas, es decir, a lo largo de varios hitos temporales. En el supuesto de que fuera necesaria una muestra de 15.000 familias en el primer año para satisfacer las exigencias iniciales de modelización en un área metropolitana, una encuesta continua probablemente tendría una estructura como la siguiente: 1º año

2º año

3º año

4º año

5º año

15.000

5.000

5.000

5.000

5.000

Este método requiere muestras más pequeñas después del primer año, lo cual ofrece diferentes ventajas: • La posibilidad de disponer de un equipo bien entrenado y más reducido para el trabajo en terreno, y también de procesos administrativos más sencillos que probablemente garanticen la obtención de datos de calidad muy alta con mínimo esfuerzo en los años subsecuentes.



Datos y rol del espacio

• Las autoridades pueden acordar un programa de financiación (en el primer año) para los cuatro años restantes, reduciendo así los riesgos de no poder conseguir fondos, por ejemplo, durante el cuarto año. Por otro lado, para asegurar que los datos sean utilizables en cada año, este enfoque requiere el desarrollo de un sistema anual de ponderación e integración de los datos que sea robusto y de simple manejo. Es necesario asegurar que todos los datos al final del año 2 sean representativos del año 2, que todos los datos referidos al final del año 3 sean representativos de dicho año y así sucesivamente. Dicho procedimiento proporciona una representación actualizada del comportamiento de los usuarios (viajes) en la modelización y para el cumplimiento de otros objetivos. En ciudades en fase de expansión (donde se perciben cambios rápidos, por ejemplo, en la posesión de coche y en la expansión y distribución de usos del suelo), este método permite una capacidad de modelización mucho más esmerada en comparación a metodologías anteriores. Además, también proporciona una muestra de tamaño más amplia y eficiente para utilizar en años posteriores (un tamaño de encuesta similar a la del primer año), haciendo posible así responder de manera más detallada a la demanda. Asimismo, en el supuesto de que estos datos fueran utilizados para otros fines (además del de modelizado), el método de adquisición de los mismos anualmente proporcionaría toda una serie de informaciones fundamentales en forma de series temporales. Véanse estos ejemplos que constatan la oportunidad de realizar encuestas continuas a lo largo del tiempo: • Cambios en el patrón de viajes (por modo), correlacionados con modificaciones en los niveles de posesión de coche y en su distribución, en los niveles de polución o en la ordenación territorial. • Cambios en la elección del modo relacionados con modificaciones en la ordenación de la oferta, por ejemplo, mejorías en los recorridos peatonales o expansión de la red de servicios colectivos. La integración y combinación de los datos del segundo año y posteriores con los del primer año debe realizarse a los siguientes cuatro niveles: hogares, vehículos, personas y viajes. En este sentido es importante considerar tres aspectos: • Una esmerada selección de la muestra y altas tasas de respuesta para asegurar que las 15.000 familias del primer año sean representativas de la

MODELOS

DE

TRANSPORTE



ciudad; posteriormente se deberían aplicar procedimientos de ponderación y expansión como se indica más adelante. • Asegurar que las 5.000 familias en el segundo año sean representativas de la ciudad (tanto espacialmente como sobre los otros parámetros utilizados en el primer año para seleccionar la muestra); para ello es necesario aplicar nuevamente procedimientos de ponderación. • Al final del segundo año la base de datos constará de 20.000 familias, pero sólo contendrá los datos originales (en bruto) y los factores de ponderación. En ciudades de menor dimensión donde haya pocas variaciones estructurales y de tamaño, puede que no sea necesario utilizar una estrategia de muestreo tan compleja, si bien, de ello dependerá la posterior utilización de los datos. Por ejemplo, podría ser apropiada una muestra de datos igual para cada año, en un período de cinco años. 3.3.2.3.

Otros tipos importantes de encuestas

Encuestas a la vera del camino. Este tipo de encuestas proporciona información útil sobre viajes que no son registrados en las encuestas domiciliarias (p. ej., viajes que atraviesan el área de estudio en una encuesta cordón). A menudo estas encuestas constituyen un mejor método para estimar matrices de viaje que las encuestas domiciliarias, ya que es posible disponer de muestras mayores. Los datos obtenidos son también útiles para la validación y expansión de la información basada en el domicilio. En las encuestas en la vía pública se entrevista a una muestra de conductores y pasajeros de vehículos (coches, transporte público, camiones) que cruzan la estación de encuesta, con un número limitado de preguntas; éstas incluyen al menos el origen y destino del viaje y el motivo del mismo. Es deseable obtener también otras informaciones adicionales tal y como son la edad, el sexo y el nivel de ingresos, aunque normalmente no se consultan debido a las limitaciones de tiempo. No obstante, si los encuestadores tienen experiencia y han sido bien entrenados pueden añadir fácilmente algunos de estos datos a partir de una simple observación del vehículo y sus ocupantes (con las dificultades obvias en el caso de transporte público). La realización de estas encuestas requiere mucha organización y planificación para evitar retrasos innecesarios, garantizar la seguridad y lograr resultados de calidad. La identificación de los mejores lugares, coordinación con la policía, disposición de señalización y supervisión son elementos importan-



Datos y rol del espacio

tes para la adecuada realización de estas encuestas. A continuación se indican algunas consideraciones en torno al tamaño muestral y al nivel de exactitud: Ejemplo 3.7: considérese un punto de control que es cruzado por N coches y se desea extraer una muestra de n vehículos a encuestar. Se asume también que de estos n vehículos, X1 viajan entre un par origen-destino O-D1. Como X1 tiene una distribución hipergeométrica H(N, N1, n) donde N1 es el número total de viajeros entre el par O-D1, puede demostrarse que su valor esperado o esperanza matemática y su varianza vienen dados por: E(X1) = np con p = N1 / N V(X1) = np(1 – p)(1 – n / N) Utilizando una aproximación a la Normal (basada en el teorema central del límite), se obtiene la distribución de X1 así:

X l ~ N ( np, np(1 p)(1 n / N )) y un estimador de p es:

pˆ 

Xl n

Por tanto:

¥ p(1 p )(1 n / N ) ´ pˆ ~ N ¦ p, µ¶ n § y un intervalo de confianza aproximado 100(1 – α)% para p viene dado por:

¨ p(1 p )(1 n / N ) p(1 p )(1 n / N ) · , pˆ z © pˆ z ¸ n n ©ª ¸¹ donde z es el valor de la variable Normal estandarizada para el nivel de confianza requerido (1,96 para el 95%). Usualmente se requiere que el error absoluto e asociado a pˆ no exceda de un valor preestablecido (normalmente 0,1), es decir:

MODELOS

DE



TRANSPORTE

Ez

p (1 p )(1 n / N ) be n

Manipulando algebraicamente esta expresión se obtiene:

p (1 p )(1 n / N ) (e / z ) 2

nr o lo que es equivalente:

nr

p (1 p ) 2

p (1 p ) ¥e´ ¦ µ N §z¶

(3.17)

Puede observarse que dados los valores de N, e y z, el valor p = 0,5 produce el número más alto (más conservador) de n en la ecuación (3.17). Tomando este valor y considerando e = 0,1 (un error máximo del 10%) y z = 1,96 se obtienen los valores de la tabla 3.2 Tabla 3.2.

Variación del tamaño de la muestra con el flujo observado.

N (viajeros/período)

n (viajeros/período)

100n/N (%)

100

49

49,0

200

65

32,5

300

73

24,3

500

81

16,2

700

85

12,1

900

87

9,7

1.100

89

8,1

Ejemplo 3.8: el análisis de datos históricos durante la realización del trabajo previo de preparación de una encuesta en la vía pública (carretera), ha revelado que los flujos que atraviesan la estación de encuesta varían enormemente durante el día. Teniendo en cuenta este hecho, se consideró demasiado complejo intentar aplicar la estrategia de la tabla 3.2 en campo. Para ello se desarrolló la siguiente tabla simplificada:



Datos y rol del espacio

Flujo horario estimado (viajeros/período)

Tamaño de la muestra (%)

más de 900

10,0 (1 de 10)

700 a 899

12,5 (1 de 8)

500 a 699

16,6 (1 de 6)

300 a 499

25,0 (1 de 4)

200 a 299

33,3 (1 de 3)

1 a 199

50,0 (1 de 2)

El trabajo de campo requiere parar aleatoriamente al número correspondiente de vehículos, encuestando a todos los pasajeros y preguntando el origen, destino y motivo del viaje. En el caso de viajes en transporte público, dadas las dificultades prácticas de inmovilizar los vehículos durante el tiempo necesario para entrevistar a los viajeros, se realiza la encuesta a bordo de los vehículos. Para este trabajo es necesario definir tramos de carretera en vez de estaciones de encuesta y tener en cuenta que el número de encuestadores depende de los factores de ocupación observados en el tramo. Incluso este método puede ser difícil de aplicar si los vehículos están cercanos a su capacidad. Encuestas cordón. Este tipo de encuestas ofrece información útil sobre viajes externos-externos y externos-internos. Su objetivo es determinar el número de viajes que abandonan y/o cruzan el área delimitada por el cordón, contribuyendo de esta manera a completar la información obtenida en las encuestas domiciliarias. La encuesta más importante se lleva a cabo en el cordón externo, aunque también es posible realizar encuestas en cordones internos. Para reducir las demoras, a veces la realización de estas encuestas implica detener a una muestra de vehículos que pasan por una estación de control (normalmente con ayuda de la policía), entregando a los ocupantes de dichos vehículos un pequeño cuestionario para ser devuelto por correo. En algunos estudios holandeses se ha tomado una muestra de números de matrículas en las estaciones de control de forma que los cuestionarios se envían a las direcciones correspondientes obtenidas del gobierno. En estos casos, uno de los problemas principales es el conocido sesgo que tienen las encuestas devueltas por correo; éste se debe a que normalmente se devuelven menos del 50% de los cuestionarios repartidos, quedando demostrado que el tipo de persona que los devuelve es diferente al que no lo hace (ver Brög

MODELOS

DE



TRANSPORTE

y Meyburg, 1980). Ésta es la razón por la que en muchos países se limita el número de preguntas (ocupación del vehículo, motivo, origen, destino y modos disponibles) en encuestas a pie de calle, logrando mejorar las tasas de respuesta.

Viajes de un lado a otro de la línea pantalla

Encuestas en líneas pantalla. Las líneas pantalla dividen el área de estudio en grandes zonas naturales (p. ej., ambos lados de un río o de una autopista), con pocos puntos de cruce entre ellas. El procedimiento es análogo al de las encuestas cordón y los datos se utilizan también para complementar y validar la información proveniente de las encuestas domiciliarias y cordón (ver Figura 3.5). Se ha de prestar atención al intentar corregir los datos de la encuesta domiciliaria de esta forma, ya que puede ser difícil establecer comparaciones sin introducir sesgo.

Datos línea pantalla Datos encuesta O-D (incluyendo encuesta a vehículos de carga) Hora del día

Figura 3.5. Verificación de consistencia de datos de la encuesta domiciliaria O-D.

Encuestas de diario de viajes. Son un tipo especial de encuestas domiciliarias a través de las cuales se obtiene información similar a la de las encuestas O-D, pero con mayor detalle. Sin embargo, parece difícil imaginar un detalle superior al del enfoque actual de diseño de encuestas contemporáneas, por lo que podría darse el caso de que finalmente este tipo de encuestas desaparezca. De hecho, sólo si la carga al entrevistado no permite que el analista recopile los datos de la forma recomendada aquí, el diario de viajes puede ser la única salida en muchos estudios. El diario de viajes debe ser aplicado por separado a cada uno de los miembros de la familia encuestada que viaje durante el tiempo de realización del



Datos y rol del espacio

estudio. Cada persona debe llevar y cumplimentar su diario de viajes durante el día, y por esta razón este instrumento de medición ha de cumplir los siguientes objetivos de diseño: • Facilidad de transporte. Se requiere un formato pequeño que permita transportarlo en el bolsillo o en bolsas de mano. • Facilidad de comprensión por el usuario. Por ello es necesario idear una forma de solape de sus páginas para tener las instrucciones permanentemente a la vista (ver Ortúzar y Hutt, 1988). • Facilidad de cumplimentación. Como es normal en cuestionarios de autollenado, se deben ofrecer opciones precodificadas en todos los casos en que sea posible, con objeto de minimizar la necesidad de incorporar texto escrito. Un diario de viajes se plantea normalmente con dos objetivos: contribuir al proceso general de corrección de la encuesta O-D, como se verá en la sección 3.3.3, y obtener un banco de datos apto para la estimación de modelos desagregados de elección modal. Este método de toma de datos implica los siguientes pasos: • Una primera visita a cada hogar de la muestra (que debería seleccionarse teniendo especial cuidado en evitar aquellos hogares ya contactados para la encuesta O-D), con objeto de presentar y explicar los diarios, y para recoger los mismos datos socioeconómicos que en el caso de la encuesta O-D. Las personas entrevistadas han de ser brevemente entrenadas en el uso del diario, pidiéndoles que completen con todo detalle los viajes del día siguiente. A cada viajero se le entrega más de un diario si se desea que el ejercicio sea repetido durante la semana (ver Brög y Ampt, 1982). • Debe realizarse una segunda visita al día siguiente del último para el que se solicitaron datos (24 horas más tarde de la primera visita en el caso de diarios de un solo día), con objeto de recoger los formularios completamente rellenados por cada viajero. Es bastante común que sea necesario prestar ayuda para completar los diarios en esta visita. Los diarios de viaje se procesan en dos fases: durante la primera, se registra únicamente la información socioeconómica y las tasas de viaje por motivo, ya que éstos son los datos necesarios para el proceso de corrección de la encuesta O-D. En una segunda fase se consideran los datos de cada viaje y se incorporan medidas muy precisas de las variables de nivel de servicio para la alternati-

MODELOS

DE

TRANSPORTE



va de viaje elegida e indicada en el diario y para el resto de alternativas del conjunto de elecciones de cada individuo. Según se verá en el Capítulo 8, los datos se presentan de esta forma para la estimación de modelos desagregados de elección.

3.3.3.

Corrección, expansión y validación de los datos de encuestas O-D

En cualquier tipo de encuesta sobre viajes, especialmente en las O-D, es necesario corregir y ponderar de una forma u otra, los datos obtenidos (Armoogum et al., 1997). En este epígrafe se tratarán los métodos más adecuados para corregir, expandir y validar los datos de encuestas O-D obtenidos con la metodología anteriormente descrita. 3.3.3.1.

Corrección de los datos

La necesidad de corregir los datos provenientes de la encuesta O-D, con el fin de alcanzar resultados que no sean solamente representativos del total de población, sino también fiables y válidos, se ha discutido en detalle (ver Brög y Erl, 1982; Wermuth, 1981). Hoy en día se acepta que no es conveniente efectuar una expansión simple de la muestra, aunque durante muchos años éste fue el método más usual en la práctica. Brög y Ampt (1982) identifican las siguientes etapas de corrección. Corrección por tamaño del hogar y por características sociodemográficas. Para efectuar las correcciones que garanticen que la distribución del tamaño de los hogares y de la edad y sexo de los datos de la muestra representan a toda la población (basada en datos de las listas censales), es necesario utilizar un enfoque iterativo ya que métodos muy simples no garantizan resultados válidos (Deville et al., 1993). En este caso, un buen enfoque consiste en utilizar el método bi-proporcional (que se estudia en detalle en el epígrafe 5.6.1), ya que garantiza la convergencia en pocas iteraciones. Además, tiene la ventaja potencial de que su aplicación no requiere recalcular posteriormente factores de expansión para la muestra. Este método resulta particularmente apropiado cuando la fecha del último censo realizado está cercana a la fecha de realización de la encuesta O-D; sin embargo no es idóneo si la encuesta se realiza mucho tiempo después (años) del último censo, ya que la población urbana puede cambiar, y muy rápida-



Datos y rol del espacio

mente en los países en desarrollo. En este último caso sería necesario calcular la proporción de hogares en cada grupo y los factores de expansión de forma más tradicional (Ortúzar et al., 1993). El método bi-proporcional no garantiza que cada valor de la celda sea idéntico en el censo y en la encuesta O-D, ya que en cualquier matriz existe un grado de indeterminación relevante (es decir, muchas combinaciones de valores de las celdas de una matriz pueden dar origen a los mismos totales de filas y columnas). En particular, y dada su naturaleza multiplicativa cuando se utiliza este método, una celda (o sea, un elemento de la matriz de viajes) que contenga un cero siempre mantendrá el valor cero. Por otro lado, algunas estructuras particulares de matrices (que contengan ceros en algunas celdas clave), pueden llevar a la no convergencia del método (ver epígrafe 5.6.1). Para evitar sesgos en la corrección bi-proporcional ya que, por un lado, se está corrigiendo en base al tamaño del hogar (número de personas) y, por otro, según características individuales (sexo y edad), se recomienda definir categorías bi-unívocas evitando clases que comprendan, por ejemplo, de dos a cuatro personas, o seis o más personas. No obstante, es fácil imaginar situaciones en las que podría ser necesario reagrupar una determinada categoría porque de lo contrario no estaría representada en la muestra para una determinada zona. En este caso es conveniente averiguar si es posible agrupar zonas que sean semejantes antes que hacer correcciones a tal nivel de desagregación. Correcciones adicionales en las encuestas domiciliarias. Además de las correcciones por tamaño del hogar y características socio-demográficas, hay otros dos procedimientos de corrección según se trate de entrevistas personales o encuestas de autollenado (Richardson et al., 1995). Correcciones por información no reportada. Este problema se ocasiona cuando ciertos elementos de la encuesta no han sido respondidos (es decir, hay ítems sin respuesta). En encuestas de auto-llenado, esto puede ser resuelto encuestando a una muestra de validación usando entrevistas personales y luego ponderando la información adecuadamente (Richardson et al., 1995). Dado que se asume que los entrevistadores están bien entrenados y supervisados, este tipo de corrección no debería realizarse cuando se trata de encuestas con entrevista personal, pero incluso en estos casos, puede que no se obtenga respuesta a datos “difíciles” de obtener, como el ingreso.

MODELOS

DE



TRANSPORTE

Si no es posible obtener la información de O-D siguiendo las reglas mencionadas anteriormente (es decir, viajes por etapas en un día predefinido y siguiendo un marco recordatorio de actividades), puede existir una subestimación de los viajes no habituales. En estos casos puede ser importante verificar el número de viajes por propósito, obtenido en la encuesta O-D, con aquellos obtenidos mediante diarios de viajes, donde se debería haber conseguido información más detallada acerca de cada viaje y especialmente acerca de los viajes no habituales. Un método de corrección propuesto por Ortúzar y Hutt (1988) considera los siguientes pasos: • Dividir los hogares en categorías (definidas, p. ej., por ingreso, motorización y tamaño familiar). El número total de categorías está limitado por la condición de que cada una debe al menos poseer 30 observaciones en la encuesta del diario de viajes, para asegurar que la tasa de viajes media tenga una distribución Normal. • Calcular el número medio de viajes por motivo (y su varianza) para cada categoría, tanto para la encuesta O-D como para los datos del diario de viajes. Denominando a las medias como X̅ α y X̅ b y a las varianzas como Sα y Sb respectivamente, calcular la diferencia D = X̅ α – X̅ b. • La diferencia mínima detectable (d) entre las medias de una cierta variable X en dos muestras con tamaños Nα y Nb para una probabilidad del 80% de que su diferencia real (D) sea significativa al 95% de confianza, viene dada por la expresión (Skelton, 1982): 1/ 2

¥S S ´ d  2, 8 ¦ a b µ § N a Nb ¶

• Si D > d, la diferencia es significativa. Por ello si la tasa media de viajes en esa categoría es más pequeña en la encuesta O-D que en el diario de viajes, tiene que aplicarse un factor para igualarla a la tasa media de viajes de los diarios. Si ocurre lo contrario, no se efectúa ninguna corrección (es decir, el factor es igual a la unidad). • Si D ≤ d la diferencia no es significativa y, por tanto, no se realiza corrección. En el caso del ingreso u otros ítems sin respuesta, los estudios de validación pueden proveer mayor información acerca de los que no han contestado; por lo tanto, si hubiera datos de validación disponibles, se podrían conseguir



Datos y rol del espacio

modelos más flexibles. Sin embargo, se ha argumentado que no es posible modelizar los errores de no-respuesta en ítems separadamente de los errores de comportamiento, por lo que diferentes modelos de no-respuesta pueden ser obtenidos utilizando los mismos datos cuando se modelizan diferentes contextos de elección (Ortúzar y Garrido, 2001). Para el caso de no respuesta de una unidad (p. ej., individuo) es incluso preferible imputar una observación completa en lugar de reponderarla (ver discusión sobre métodos de imputación más adelante). Corrección por no-respuesta. Se refiere a situaciones en las que una familia o un individuo no contestan, es decir no devuelven la ficha de la encuesta o rechazan verbalmente o por carta el contestar a la encuesta. Ello puede ser atribuido a diferentes causas, y es importante diferenciar entre no-respuestas auténticas o pérdidas (p. ej., viviendas vacías) y rechazos (en los que las personas pudieran efectuar viajes pero no contestan). En el caso de entrevistas personales es recomendable que la corrección esté basada en el número de visitas necesarias para conseguir una respuesta, ya que se ha demostrado que ésta cuestión está asociada con fuertes diferencias en el comportamiento de viaje. En encuestas de auto-llenado, en cambio, la corrección puede estar basada en el número de recordatorios necesarios para generar una respuesta del hogar (Richardson et al., 1995). Ponderación para integrar encuestas continuas. La ponderación para integrar encuestas continuas se requiere para unificar cada hito/oleada temporal de la encuesta; en este caso es recomendable proceder así (Ampt et al., 1998): • La ponderación por hogar debe ser realizada para cada variable “importante” (escogidas previamente). En la tabla 3.3 se muestra, a título de ejemplo, el caso del tamaño de la familia, pero podría hacerse de forma semejante para las variables posesión del coche o ingreso familiar. • La ponderación por vehículo se efectúa de modo análogo. Una variable de particular importancia es la edad del vehículo, ya que sin una correcta ponderación daría la impresión de que el parque vehicular no envejece. • La ponderación de las personas debería incluir, por ejemplo, factores como el ingreso y el nivel de educación. • La ponderación de los viajes incluye el número de viajes y el modo, según el mismo procedimiento general de ponderación anteriormente descrito.

MODELOS

DE



TRANSPORTE

Tabla 3.3.

Procedimiento de ponderación integrada Valores ponderados para los años 1 y 2 Tamaño del hogar 1

2

3

4

5

Total

Año 1

2.000 13,33%

3.000 20,00%

4.000 26,67%

5.000 33,33%

1.000 6,67%

15.000

Año 2

850 17,00%

1.200 24,00%

1.000 20,00%

1.500 30,00%

450 9,00%

5.000

Año 3

2.850 14,29%

4.200 21,00%

5.000 25,00%

5.600 32,50%

1.450 7,25%

20.000

Valores de reponderación para el año 1

Año 1

1

2

3

4

5

17,00/13,33 1.275

1.200

0,750

0,900

1.350

Procedimiento de ponderación 1

2

3

4

5

Total

Año 1

2.550

3.600

3.000

4.500

1.350

15.000

Año 2

850

1.200

1.000

1.500

450

5.000

Año 3

3.400 17%

4.800 24%

4.000 20%

6.000 30%

1.805 9%

20.000

Métodos de imputación. Existen varios métodos de imputación en el estado del arte (una interesante discusión sobre este tema puede verse en Armoogum y Madre, 1998). Sin embargo, estos métodos no conservan la varianza de la variable a imputar (p. ej., el ingreso), y por tanto, cuando la variable que contiene imputaciones es incluida en un modelo, pueden conducir a estimaciones inconsistentes. Por esta razón, algunos investigadores consideran que en algunos casos imputar valores incrementa el error, es decir, simplemente los datos se transforman en valores improvisados. Por tanto se aconseja registrar los cambios producidos tras imputar valores y, si es posible, evaluar sus efectos. Para solucionar éste y otros problemas, estudios recientes sugieren realizar imputaciones múltiples y luego combinar los estimadores de los modelos resultantes en cada caso para así conseguir valores consistentes que tengan en cuenta los errores asociados al proceso de imputación (Brownstone, 1998).

 3.3.3.2.

Datos y rol del espacio

Expansión de la muestra

Una vez que los datos han sido corregidos, es necesario expandirlos para representar a la población total. Para efectuar esta expansión, se definen factores para cada zona de estudio como el ratio entre el número total de direcciones en la zona (A) y el número de direcciones obtenido como muestra final. No obstante, es habitual que los datos de A estén desfasados, ocasionando problemas en el trabajo de campo. La siguiente expresión es totalmente general en este sentido:

Fi 

A A(C CD / B ) / B B C D

donde Fi es el factor de expansión para la zona i, A es el número de direcciones de la población total en la lista original, B es el número de direcciones seleccionado como la muestra original, C es el número de direcciones de la muestra que no fueron elegibles en la práctica (p. ej., casas demolidas, edificios no residenciales), y D es el número de direcciones de la muestra donde no se obtuvo respuesta. Como se puede ver, si A fuera perfecto (es decir C = 0), el factor sería simplemente A / (B – D) , como se definió anteriormente. Por otra parte si D = 0, puede comprobarse que la fórmula considera sustraer de A la proporción de casos no elegibles, con objeto de evitar sesgos en Fi. 3.3.3.3.

Validación de resultados

Los datos obtenidos de las encuestas O-D se someten normalmente a tres procesos de validación. El primero de ellos consiste simplemente en comprobaciones en campo de la coherencia y completitud de los datos. A esta comprobación sigue normalmente la codificación y grabación de los datos en gabinete. El segundo proceso es una comprobación por ordenador de los rangos válidos para la mayor parte de las variables y, en general, de la consistencia interna de los datos. Una vez que se han completado ambos procesos, se supone que los datos no tienen errores obvios. En el estado del arte en estudios de movilidad, puede observarse que la validación más importante de los datos se hace con los datos mismos de la encuesta y no con datos secundarios como los conteos de tráfico sobre líneas pantalla y cordón. La razón es que cada método posee sus propias y particulares distorsiones, las cuales pueden engendrar confusión en el proceso de validación. Por ejemplo, comparaciones groseras, como el número de desplazamientos que

MODELOS

DE

TRANSPORTE



atraviesan una sección de cordón o el número de desplazamientos por modo, a menudo proporcionan comparaciones de escaso significado. Las técnicas de encuestas actuales minimizan estos problemas, pero a pesar de ello siempre es recomendable utilizar datos independientes para cotejar las cifras procedentes de todos los componentes de una encuesta O-D a nivel metropolitano. La comparación objetiva de estas cifras, teniendo en cuenta que cada método de encuesta tiene sus puntos fuertes y débiles, hace posible localizar potenciales sesgos y adoptar los pasos adecuados para corregirlos. Además, si se deben ajustar matrices es esencial reservar datos independientes para validar los resultados finales. Todo esto requiere buen juicio y experiencia porque, si no se presta la debida atención, es fácil realizar correcciones a las matrices O-D que no se corresponden con la realidad.

3.3.4.

Encuestas de Preferencias Declaradas

La discusión previa ha sido desarrollada bajo la hipótesis implícita de que cualquier dato sobre elección correspondía a información de Preferencias Reveladas (PR); esto quiere decir, datos sobre elecciones reales u observadas realizadas por los individuos. Es importante destacar que raramente se pueden observar realmente las elecciones. Normalmente se obtienen datos de lo que los individuos señalan que hacen, o más frecuentemente, que hicieron el día anterior. En términos de entender el comportamiento de viaje, los datos de PR tienen varias limitaciones: • Las observaciones de elecciones reales pueden no tener la suficiente variabilidad para construir buenos modelos de evaluación y predicción. Por ejemplo, atributos tales como el tiempo de viaje y la tarifa pueden estar tan correlacionados en la muestra que puede ser difícil separar sus efectos en la estimación de modelos y por ende para la prognosis. • El comportamiento observado puede estar dominado por algunos factores haciendo muy difícil detectar la importancia relativa de otras variables. Éste es un problema particular con variables cualitativas secundarias tales como información sobre servicios de transporte público, seguridad, confort; pero estos atributos cuestan dinero e interesaría saber cómo son valorados por los usuarios antes de asignarles recursos. • Las dificultades asociadas para conseguir respuestas a actuaciones que sean totalmente nuevas, por ejemplo, la introducción de un nuevo modo (como



Datos y rol del espacio

vehículos sin conductor), o un sistema nuevo de cobro y recaudación (p. ej., peaje electrónico). Estas limitaciones podrían solventarse si fuera posible llevar a cabo experimentos reales controlados dentro de las ciudades o en los sistemas de transporte. Las oportunidades para ello son muy limitadas. Las encuestas de Preferencias Declaradas (PD) ofrecen una aproximación a los mismos, siendo un tipo de cuasi-experimento basado en situaciones hipotéticas establecidas por el investigador y por tanto, constituyen una aproximación de un experimento controlado. Lo que distingue fundamentalmente a las encuestas PR y PD es que en este último caso se pregunta a los individuos sobre lo que ellos elegirían (o cómo jerarquizarían o puntuarían ciertas opciones) en una o más situaciones hipotéticas. El grado de artificialidad de estas situaciones puede variar de acuerdo con las necesidades y el rigor del ejercicio: • El contexto de la decisión puede ser hipotético o real, en otras palabras, se puede pedir al encuestado que considere las circunstancias de su viaje actual o de uno que pudiera realizar en el futuro. • Las alternativas ofrecidas son a menudo hipotéticas, aunque alguna de ellas puede ser la realmente existente; por ejemplo, el modo utilizado por el entrevistado incluyendo todos sus atributos. • La respuesta obtenida de cada individuo puede tomar la forma de elecciones o únicamente de preferencias expresadas de diferentes formas. Un problema básico con la toma de datos PD es cuánto se puede confiar en que los individuos hagan realmente lo que declararon que harían cuando se presente la situación (p. ej., después de la introducción de una nueva alternativa). Las experiencias de los años setenta no fueron muy buenas en este sentido, en cuanto a que se comprobó (ver Ortúzar, 1980a) que en muchos estudios existían grandes diferencias entre los valores de elección estimados y los reales (p. ej., sólo la mitad de los individuos realizaban lo que habían manifestado). La situación mejoró considerablemente en los años ochenta y recientemente se han conseguido ajustes muy cercanos a la realidad con modelos estimados utilizando datos PD (Louviere, 1988a). Este cambio se debe a que los métodos de toma de datos PD han mejorado enormemente y actualmente son muy exigentes no sólo en términos de experiencia en el diseño de encuestas, sino también en los requisitos de personal de campo bien entrenado y procedimientos de control de calidad. Una buena “guía” práctica se encuentra en Pearmain et al. (1991).

MODELOS

DE

TRANSPORTE



Las principales características de una buena encuesta de PD pueden resumirse así: 1. Se basa en la obtención de declaraciones de los encuestados sobre cómo reaccionarían ante diferentes alternativas hipotéticas de viaje. 2. Cada alternativa se presenta como un “paquete” de diferentes atributos tales como tiempo de viaje, tarifa, frecuencia, regularidad, etcétera. 3. El investigador construye estas alternativas hipotéticas de forma que se pueda estimar el efecto individual de cada atributo. Esto se logra utilizando técnicas de diseño experimental, que ayudan a extraer los valores de los parámetros de forma más eficiente. 4. El investigador tiene que asegurarse de que las alternativas hipotéticas presentadas sean comprensibles para los encuestados, parezcan realistas y plausibles y estén relacionadas con su nivel de experiencia real. 5. Los encuestados declaran sus preferencias hacia cada alternativa, ordenándolas según su atractivo, puntuándolas en una escala que indique la fuerza de la preferencia, o simplemente eligiendo la opción preferida entre dos o más alternativas. 6. Las respuestas de los individuos son analizadas para obtener medidas cuantitativas de la importancia relativa de cada atributo. En muchos casos se pueden estimar modelos de elección como parte de este análisis, como se discute en el Capítulo 8. La figura 3.6 muestra un ejemplo de presentación de alternativas PD para servicios de autobús. Cada alternativa se describe en una tarjeta en función de sus atributos: frecuencia, tiempo a bordo, tarifa y trasbordo. El encuestado debe ordenar estas tarjetas de la mejor a la peor alternativa, colocándolas una tras otra en ese orden. El poder de un ejercicio PD se basa en la libertad que se tiene para diseñar cuasi-experimentos que cumplan los requerimientos de una amplia variedad de necesidades de investigación. Este poder debe ser balanceado con la necesidad de asegurar que las respuestas dadas por los individuos sean realistas, esto es, tan próximas como sea posible a lo que hubieran respondido si estas opciones hipotéticas realmente hubieran existido en la práctica. Este balance debe lograrse en diferentes etapas de los ejercicios de PD: a) Identificación de los atributos clave de cada alternativa y construcción de los “paquetes” que conforman las opciones de elección. Todos los atribu-



Datos y rol del espacio

Tarifa

Trasbordo

70 p

Ninguno

Tiempo en bus Tiempo andando 15 mins

Tarifa

Trasbordo

70 p

Ninguno

10 mins

Tiempo en bus Tiempo andando 20 mins

Tarifa

Trasbordo

85 p

Ninguno

8 mins

Tiempo en bus Tiempo andando 15 mins

Tarifa

Trasbordo

70 p

1 Cambio

10 mins

Tiempo en bus Tiempo andando 15 mins

8 mins

Figura 3.6. Ejemplo de un ejercicio de jerarquización en PD.

b)

c) d) e)

tos esenciales deben estar presentes y las opciones deben ser plausibles y realistas. Diseñar la forma en que se presentan las opciones de elección a los encuestados y de qué forma éstos pueden expresar sus preferencias. La presentación de las alternativas debe ser de fácil comprensión y situarse en el contexto de la experiencia y las restricciones del encuestado. Desarrollo de una estrategia de muestreo que asegure un conjunto de datos rico y representativo. Realización apropiada de la encuesta, incluyendo supervisión y procedimientos de aseguramiento de la calidad de los resultados. Utilización de técnicas adecuadas de estimación de modelos, preferiblemente combinando datos PR y PD y teniendo bien presente el modo en el que los modelos o ponderaciones resultantes serán utilizadas como soporte a la toma de decisiones.

3.3.4.1.

Atributos y alternativas

Un experimento de preferencias declaradas tiene como uno de sus elementos principales la construcción de un conjunto de alternativas u opciones hipotéticas (aunque realistas), que pueden ser definidas como alternativas tecnológicamente factibles (viables). Éstas se definen tomando como base los factores que influyen con más fuerza en el problema de elección en el estudio. El diseño de estas alternativas tecnológicamente factibles requiere cuatro tareas diferenciadas:

MODELOS

DE

TRANSPORTE



(a) identificación del conjunto de elecciones (qué opciones van a ser incluidas: ferrocarril o coche, o diferentes tipos de servicio dentro de un mismo modo); (b) selección de los atributos a incluir en cada opción; (c) selección de la unidad de medida de cada atributo y (d) especificación del número y magnitud de los niveles de cada atributo. a) El conjunto de alternativas se obtiene normalmente a partir de los objetivos del estudio. Sin embargo no se debe omitir ninguna alternativa realista que el usuario pudiera considerar en la práctica. Por ejemplo, en un estudio sobre respuesta potencial de conductores de vehículo privado a nuevas iniciativas de Tarificación Vial, puede no ser suficiente considerar solamente modos alternativos de viaje. Los cambios en la hora de salida del viaje o hacia destinos alternativos (para evitar cobros), pueden ser respuestas a considerar. Ignorar estas alternativas coloca al entrevistado en un contexto menos realista. b) El conjunto y naturaleza de los atributos debe también elegirse de forma que se aseguren respuestas realistas. Deben estar presentes los atributos más importantes y ellos han de ser suficientes para describir las alternativas tecnológicamente factibles. En esta fase debe tenerse especial cuidado a la hora de establecer las diferentes combinaciones de atributos; por ejemplo, una alternativa de alta calidad, con frecuencia elevada y de bajo coste puede ser ignorada por poco realista, reduciendo así el valor de todo el ejercicio. Al mismo tiempo conviene cuidar que el número de atributos no sea excesivo (en general no más de cuatro) dado que, como expone Carson et al. (1994) puede que los entrevistados simplifiquen sus elecciones de forma lexicográfica (focalizando la atención sobre un número inferior de atributos) o bien que sencillamente respondan al azar (Saelensminde, 1999). Con el fin de asegurar que se incluyen los atributos adecuados y que las opciones se describen de una forma sencilla, es conveniente llevar a cabo un pequeño número de reuniones de grupo focal con una muestra representativa de individuos. Un moderador con experiencia se encargará de asegurar que se discutan y registren todas las cuestiones relevantes referidas a la percepción de las alternativas, identificación de los atributos más importantes y la forma en la que éstos se perciben por parte de los sujetos, así como los elementos principales que establecen el contexto del ejercicio. Las reuniones de grupo focal son costosas y, en muchos casos, el investigador estará tentado a evitarlas en la convicción de que ya posee una buena comprensión del problema y del contexto. En este caso, es esencial



Datos y rol del espacio

realizar una encuesta piloto controlada cuidadosamente, mediante la cual se pueda estudiar cualquier aspecto relativo a la descripción de atributos y alternativas. c) La elección de las unidades de medida para la mayor parte de los atributos es relativamente directa. No obstante, hay algunas situaciones que pueden necesitar consideraciones adicionales, en particular en el caso de atributos cualitativos como la “comodidad” o la “regularidad”. Por ejemplo, la regularidad en el tiempo de viaje puede presentarse como una distribución de tiempos de viaje en diferentes días laborables de la semana, o como la probabilidad de retraso en un tiempo determinado. d) Con respecto del número de niveles que cada atributo puede tener, es importante recordar que Wittink et al. (1982) han encontrado que las variables con un número mayor de niveles pueden ser percibidas por los entrevistados como más importantes. 3.3.4.2.

Diseño experimental

El diseño de las alternativas y su presentación se articula, en esencia, en tres fases: (a) selección de los niveles de los atributos y de las combinaciones que constituyen cada alternativa (diseño experimental); (b) diseño de la presentación de estas alternativas (presentación de los estímulos) y (c) especificación de las respuestas que se van a obtener de los encuestados. A continuación se discute la primera de estas fases. Un diseño experimental “ortogonal” asegura que las combinaciones de atributos presentadas varían independientemente unas de otras. La ventaja de ello es que el efecto de cada atributo sobre las respuestas es más fácil de identificar. El número de atributos (a) y el número de niveles que cada uno puede tomar (n), determinan un diseño factorial (na). Existen tablas (ver, p. ej., Kocur et al., 1982), que proporcionan el número de opciones hipotéticas necesarias para probar la mayoría de los diseños de interés y garantizan la ortogonalidad. El diseño distingue aquellos casos que solamente consideran efectos principales y aquellos que permiten el tratamiento de interacciones (es decir, cuando los efectos de dos variables no son aditivos, y se comportan como producto de las dos variables, ver Figura 3.7). Un problema de las interacciones es que requieren la construcción de un número superior de alternativas; por esta razón se utilizan frecuentemente diseños factoriales fraccionados, en los

MODELOS

DE



TRANSPORTE

que se supone que algunos o todos los productos de las variables son despreciables.

(a)

Frecuencia (buses/hr) 12 3

20

50 tarifa

Probabilidad de elegir bus

Probabilidad de elegir bus

Ejemplo 3.9: sea el siguiente diseño experimental (Pearmain et al., 1991) para tres atributos de un servicio de autobuses (tarifa, frecuencia y tiempo de viaje), cada uno de ellos con dos niveles posibles (alto y bajo). Un diseño factorial completo necesitaría 23 = 8 opciones que se describen en términos cualitativos y numéricos (la última representa una notación estándar para el diseño experimental) en la tabla 3.4.

(b)

12 3 30

50 tarifa

Figura 3.7. Presencia y ausencia de interacción entre atributos: (a) sin interacción, (b) con interacción.

Para situar este diseño experimental en un contexto apropiado para el encuestado, se debe averiguar en primer lugar los niveles experimentados actualmente; supóngase, por ejemplo, que la persona utiliza un servicio que tiene un tiempo de viaje de 25 minutos, una frecuencia de 30 minutos y una tarifa de £0,50. El objetivo del estudio es investigar la aceptación de una mejora del servicio, y analizar cuánto se puede aumentar la tarifa si se incorpora dicha mejora. El diseño experimental puede traducirse en términos de alternativas como se ilustra en la tabla 3.5. Destacar que en este punto se debe decidir cómo transformar los niveles “Alto” y “Bajo” o “Rápido” y “Lento” en descripciones relevantes y plausibles para el encuestado. Además, el rango de las variaciones en los niveles de los atributos debe ser lo suficientemente amplio como



Datos y rol del espacio

para obtener variaciones detectables en las preferencias declaradas, pero al mismo tiempo no tan grandes como para comprometer la credibilidad de la alternativa. Éste es un diseño factorial completo, donde el analista es capaz de recoger todos los efectos directos y de interacción. Sin embargo, si interesa también el efecto producido por la reducción del nivel de servicio, podría resultar necesario aumentar (de dos a tres), el número de niveles del tiempo de viaje y de la frecuencia, aumentando así el número de alternativas hasta 32 × 21 = 18 aunque un número tan elevado de opciones puede provocar fatiga en el encuestado y reducir por tanto el valor de sus respuestas. Tabla 3.4.

Diseño experimental para tres atributos con dos niveles cada uno Atributos

Alternativas

Tarifa

Tiempo de viaje

Frecuencia

1

Baja

Rápido

Poco frecuente

2

Baja

Rápido

Frecuente

3

Baja

Lento

Poco frecuente

4

Baja

Lento

Frecuente

5

Alta

Rápido

Poco frecuente

6

Alta

Rápido

Frecuente

7

Alta

Lento

Poco frecuente

Alta

Lento

Frecuente

8

Representación numérica: –1= “pobre”, 1= “bueno” Alternativas

Atributo 1

Atributo 2

Atributo 3

1

1

1

–1

2

1

1

1

3

1

–1

–1

4

1

–1

1

5

–1

1

–1

6

–1

1

1

7

–1

–1

–1

8

–1

–1

1

MODELOS

DE



TRANSPORTE

Tabla 3.5.

Presentación de alternativas de Transporte Público

Alternativas

Tarifa (£)

Tiempo de viaje (min)

Frecuencia (buses/hora)

1

0,50

18

2

2

0,50

18

4

3

0,50

25

2

4

0,50

25

4

5

0,80

18

2

6

0,80

18

4

7

0,80

25

2

8

0,80

25

4

Los diseños factoriales fraccionados permiten reducir el número de alternativas a costa de perder uno o más efectos de interacción. En Pearmain et al. (1991) se incluyen algunas directrices sobre cómo reducir el número y complejidad de las opciones, teniendo en cuenta los objetivos del estudio y las restricciones de tiempo y alcance de los instrumentos de encuesta. Un elemento clave en la construcción de un diseño factorial es, de hecho, su complejidad. La experiencia demuestra que las personas responden más verazmente cuando se les pide considerar cambios simultáneos de hasta tres factores únicamente (Huber y Hanson, 1986). Es esperable que la complejidad asociada a responder la encuesta tenga influencia sobre la cantidad de errores en los datos; a este propósito, los pre-tests, el control de la encuesta, el monitoreo de la entrevista y las sucesivas síntesis postoperativas, pueden detectar problemas generales, e incluso se pueden incorporar test en el instrumento de medición para identificar aquellos individuos con menor comprensión del ejercicio. En este sentido parecen particularmente apropiados procedimientos interactivos de encuesta, ya que permiten detectar estos problemas e, inmediatamente, realizar una comprobación más detallada o proporcionar instrucciones adicionales. Ejemplo 3.10: sea un diseño con cinco atributos, dos de ellos con dos niveles de variación y el resto con tres niveles (esto es, un diseño 22 × 32). Dependiendo del número de interacciones que se desee investigar, el número de opciones a presentar variaría de la siguiente forma: • 108 si fuera necesario considerar todos los efectos (diseño factorial completo).



Datos y rol del espacio

• 81 para considerar los efectos principales y todas las interacciones entre pares de atributos, ignorando efectos de orden superior. • 27 para considerar los efectos principales y las interacciones entre un atributo y el resto de los atributos. • 16 si no se consideran interacciones. Una vez que se ha decidido el diseño factorial, se construyen las alternativas tecnológicamente factibles (que, por supuesto, pueden ser hipotéticas), y finalmente se llevan a cabo el experimento y la recogida de información. Fowkes y Wardman (1988) entregan una serie de recomendaciones prácticas para la variación deseable de los niveles de los atributos. Su experiencia indica que puede ser beneficioso sacrificar la pureza del diseño experimental (p. ej., perder la ortogonalidad completa) si se gana en realismo. Además, ellos y otros colegas han sugerido recientemente que en ciertos casos (es decir, cuando se desea estimar relaciones entre parámetros como el valor del tiempo), puede ser preferible un diseño en el que los propósitos y los atributos estén explícitamente correlacionados (Watson et al., 1996). Para optimizar la eficiencia de un diseño PD es necesario poner atención en qué condiciones cambiarían las elecciones; por ejemplo, si existe algún compromiso entre dos o más atributos, éste debería verificarse en el punto en el cual las valoraciones relativas de dos alternativas vuelven indiferente al usuario. Estas valoraciones, definidas por Fowkes (2000) como “valores límite” (boundary values), son útiles para averiguar si el diseño cubre un rango suficiente de valoración de los atributos. Ejemplo 3.11: considérese sólo dos atributos, coste (C) y tiempo (t), que asumen valores diferentes en dos (o más) alternativas y una función de utilidad compensatoria (se estudiará en el Capítulo 7), definida como la suma ponderada de los atributos: Vi = θt ti + θc Ci Entonces, si se comparan las alternativas 1 y 2 (p. ej., bus y tren) se tiene que:

V1 V2   t (t1 t2 )  c (C1 C2 ) El punto de indiferencia entre las dos opciones se obtiene a partir de que V1 = V2 y por tanto:

MODELOS

DE



TRANSPORTE

t (C1 C2 )  (t2 t1 ) c donde la relación θt / θc es el valor límite del atributo tiempo expresado en términos de coste, es decir es el valor del tiempo (véase la sección 13.4). Por ejemplo, en ausencia de efectos aleatorios, un individuo cuyo valor del tiempo sea mayor que θt / θc preferiría la alternativa con un coste más alto, y viceversa; véase el ejemplo en Fowkes (2000). En el caso de que se añada otra variable, por ejemplo, el tiempo de espera, el analista puede, de modo análogo, obtener el valor del tiempo de espera, y si se representan en un gráfico los valores del tiempo de viaje y del tiempo de espera –en consonancia con los datos de las situaciones PD que se presentan a los entrevistados– se obtiene un mapa (o diagrama de rayos), de valores límite que permite verificar si el diseño realizado cubre un rango adecuado de valores. El concepto de diagrama de rayos es ahora generalmente utilizado por la mayoría de los expertos de PD más reconocidos (Bates, 1998). Pearmain y Swanson (1990) han experimentado con el uso de diseños adaptados para las encuestas PD utilizando ordenadores portátiles. Aún más, la utilización de software avanzado les permite modificar el experimento a partir de las respuestas obtenidas por el individuo. Otro enfoque del mismo problema ha sido investigado por Holden et al. (1992). Los resultados sugieren que hay una cierta ganancia en construir diseños PD a la medida de cada entrevistado, aunque en este caso se necesita poner cierta atención en no perder las propiedades deseables de la muestra y el diseño general. En efecto, Bradley y Daly (2000) critican la utilización de diseños adaptativos ya que pueden producir sesgos. Es de destacar que esto es totalmente diferente a la técnica de utilizar diseños fijos a la medida de cada usuario (es decir, no adaptativo) que es un método sumamente recomendado en cuanto a que permite obtener un ejercicio PD mucho más realista; sin embargo, se debe resaltar que ambos enfoques son mucho más fáciles de llevar a cabo en la práctica utilizando un ordenador portátil. Se remite al lector a los tres artículos indicados en estos párrafos para más detalles. Sea cual sea el enfoque adoptado para el diseño experimental en una encuesta PD, es muy importante probar el instrumento de encuesta antes de aplicarlo a gran escala. Para ello se llevan a cabo los siguientes pasos: • Utilizar datos simulados para confirmar que el diseño permite recuperar todos los parámetros del modelo esperado.



Datos y rol del espacio

• Realizar pre-test del instrumento de encuesta utilizando una pequeña muestra estratificada que permita tener en cuenta la opinión del mayor número posible de sectores de interés en la población. • Evaluar los resultados de esta encuesta piloto en términos de la calidad del instrumento de encuesta y de calidad intuitiva de las respuestas obtenidas según estratos de la población. Corregir el instrumento antes de su utilización. Obviamente la encuesta piloto sirve también para comprobar aspectos relacionados con la organización operacional, administrativa y control de calidad del ejercicio. 3.3.4.3.

Presentación de las alternativas

Para garantizar respuestas realistas por parte de los entrevistados es muy importante que los atributos de las alternativas sean presentados de modo parecido a como son percibidos por los viajeros. Ello puede requerir, por ejemplo, la utilización de material gráfico de alta calidad para transmitir cómo se vería el material rodante de un nuevo servicio que se fuera a investigar con PD. El investigador debe tener cuidado de evitar cualquier sesgo implícito en el material ilustrativo utilizado. En este sentido las ilustraciones gráficas son preferibles a las fotografías debido al mayor control que se tiene sobre los detalles incluidos en las mismas. Ejemplo 3.12: en un estudio sobre la importancia de la frecuencia en la demanda por viajes interurbanos (Steer y Willumsen, 1983), se pudo comprobar que aunque diferentes personas perciben la frecuencia de forma distinta, casi nadie se planteó esta variable en términos de trenes por hora o por día. Por lo tanto, la primera parte de la entrevista se utilizó para conocer cómo era percibida la frecuencia por cada viajero, por ejemplo: • “Tomé el último tren que me deja en Newcastle antes de las 11 a.m.; fue el tren de las 7:50 desde Kings Cross”, o bien • “Me limité a llegar a la estación donde descubrí que el siguiente tren a Newcastle iba a salir en 15 minutos”. El entrevistador posteriormente transformó los diferentes atributos de frecuencia del diseño experimental en términos equivalentes; por ejemplo, “Para llegar a Newcastle antes de las 11 a.m. debe coger el tren de las 7:30”,

MODELOS

DE

TRANSPORTE



en la opción de baja frecuencia, o “…coger el tren de las 8:00”, en la opción de frecuencia alta. Alternativamente “…el próximo tren a Newcastle saldrá dentro de 30 minutos” o “…saldrá en 10 minutos”, para cada opción. Se invitó posteriormente a cada viajero a que eligiera entre las alternativas descritas en términos que le fueran familiares, aumentando así el realismo y la relevancia del proceso de elección. 3.3.4.4.

Identificación de las preferencias

El siguiente tema en la construcción de una encuesta de PD se refiere a la forma en que se pide a los encuestados que expresen sus preferencias por cada opción presentada. Como se ha mencionado anteriormente, hay tres formas principales de recoger información sobre preferencias de las alternativas: pidiendo a los encuestados que las ordenen por orden de preferencia, que las valoren o puntúen sobre una escala arbitraria o que elijan una de ellas, en un experimento de elección. Otros enfoques, como, por ejemplo, destinar un presupuesto limitado a usos alternativos, han sido utilizados con mucha menor frecuencia. a) Jerarquizar la respuesta. En este método se presentan al encuestado todas las opciones a la vez, para que las ordene de acuerdo a su preferencia; esto implica, la creación asimismo, de una jerarquía de valores de utilidad. El principal atractivo de este método es que todas las opciones se presentan juntas, pero ello también limita el número de alternativas que pueden considerarse sin fatigar al encuestado. Además el investigador tiene que ser consciente de que los datos obtenidos por este método representan juicios de los individuos, que no tienen que, necesariamente, corresponder al tipo de elecciones que ellos enfrentan en la vida real. b) Las técnicas de puntuación han sido utilizadas durante muchos años por los profesionales de investigación de mercados. En este caso se pide a los encuestados que expresen su grado de preferencia por cada alternativa utilizando una escala arbitraria, a menudo entre 1 y 10, con descripciones específicas de los números principales; por ejemplo, 1 = “fuerte desagrado”, 5 = “indiferencia” y 10 = “fuerte preferencia”. Las respuestas pueden tratarse posteriormente utilizando operaciones aritméticas normales (cálculo de medias, ratios, etc.). Sin embargo, se ha demostrado que las respuestas no son independientes de las escalas utilizadas y de las descripciones asociadas en las mismas. No hay evidencia, por tanto, de que las preferencias individuales puedan ser eficientemente obtenidas y convertidas en escalas



Datos y rol del espacio

de este tipo. No obstante, la base de estas técnicas puede utilizarse para mejorar los experimentos de elección que se presentan en el apartado (c). En este caso, el encuestado expresa su grado de preferencia entre dos alternativas, típicamente en una escala de cinco puntos: “con seguridad elegiría la alternativa A”, “probablemente elegiría la alternativa A”, “no puedo elegir”, “probablemente elegiría la alternativa B” y “con seguridad elegiría la alternativa B”. c) Los experimentos de elección consisten en que el encuestado seleccione una opción entre un par (elección binaria) o entre un grupo de ellas. En su forma más pura, el individuo únicamente elige su alternativa preferida, expresando así la elección en términos análogos a los de las encuestas de preferencias reveladas. En su forma extendida, el encuestado declara sus preferencias sobre una escala como la señalada en el apartado anterior. Para aumentar el realismo se puede incluir la opción “ninguna de las anteriores”, para no forzar la selección de una alternativa menos mala, pero aún inaceptable para el usuario. 3.3.4.5.

Nada es importante

Es recomendable agregar una opción nula al diseño experimental (también conocida como non-purchase option). La razón es que si se presentan dos o más opciones a un individuo y todas ellas resultan inaceptables y no se le proporciona la oportunidad de rechazo total, es posible que esto active un mecanismo secundario de “toma de decisiones” que podría sesgar los resultados del experimento. Este importante problema ha sido ignorado muy a menudo en la práctica. Ejemplo 3.13: Olsen y Swait (1998) estudiaron la veracidad de las siguientes proposiciones en el caso de la compra de un producto cuya venta estaba sujeta a estrictos requisitos previos (p. ej., zumo de naranja concentrado del que se espera que muchos de los potenciales consumidores lo demanden sin azúcar): • Si la opción o alternativa no-compra (non-purchase option [NPO]) no estuviera presente en el experimento, las ponderaciones de los atributos diferirían de aquellos observados respecto de si una NPO se presenta como alternativa en el experimento. • Si una NPO estuviera incluida en el diseño experimental, el analista podría identificar más estructuras no-lineales de preferencias que si las NPO no estuvieran presentes en dicho diseño.

MODELOS

DE



TRANSPORTE

• Modelos basados en los datos sin NPO podrían tener baja capacidad predictiva respecto de aquellos en los que sí se hubiera incluido la NPO; en cambio, modelos basados en datos que incluyan una NPO presentarán una buena capacidad predictiva en cualquier escenario. Olsen y Swait (1998) utilizaron un diseño experimental con tres alternativas, dos niveles de calidad de naranjas, dos niveles de dulzura, dos tipos de envasado (solo o en lotes de cuatro) y dos niveles de precio por unidad. Agregaron también una alternativa barata (con el nombre del supermercado) que consistía en un jugo endulzado hecho con naranjas de baja calidad. Ellos plantearon un diseño factorial que les permitió estimar los efectos principales y las interacciones entre pares de atributos. Se tomaron muestras de igual tamaño (70 individuos) a las que se presentaron 16 situaciones involucrando tres opciones en los diseños con y sin NPO. También se preguntó si los consumidores vetarían la compra de un producto si uno de sus atributos tuviera un nivel inaceptable. Al final se encontró que los parámetros de los modelos estimados no sólo difirieron en magnitud sino que, como se esperaba, el modelo con NPO presentó efectos no-lineales (interacción) significativos. Estos resultados fueron confirmados por un análisis de las respuestas a propósito de vetar un producto dependiendo de sus características (el 63% de la muestra consideraba que el jugo endulzado era inaceptable; el 57% consideraba inaceptable el requisito de comprar paquetes de cuatro unidades). La tabla 3.6 muestra el porcentaje de error en las predicciones para cada grupo de datos utilizando los parámetros estimados con el otro grupo. No hay ninguna duda de que las hipótesis iniciales de Olsen y Swait fueron confirmadas; así que puede concluirse que nada, de hecho, es importante. Tabla 3.6.

Errores cruzados de predicción en productos de mercado

Alternativas

Error de predicción (%) Con NPO → sin NPO

Sin NPO → con NPO

1

3,8

24,8

2

–1,9

21,6

3

–2,8

37,9

NPO



–47,8

 3.3.4.6.

Datos y rol del espacio

Estrategia de muestreo

Al igual que en otros trabajos de toma de datos, durante el diseño de un experimento PD son muy importantes conceptos tales como la composición de la muestra y su tamaño. Un requerimiento básico, común con los estudios PR, es la obtención de una muestra suficientemente grande y representativa. Por otra parte, los estudios PD son estadísticamente eficientes, en el sentido de que cada encuestado no produce una única observación sino varias en el mismo contexto de elección. Por tanto las muestras son habitualmente más pequeñas que en estudios comparables de PR (Bradley, 1988). Originalmente se pensó que unas 30 entrevistas por cada segmento eran suficientes. Sin embargo, se ha comprobado que es más apropiado realizar unas 75-100 encuestas por segmento (ver Pearmain y Swanson, 1990; Bradley y Kroes, 1990; y Swanson et al., 1992). Parte de la dificultad se debe a la naturaleza de la información recogida de las encuestas PD. El hecho de que cada entrevista pueda producir 10 o más respuestas sobre el mismo número de situaciones hipotéticas de elección, ofrece información sobre las variaciones en las respuestas de cada individuo. Sin embargo, para obtener un modelo representativo, se deben incorporar tanto las variaciones entre individuos, como las producidas por un mismo individuo, y esto sólo se puede lograr con una muestra adecuadamente dimensionada y representativa. El problema de representatividad de la muestra puede complicarse en el contexto de experimentos de PD, precisamente debido a la flexibilidad adicional que se obtiene con el método (el analista puede controlar el contexto). Por ejemplo, si se entrevista a un conjunto de individuos de un cierto tipo bien definido (usuarios frecuentes de un servicio dado), sobre la mejora de servicio en el mismo modo, se puede asegurar más fácilmente que el contexto de la encuesta sea conocido para los encuestados (las alternativas planteadas son todas tecnológicamente viables). Sin embargo, un modelo estimado con estos datos ofrecerá escasa fiabilidad sobre el comportamiento de otros grupos, como, por ejemplo, nuevos usuarios que podrían ser atraídos por estas mejoras del servicio. Para estimar la demanda futura es necesario encuestar a muchos tipos de individuos a fin de obtener resultados representativos. Si el método es aleatorio, se pueden necesitar grandes muestras para alcanzar un número adecuado de observaciones sobre elecciones minoritarias. Ya se ha mencionado que en los estudios PR el muestreo basado en la elección resulta un método no muy cos-

MODELOS

DE

TRANSPORTE



toso para estos casos; esto es aún más interesante ya que aplicando una simple corrección durante la estimación de modelos se logra evitar el sesgo estadístico, según se verá en el Capítulo 8. En datos PD, sin embargo, las muestras basadas en la elección pueden introducir un sesgo adicional debido a la forma en que diferentes tipos de individuos perciben o interpretan el contexto de elección (ver Bradley, 1988). 3.3.4.7.

Realismo y complejidad

Un elemento fundamental para el éxito de las encuestas PD es el grado de realismo obtenido en las respuestas. Se han desarrollado ciertas reglas a seguir, descritas por autores como Pearmain et al. (1991). En particular, es necesario salvaguardar la realidad en el contexto del ejercicio, así como en las alternativas de elección que se presentan y en las respuestas que son permitidas. Ello puede lograrse de diversas formas: • Focalizando la atención sobre un comportamiento específico en lugar de sobre el comportamiento general. Por ejemplo, debe preguntarse a los encuestados cómo responderían ante una alternativa en una ocasión concreta, no en un contexto amplio. Cuanto más abstractas sean las preguntas, menos fiables serán las respuestas. • Utilizando un contexto realista de elección, p. ej., uno en el que los encuestados hayan tenido una experiencia reciente. • Manteniendo las restricciones de elección necesarias para que el contexto sea realista. Ello implica normalmente preguntar a los encuestados por sus preferencias respecto a un viaje muy reciente, sin eliminar ninguna de sus restricciones. Por ejemplo, “Si hoy usted prefiriera utilizar su coche para visitar al dentista por la tarde después del trabajo, por favor conserve esta restricción en sus elecciones”. La eliminación de estas restricciones puede provocar respuestas irrealmente elásticas. • Utilizando niveles existentes (percibidos) de los atributos para que las alternativas se construyan alrededor de la experiencia existente. • Utilizando la percepción de los entrevistados para definir las posibles limitaciones de los valores de los atributos en el ejercicio. Por ejemplo, si se trata de mejoras en los servicios de ferrocarril, no presentar opciones en las que la estación esté más cerca de los domicilios que en la realidad. • Asegurando que se incluyan en la presentación todos los atributos relevantes. Ello es especialmente importante si se desea desarrollar modelos de elec-



Datos y rol del espacio

ción de viaje y no solamente medir la importancia relativa de los diferentes atributos. • Planteando el experimento de elección de forma simple, sin sobrecargar cognitivamente al encuestado. Hay que recordar que en la práctica se toman decisiones muy complejas, pero que esto se hace en un período de tiempo muy largo, durante el cual se adquiere experiencia sobre las alternativas existentes a la velocidad de cada cual hasta, finalmente, seleccionar la mejor. En un ejercicio PD estas elecciones se comprimen en un período de tiempo muy corto y por tanto, deben ser simplificadas convenientemente. • Permitiendo a los encuestados optar por una respuesta fuera del conjunto de alternativas experimentales. Por ejemplo, en un ejercicio de elección modal si todas las opciones son muy poco atractivas el encuestado puede decidir cambiar el destino, el tiempo de viaje o incluso no efectuar el viaje. Por ello es necesario dejar una alternativa del tipo “haré otra cosa”. Si se trata de una encuesta realizada por ordenador, se puede programar el acceso a otro ejercicio en el que se investiguen precisamente estas opciones. • Asegurando que todas las opciones se definan claramente y sin ambigüedades. Esto es muy difícil en el caso de atributos cualitativos como la seguridad o el confort. Así, no es recomendable describir alternativas “escasa” o “mejorada”, ya que estas palabras son muy vagas e inducen diferentes interpretaciones por parte de los encuestados. Es preferible describir qué medidas o características están asociadas a mejorar la seguridad o el confort (circuitos cerrados de televisión en todas las estaciones, personal de seguridad presente en todo momento…, aire acondicionado en todos los vagones como en los trenes interurbanos). 3.3.4.8.

Utilización de ordenadores en encuestas PD

En la actualidad es frecuente el uso de ordenadores para la realización de diversos tipos de encuestas, incluyendo las de PD. La utilización de ordenadores presenta ventajas muy significativas respecto a los métodos de “papel y bolígrafo”, pero tiene algunas limitaciones dada la tecnología actual, que discutiremos en primer lugar. En el caso de encuestas de PD es más probable la utilización de ordenadores portátiles, preferiblemente de tamaño pequeño. Sus principales limitaciones han sido la duración de las baterías y su peso, aunque los equipos modernos prácticamente han resuelto estos problemas. Por otro lado, los ordenadores

MODELOS

DE

TRANSPORTE



portátiles actuales poseen un tamaño de pantalla suficiente con color de alta resolución, apto para presentar la cantidad de información necesaria a un precio razonable. Sin embargo, ni siquiera los programas gráficos a base de ventanas desplegables más modernos, pueden proporcionar la facilidad de manejo de tarjetas impresas. Por ello no existen ventajas en la utilización de ordenadores para la mayoría de los ejercicios PD que utilizan jerarquización. Por otra parte, la pantalla de ordenador está perfectamente adecuada para el tratamiento de elecciones entre pares de alternativas en su forma pura y generalizada (escalamiento). También se pueden presentar no sólo los atributos que varían en el experimento PD, sino también otras características que permanezcan fijas, tales como el destino, las horas o cualquier otra información que pueda ser relevante o útil para el encuestado. Sin embargo, lo que hace más atractivas a las entrevistas realizadas con el ordenador es la adaptación del experimento al individuo. La mayor parte de las encuestas PD incluyen un cuestionario en el que se recoge la información sobre el individuo y sobre un viaje reciente (o una compra), información que es utilizada para, posteriormente, construir el experimento. Este cuestionario puede reproducirse en pantalla con ventajas adicionales de validación automática de entradas y asignación de rutas también automáticamente (ver Figura 3.8). A partir de un diseño específico el ordenador puede generar las encuestas PD apropiadas a las circunstancias de cada individuo. Adicionalmente pueden incorporarse comprobaciones lógicas y los rangos válidos de las respuestas, ventanas de ayuda o de información complementaria (p. ej., horarios de servicios) y así mejorar la calidad de la entrevista. La utilización de ordenadores para encuestas PD hace posible el diseño de encuestas mucho más complejas que las planteadas manualmente, aunque esta complejidad no sea aparente para el encuestado, ni siquiera para el encuestador. Por otra parte, el uso de un buen software permite la aleatoriedad del orden en el que aparecen las opciones presentadas a cada individuo, eliminando de esta forma una fuente adicional de sesgo en las respuestas. Además, como todas las respuestas se graban directamente en el disco duro del ordenador, no existen costes adicionales ni errores de grabación de datos, y la información está disponible inmediatamente para su tratamiento. Ciertos paquetes de software ofrecen excelentes prestaciones para el diseño y la codificación de entrevistas muy complejas con un mínimo conocimiento de informática. Entre los más conocidos se encuentran ALASTAIR (Steer Davies Gleave), MINT (Hague Consulting Group) y ACA (Sawtooth Software).



Datos y rol del espacio

Entrevistas a través de ordenador por Steer Davies Gleave ¿Cuánto tiempo fue caminando desde el lugar de aparcamiento hasta su destino?

5 minutos

¿Cuánto tiempo tendrá su vehículo aparcado?

8 horas

0m

¿Cuánto paga por un galón de gasolina? (Presione F1 para £/litro)

1 libra

89 peniques

¿Cuántas millas por galón considera consume su vehículo? (Presione F1 para obtener km/litro)

35,00

¿Si no hubiera podido realizar este viaje con su coche, qué hubiera hecho usted?

Acompañado por alguien Bus Tren Taxi A pie Bicicleta Viajar de otra forma No viajar

Figura 3.8. Ejemplo de cuestionario presentado por ordenador.

Un ejemplo del tipo de pantallas generadas por estos paquetes se incluye en la figura 3.9. En resumen las ventajas prácticas de las entrevistas PD realizadas con ordenador son: • formato consistente para todas las entrevistas y encuestados; • derivación o bifurcación de la pregunta automática, solicitud de datos y validación de respuestas automática; • codificación y almacenamiento de datos automática; • facilidad de adaptación del ejercicio PD a cada individuo; • reducción del tiempo de encuesta, ya que el encuestador no tiene que calcular y preparar las opciones por escrito; • reducción de costes de entrenamiento y formación de los encuestadores; • secuencia aleatoria de las preguntas para reducir sesgos. Por el contrario, existen costes iniciales de inversión en hardware, software, seguros y necesidad de contar con algunos servicios complementarios en campo (discos, lotes de baterías de repuesto, módems, asistencia técnica a los encuestadores y supervisores, etcétera).

MODELOS

DE



TRANSPORTE

Opción 1

Opción 2

CONDUCIENDO COCHE

VIAJANDO EN AUTOBÚS

Tiempo de conducción: 40 min

Tiempo de conducción: 50 min

6 minutos para aparcar en un parking

Hay Autobuses cada 5 minutos

Coste de aparcamiento : £ 3,40

Coste: £ 1,40 ida + vuelta

Coste de combustible: £ 1,90/galón

Un trasbordo entre buses

Unos 5 minutos andando hacia su destino

Unos 5 minutos andando hacia su destino

Salida a: Llegada a:

Salida a: Llegada a:

08:09 09:00

08:00 09:00

¿Qué opción elegiría usted? Definitivamente Opción 1

Posiblemente Opción 1

Figura 3.9.

3.3.4.9.

No puedo decir

Posiblemente Opción 2

Definitivamente Opción 2

Ninguno de ellas

Ejemplo de pantallas de un ejercicio PD de elección del programa ALISTAIR.

Consideraciones sobre la calidad en encuestas de PD

Las técnicas de Preferencias Declaradas han demostrado ser un instrumento muy potente en la búsqueda y desarrollo de modelos, tanto en el ámbito del transporte como en otros sectores. Su valor depende de la aplicación adecuada de las líneas y directrices presentadas y explicadas en las páginas anteriores. En particular, reducir la artificialidad del diseño de la encuesta al mínimo requerido constituye un elemento clave en la consecución de buenos resultados. Cuanto más interesado esté el analista en predecir el comportamiento futuro, más importante es asegurarse de que el contexto de decisión sea concreto (un viaje real, no hipotético) y de que el universo de respuestas corresponda al comportamiento. Uno de los riesgos de las técnicas PD es que es relativamente fácil “tomar atajos” o “reducir la rigurosidad del ejercicio” con el fin de reducir costes. Por ejemplo, se puede permitir que el contexto de la decisión sea menos específico o más genérico. El muestreo es así más sencillo, el cuestionario más simple



Datos y rol del espacio

y, no sorprendentemente, los modelos resultantes bastante creíbles, ya que reflejan un comportamiento “ideal”, en vez de uno sujeto a restricciones. El valor de los indicadores de bondad de ajuste en encuestas PD depende enteramente de la calidad y realismo del experimento. El problema es que los defectos de los modelos obtenidos mediante estudios “más baratos” solamente pueden detectarse con el paso del tiempo. Lo mismo sucede también con las técnicas de análisis que se desarrollan en el Capítulo 8. Un análisis de calidad requiere a menudo la combinación de datos PR y PD para asegurar que los modelos resultantes estén bien anclados (escalados) a las restricciones y al “ruido” del comportamiento real. Las encuestas PD pueden ser una forma eficiente de refinar y mejorar las herramientas de modelización, pero el forzar un coste bajo a expensas de la calidad y de la rigurosidad del análisis, conduce probablemente a resultados decepcionantes y a un apoyo pobre a las decisiones.

3.3.5.

Toma de datos longitudinales

La mayor parte de las discusiones realizadas hasta ahora han sido desarrolladas bajo la hipótesis implícita de que los datos son de tipo corte transversal (fotografía de un momento temporal dado). No obstante, según se señaló en el Capítulo 1, los investigadores del comportamiento de viajeros se han convencido paulatinamente de que los modelos empíricos de corte transversal (cross-section) no son capaces de detectar la inter-temporalidad de la mayoría de las elecciones de viaje. En este apartado se proporciona una breve introducción a los métodos de toma de datos longitudinales y de series temporales, así como a los problemas que presentan. En primer lugar se definen los distintos métodos, para concentrarse posteriormente en el enfoque aparentemente preferido: los datos de panel. En el Capítulo 8 se mencionan los problemas adicionales de la modelización de elecciones discretas para este caso. Finalmente se examinará la evidencia existente sobre los costes aproximados de un ejercicio de toma de datos de panel en comparación con el enfoque más tradicional de corte transversal. 3.3.5.1.

Definiciones básicas

1. Encuestas de corte transversal repetidas. En este caso se realizan medidas similares en muestras de una población equivalente en distintos instantes

MODELOS

2.

3. 4. 5.

DE

TRANSPORTE



de tiempo, sin asegurar que un mismo encuestado se incluya en más de una pasada de toma de datos. Este tipo de encuestas produce una serie de ‘fotografías’ de la población en diferentes momentos temporales. No obstante, la realización de inferencias sobre la población utilizando modelos longitudinales puede sufrir algún sesgo si se utilizan este tipo de datos, y puede ser preferible tratar las observaciones como si fueran obtenidas de una única encuesta de corte transversal (Duncan et al., 1987). Encuesta panel. En este caso se realizan medidas similares, a veces denominadas oleadas, en la misma muestra en diferentes momentos temporales. Existen varios tipos de encuestas panel, como se señala a continuación. Encuesta de panel rotatorio. Es una encuesta panel en la que algunos elementos se conservan en el panel sólo durante una parte de su duración. Encuesta de panel combinado. Es una combinación de encuesta panel y de panel rotatorio. Estudio de cohortes. Es una encuesta panel basada en elementos que provienen de subgrupos de la población que han compartido una experiencia similar (p. ej., nacer en un año determinado).

Es importante distinguir entre encuesta y datos longitudinales. Los últimos consisten en mediciones periódicas de ciertas variables de interés. Aunque en principio es posible obtener datos de panel de una encuesta de sección temporal, normalmente se reconoce que para conseguir datos confiables en el tiempo es mejor realizar un diseño de encuesta panel antes que encuestas con preguntas retrospectivas. 3.3.5.2.

Muestra representativa

Los diseños de panel son frecuentemente criticados porque pueden ser poco representativos de la población inicial ya que, necesariamente, sus muestras envejecen. Sin embargo, esto es estrictamente cierto sólo en diseños de estudios de cohortes que se inician con una muestra no representativa. Por ejemplo, si la muestra consiste en personas nacidas el mismo año, los individuos que se agreguen a la población bien por nacimiento o inmigración, no estarán bien representados en el diseño. En general, el diseño de un panel debe intentar conservar una muestra representativa de la población en el tiempo. Por tanto no sólo debe solucionar los problemas de nacimiento, inmigración o entrada de individuos por otros medios, sino también ser capaz de tratar la incorporación de familias enteras



Datos y rol del espacio

en la población (personas que dejan la casa de sus padres, parejas que se divorcian). Es necesario definir un procedimiento que mantenga una muestra representativa que permita que familias e individuos se incorporen a la muestra con probabilidades conocidas, pero esto no es una tarea sencilla (para más detalles ver Duncan et al., 1987). 3.3.5.3.

Fuentes de error en datos de panel

Un diseño de panel puede añadir (o quitar, si no se realiza con cuidado) calidad a los datos. Aunque generalmente esté reconocido que contactos y entrevistas repetidas permiten alcanzar una mejor calidad de los datos, los paneles se caracterizan por una mayor tasa de no-respuesta con respecto de los métodos de corte transversal, y corren el riesgo de introducir contaminaciones como se verá a continuación. Efectos sobre los errores de respuesta. Los entrevistados en las encuestas panel tienen contacto reiterado con los encuestadores y sus cuestionarios. Esto puede mejorar la calidad de los datos obtenidos por las siguientes razones: • La entrevista repetida en el tiempo reduce el tiempo transcurrido entre el fenómeno investigado y la propia entrevista, tendiendo así a mejorar la calidad de la información recordada. • El contacto repetido incrementa la probabilidad de que el encuestado entienda más claramente el objetivo del estudio. Además las personas pueden verse más motivadas para realizar el trabajo solicitado y producir respuestas más precisas. • La calidad de los datos tiende a mejorar en las oleadas más tardías de un panel, probablemente por el aprendizaje de los encuestados, de los encuestadores o de ambos. Problemas relacionados con la no-respuesta. Bajo el concepto genérico de no-respuesta se incluyen varios conceptos importantes que tienen dos orígenes básicos: la pérdida de una unidad completa de información y/o la pérdida de un dato específico dentro de la unidad. Hensher (1987) discute en detalle la forma de verificar y corregir este tipo de error. Los problemas de no-respuesta asociados con la oleada inicial de un panel, no son diferentes a los de las encuestas de corte transversal, de forma que muy poco se puede hacer para corregir sus posibles efectos. Por el contrario, se tiene mucha información sobre la no-respuesta en oleadas sucesivas, de forma

MODELOS

DE

TRANSPORTE



que dicha información puede ser utilizada para determinar sus principales características, permitiendo que la no-respuesta sea modelizada como parte del comportamiento más general de interés (ver Kitamura y Bovy, 1987). Los diseños habituales de paneles a gran escala dedican una ingente cantidad de esfuerzo en preocuparse de los encuestados. Esto implica instruir a los encuestadores sobre cómo contactar repetidas veces con los individuos así como enviar cartas incentivadoras especialmente diseñadas para reducir las fuentes de resistencia de los encuestados. Contaminación de respuestas. Existe evidencia de que las respuestas obtenidas en la oleada inicial de estudios de panel pueden diferir de las de oleadas sucesivas. Por esta razón en algunos estudios de panel las entrevistas iniciales no se utilizan con propósito comparativo. Una cuestión crucial es saber si la pertenencia al panel afecta al comportamiento en sí mismo o sólo a la información recogida. No existe ninguna prueba definitiva al respecto, pero parece que depende del tipo de comportamiento medido. Por ejemplo, Traugott y Katosh (1979) observaron que los participantes en un panel sobre comportamiento de los electores, incrementaron sus votos (es decir, cambiaron su comportamiento) según fue pasando el tiempo. Esto se debió en parte a una mayor conciencia del proceso político y en parte a que los individuos menos motivados políticamente tendían a abandonar el panel. 3.3.5.4.

Costes relativos de las encuestas longitudinales

No es posible preguntar acerca de los costes de los estudios longitudinales sin hacer referencia a los costes de los métodos alternativos existentes. Una comparación obvia es entre una encuesta de corte transversal, con preguntas sobre un período anterior, y un panel con dos oleadas. Sin embargo, si el estudio longitudinal está diseñado para mantener representativa su muestra cada año y si se dedican recursos suficientes a la misma, puede servir también como una fuente anual de datos representativos de corte transversal y de esta forma podría compararse con una serie de estas encuestas en lugar de solamente con una. Duncan et al. (1987) han realizado algunos cálculos aproximados al respecto, estableciendo que en el primer caso la encuesta longitudinal costaría entre un 20 y un 25% más que la encuesta de corte transversal con preguntas retrospectivas. Pero en el segundo caso, los costes de campo de las sucesivas oleadas del estudio de corte transversal serían de un 30 a un 70% más caros que oleadas adicionales de una encuesta panel, dependiendo de la duración de la entrevista.



Datos y rol del espacio

Hay otros costes, en el caso del panel, producidos por la necesidad de contactar y persuadir a los encuestados y por la necesidad de muestrear nuevamente en cada nuevo estudio de corte transversal. Finalmente, existen otros costes de procesamiento de datos asociados con los paneles, pero éstos deben ser contrastados frente a la mayor oportunidad de comprobar inconsistencias, analizar el efecto de la no-respuesta, etcétera.

3.4.

R EDES Y SISTEMAS DE ZONIFICACIÓN

Una de las primeras y más importantes decisiones a las que tiene que enfrentarse el profesional de la modelización de transporte es el nivel de detalle (resolución) que se va a adoptar en el estudio. Este problema tiene varias dimensiones: esquemas de redes y servicios a considerar, tipo de variables de comportamiento que se incluirán, tratamiento del tiempo, etc. Este epígrafe concentra su atención en establecer consideraciones de diseño relativas a dos de estas decisiones: la definición de la zonificación y de la red. En estos dos casos, al igual que en otros aspectos fundamentales de la modelización de transporte, la opción finalmente elegida refleja un compromiso entre dos objetivos en conflicto: la exactitud y el coste. Se puede alcanzar una gran exactitud utilizando una zonificación más detallada y un sistema de redes más preciso. En el límite, esto implicaría reconocer cada hogar de cada uno de los individuos, su localización, distancia a los puntos de acceso a las redes, etc. Con una muestra suficientemente grande (tasa del 100% durante varios días), se podría lograr una representación muy precisa del sistema actual. Sin embargo el problema de estabilidad temporal debilita esta visión de la exactitud, ya que se necesitaría predecir, con el mismo nivel de detalle, los cambios a nivel de cada hogar individual que afectarían a la demanda de transporte. Esta tarea es imposible e innecesaria. Cuando se realizan prognosis es posible admitir menores niveles de detalle no sólo por motivos económicos, sino por el nivel de exactitud requerido (ver el comentario al respecto en el apartado 3.2).

3.4.1.

Diseño de la zonificación

La zonificación se utiliza para agregar hogares individuales y edificios en porciones tratables del territorio para los objetivos de la modelización. Las dos dimensiones principales de una zonificación son el número de zonas y su tamaño y, evidentemente, ambas están relacionadas. Cuanto mayor sea el

MODELOS

DE

TRANSPORTE



número de zonas, obviamente más pequeñas deberán ser para cubrir la misma área de estudio. En el pasado ha sido una práctica común desarrollar un sistema de zonificación específico para cada estudio y para cada contexto de decisión. Esto es claramente despilfarrador si se realizan distintos estudios en áreas cercanas. Además, la introducción de sistemas zonales diferentes hace difícil la utilización de datos de estudios previos y las comparaciones de modelos en el tiempo. La primera decisión al establecer un sistema de zonificación es distinguir el área de estudio como tal del “resto del mundo”. Existen algunas ideas que pueden facilitar esta elección: • Al elegir el área de estudio se debe considerar el contexto de decisión, la red de transporte que debe ser modelizada y la naturaleza de los viajes que interesan, es decir, si son obligatorios u opcionales, de corta o larga distancia, etcétera. • Para estudios estratégicos se debería definir el área de estudio de forma que la mayoría de los viajes tenga su origen y destino dentro de ella. Sin embargo, esto puede no ser posible en el análisis de problemas de transporte en pequeñas áreas urbanas donde la mayoría de los viaje de interés atraviesan el área e interesa considerar la posibilidad de establecer una circunvalación (by-pass). • Problemas similares surgen en estudios de gestión de tráfico en áreas locales, donde los flujos de tráfico también tienen su origen o destino, o ambos, fuera del área de interés. En estos casos es interesante saber si es posible modelizar los cambios que experimentarían estos viajes como consecuencia de nuevas intervenciones en la red. • El área de estudio tendría que ser algo mayor que el área concreta de interés y debe comprender todos los proyectos de transporte que hayan de ser considerados. Debe permitir el cambio de rutas, cambios en el destino, etc., ya que interesa modelizar sus efectos en el área de estudio. La región externa al área de estudio se divide normalmente en un cierto número de zonas externas. En algunos casos puede ser suficiente considerar cada zona exterior como representante de una parte del “resto del mundo” en una dirección particular. Las fronteras de estas diferentes partes del “resto del mundo” podrían representar áreas naturales conectadas mediante arcos de transporte por los que circulen flujos que alimentan el área de estudio. En otros casos, puede ser ventajoso considerar zonas externas de tamaño creciente con



Datos y rol del espacio

la distancia al área del análisis. Esta consideración puede facilitar el análisis de los impactos sobre diferentes tipos de viajes (corta y larga distancia). Dicha área también debe dividirse en zonas internas más pequeñas. Su número dependerá del compromiso entre una serie de criterios que se señalan más adelante. Por ejemplo, para el análisis y organización de redes de gestión de tráfico se requerirá generalmente zonas más pequeñas, representando incluso aparcamientos de vehículos o los principales generadores/atractores de viajes. Por otra parte, en el caso de estudios estratégicos, se necesitan diseños zonales mucho más amplios. Por ejemplo, en estudios estratégicos de Londres se han usado zonificaciones muy finas con unas 1.000 zonas (para 7,2 millones de habitantes) y varios niveles de agregación de las mismas hasta 50 zonas (a nivel de municipio). En la tabla 3.7 se presentan ejemplos de los números de zonas elegidos en diversos estudios. Tabla 3.7.

Número típico de zonas en varios estudios

Localidad

Londres (1972)

Población

7,2 millones

Nº de zonas

Comentarios zonificación

2.252

Subzonas a nivel detallado

~1.000

Zonas normales

~230

Distritos

52

Municipios

Isla de Montreal (1980)

2,0 millones

1.260

Zonas finas

Ottawa (1978)

0,5 millones

~120

Zonas normales

Santiago (1986)

4,5 millones

~260

Estudios estratégico

Washington (1973)

2,5 millones

West Yorkshire(1977)

1,4 millones

Bogotá (2000) Marsella (2001)

1.075

Zonas normales

134

Nivel distrito

~1.500

Zonas finas

463

Zonas gruesas

6,1 millones

637

Zonas normales

1,5 millones

562

Zonas normales

Las zonas se representan en los modelos de ordenador, como si todos sus atributos y propiedades estuvieran concentrados en un único punto denominado centroide de zona. Este punto se puede considerar flotando en el espacio

MODELOS

DE

TRANSPORTE



y no en una localización física sobre un mapa. Los centroides se conectan a la red mediante los conectores de centroide que representan los costes medios (distancia, tiempo) para incorporarse al sistema de transportes modelizado que tienen los viajes con origen o destino en esa zona. Casi tan importante como el coste asociado a cada conector es el nodo de la red al que se conecta. Estos nodos deben estar próximos a los puntos naturales de acceso/salida de la zona. El papel de los centroides y conectores en la modelización debe contribuir a la definición de los límites de zonas. A continuación se incluye un sencillo listado de criterios de zonificación que han sido recopilados a partir de la experiencia adquirida en varios estudios: 1. El tamaño de las zonas debe ser tal que el error de agregación causado por la hipótesis de que todas las actividades se concentran en el centroide, no sea muy grande. Puede ser conveniente comenzar con un sistema con zonas muy pequeñas, ya que éstas pueden agregarse de varias formas dependiendo de la naturaleza de los proyectos que vayan a ser evaluados. 2. El sistema de zonificación debe ser compatible con otras divisiones administrativas, particularmente las zonas censales. Este criterio es probablemente el fundamental y el resto sólo ha de seguirse si no conduce a inconsistencias con el censo. 3. Es necesario que las zonas sean lo más homogéneas posibles en su composición de usos del suelo y/o población. Las secciones censales con claras diferencias al respecto (p. ej., sectores residenciales con niveles de ingreso diferentes) no deben agregarse, ni aunque sean pequeñas. 4. Es importante que los límites de zonas sean compatibles con los cordones y las líneas-pantalla, así como con los límites de zonificaciones preexistentes. Se ha demostrado en la práctica que se debe evitar el uso de vías o calles principales como límites de zonas, ya que incrementa considerablemente la dificultad de asignar viajes a zonas, cuando éstos se originan o acaban en la frontera entre las mismas. 5. La forma de las zonas debe permitir una identificación sencilla de los conectores de centroides. Esto es particularmente importante para la estimación sucesiva de características intrazonales. Una zona debe representar el área natural de cobertura de las redes de transporte y su(s) conector(es) debe(n) ser identificado(s) de forma que representen los costes principales de acceso a la red.



Datos y rol del espacio

6. Las zonas no tienen porqué ser de tamaño similar. Si acaso pueden ser de dimensiones semejantes en unidades de tiempo de viaje, lo que implica la generación de zonas más pequeñas en áreas más congestionadas. Algunas veces puede ser ventajoso desarrollar un sistema de zonas jerárquico, como el empleado en los Estudios de Transporte de Londres (LTS), en el que las subzonas se agregan en zonas mayores, que a su vez se agregan en distritos, municipios y finalmente sectores. Esto facilita un análisis al nivel de detalle adecuado para diferentes tipos de decisiones. Los sistemas de zonificación jerárquica pueden plantearse con un esquema de numeración zonal adecuado, en el que el primer dígito indica el sector, el segundo el municipio, el tercero el distrito y así sucesivamente.

3.4.2. Representación de redes La red de transporte trata de representar la parte de la oferta dentro del proceso de modelización, es decir, lo que el sistema de transporte ofrece para satisfacer las necesidades de desplazamiento de los viajeros en el área de estudio. La descripción de una red de transporte en un modelo de ordenador puede realizarse con diferentes niveles de detalle y requiere simplificar su estructura, sus propiedades o atributos y la relación entre dichos atributos y los flujos de tráfico. Para una introducción sobre aspectos relacionados con representación de redes, consultar Lamb y Havers (1970). 3.4.2.1.

Detalles de la red

La red de transporte puede representarse con diferentes niveles de agregación dentro de un modelo. En un extremo están los modelos sin ningún arco que se basan en representaciones continuas de la oferta de transporte (Smeed, 1968). Con estos modelos se puede obtener, por ejemplo, una ecuación continua de la capacidad media de tráfico por unidad de área en vez de por elementos discretos o arcos. En un nivel de desagregación ligeramente mayor, se puede considerar una calle o vía individual, pero suponiendo características como la curva flujo-velocidad tomada de un área mucho más amplia; ver, por ejemplo, Wardrop (1968). La práctica normal, sin embargo, es modelizar la red como un grafo dirigido u orientado, es decir un sistema de nodos y arcos conectados (ver Larson y Odoni, 1981). La mayor parte de los nodos representa intersecciones, mientras que los arcos representan tramos de calles o vías homogéneas entre intersec-

MODELOS

DE

TRANSPORTE



ciones. Los arcos se caracterizan por varios atributos como, por ejemplo, longitud, velocidad, número de carriles, etc., y son habitualmente unidireccionales. Incluso si se especifica durante la entrada de datos un único arco de doble dirección, por simplicidad, éste se convierte luego, internamente en dos arcos unidireccionales. Un subconjunto de nodos se asocia a los centroides de zonas y un subconjunto de los arcos a los conectores de los centroides. En la figura 3.10 se presenta una configuración típica de este tipo. Un problema con este enfoque es que la conectividad de un nodo a cada arco que llega a él no tiene coste alguno, pero en la práctica algunos movimientos de giro en intersecciones pueden ser más difíciles de realizar que otros, incluso pueden estar prohibidos. Para representar mejor estas características de la red real, es posible penalizar y/o prohibir movimientos de giro. Esto puede hacerse manualmente desagregando la intersección y asignando arcos separados (llamados a veces arcos ficticios) a cada movimiento de giro y asociando costes diferente a cada uno. Algunos programas comerciales son capaces de llevar a cabo esta desagregación de forma semiautomática, siguiendo instrucciones simples proporcionadas por el usuario sobre los movimientos penalizados o prohibidos. El nivel de desagregación puede incrementarse posteriormente si se utilizan modelos detallados de simulación de tráfico (nivel micro de planificación). En estos casos se utilizan arcos adicionales en intersecciones complejas para tener en cuenta el funcionamiento de los carriles reservados, señales de ceda el paso, etcétera. Las redes son a veces subconjuntos de sistemas más amplios y por tanto pueden ser delimitadas por un cordón que defina los accesos, o puntos del cordón, donde la red de interés está conectada con el resto del mundo. Estos puntos se denominan en ocasiones “puertas” (gateways) y se pueden utilizar arcos ficticios para conectarlos con las zonas exteriores. Una decisión fundamental en la preparación de una red es determinar los niveles de jerarquía viaria que han de incluirse. Si se incluyen más calles, mejor será la representación de la realidad, pero de nuevo aparecerá el problema de los costes del estudio frente al realismo, lo cual puede conducir al modelizador a prescindir de algunos arcos. Además, no tiene mucho sentido incluir un número elevado de vías en la red para después realizar hipótesis más generales sobre giros y demoras en las intersecciones. Tampoco es muy razonable utilizar una red muy detallada junto con un sistema de zonificación menos preciso, ya que los errores de agregación espacial (en términos de conexión de centroides a la red) reducen el valor de todo el proceso. Esto es especialmente importante



Datos y rol del espacio

16 41 15 16

17 14 9

19 23

18 20 8

2

22

21 24

3

25

7

27 28 1 20

35 34 29

30

5

6

11

10

37 36

39

4

31 38

32 12

33

LEYENDA 13

40 17

Figura 3.10.

Centroide Nodo Vial de enlace Límite de Zona Conector

Red de carreteras codificada con arcos y nodos.

MODELOS

DE

TRANSPORTE



en el caso de redes de transporte público, como se verá en el Capítulo 11. Lo que más importa es que la elección de rutas y flujos sea lo más realista posible dentro de las limitaciones del estudio. Jansen y Bovy (1982) investigaron la influencia de la definición y detalle de las redes sobre el realismo de la asignación de flujos en la red. La principal conclusión de su estudio es que se obtienen errores más grandes en los niveles jerárquicos más bajos de la red viaria. Por tanto se debe incluir en la red al menos un nivel por debajo de los arcos de interés. Por ejemplo, en un estudio de vías de tipo A (carreteras nacionales), se ha de incluir las vías de tipo B (carreteras secundarias). En el caso de redes de transporte público se requiere un nivel de detalle adicional. El modelizador debe especificar la estructura de redes que corresponda a los servicios de transporte público ofrecidos. Éstos se codifican como una secuencia de nodos sobre los cuales transita el servicio (autobús, ferrocarril), en donde normalmente cada nodo representa una parada o estación. Las intersecciones sin paradas de autobús pueden, por tanto, excluirse de las redes de transporte público. Además se necesita añadir a las redes dos tipos de arcos adicionales: los arcos a pie, que representan la o las partes del viaje realizadas andando, y los arcos que modelizan los costes adicionales asociados con el trasbordo de uno a otro servicio. 3.4.2.2.

Propiedades de los arcos

El nivel de detalle asociado a los atributos de los arcos depende del nivel general de resolución de la red y del tipo de modelo utilizado. En el nivel mínimo de análisis se requieren los siguientes datos referentes al arco: • Longitud. • Velocidad de recorrido, bien como velocidad a flujo libre o bien como un valor observado para una determinada intensidad de tráfico. • Capacidad del arco, habitualmente en unidades equivalentes de vehículos de pasajeros (PCU) por hora. Además se debe asociar una relación coste-flujo a cada arco, como se señala más adelante. En algunos casos se emplean modelos más elaborados para representar las demoras al flujo de tráfico, pero éstos requieren información adicional sobre los arcos, por ejemplo: • Tipo de vía (autovía, vía principal, calle local).



Datos y rol del espacio

• Anchura de calzada, número de carriles o ambos. • Indicaciones sobre la presencia o ausencia de carriles bus o prohibiciones para el uso de determinados vehículos (p. ej., camiones). • Giros prohibidos o giros que se realizan sólo cuando existe espacio disponible en el tráfico opuesto. • Tipo de intersección y detalles de la misma, incluyendo regulación semafórica. • Capacidad de almacenamiento de colas y su existencia al comienzo de una determinada fase semafórica y/o período de modelización. Algunas investigaciones han identificado como importantes para los conductores otros atributos de rutas, como peajes, señalización y consumo de combustible; ver, por ejemplo, Outram y Thompson (1978) y Wootton et al. (1981). Estudios holandeses han demostrado que el tiempo y la distancia (ponderados) explican solamente el 70% de las rutas realmente utilizadas. La categoría de la vía (autopista, carretera tipo A, tipo B), la calidad escénica, los semáforos y la capacidad contribuyen a explicar la utilización de rutas adicionales. A medida que progrese la comprensión de la influencia de estos atributos en la elección de ruta, se podrán desarrollar modelos de asignación más realistas. La contrapartida a este avance será la necesidad de incluir otras características de las vías, tales como su calidad escénica, número de intersecciones de cada tipo, etcétera. 3.4.2.3.

Costes de las redes

La mayor parte de las técnicas actuales de asignación suponen que, en la elección de ruta, los conductores tratan de minimizar una combinación lineal de tiempo y distancia, denominada a veces coste generalizado. Esta hipótesis es simplista, ya que existen muchas diferencias no sólo en la percepción del tiempo, sino también en su importancia relativa comparada con otras características de las rutas. Sin embargo, la gran mayoría de los modelos de redes utilizados hoy en día trabajan únicamente con distancia y tiempo de viaje. Deben distinguirse dos casos cuando se modeliza el tiempo o el coste de viaje como una función del flujo existente. El primero es cuando se puede suponer que las demoras en un arco dependen sólo del flujo del arco; éste es el caso típico de arcos de gran longitud alejados de intersecciones, y por tanto, es el empleado en la mayor parte de los modelos de asignación interurbanos hasta hoy. El segundo caso se puede encontrar en áreas urbanas, en las que el tiempo o coste de viaje

MODELOS

DE



TRANSPORTE

en un arco depende de forma importante del flujo en otros arcos, por ejemplo, para tráfico no prioritario en una intersección de tipo ceda el paso o glorieta. La introducción de formulaciones muy generales para la relación flujodemora no es complicada hasta llegar al siguiente paso: el equilibrio entre la oferta y la demanda. Aquí, el tratamiento matemático del primer caso (denominado corrientemente como el caso de función de costes separable) es más simple que el del segundo. Sin embargo existen actualmente técnicas matemáticas adecuadas para resolver el equilibrio de la demanda y la oferta en modelos en los que el coste o tiempo de viaje en arcos depende del flujo en varios arcos; es decir, en los casos en los que el efecto de cada flujo no puede ser separado. En el Capítulo 11 se incluye una amplia discusión sobre las relaciones coste-flujo.

EJERCICIOS 3.1. Se requiere estimar la población de una determinada área para el año 2000, pero únicamente se tiene disponible información censal fiable para los años 1970 y 1980, de la forma: P70 = 240 ± 5 y P80 = 250 ± 2 Para estimar la población futura se dispone del siguiente modelo: Pn = Pbtd donde Pn es la población en el año horizonte n, Pb es la población en el año base b, t es la tasa de crecimiento de la población y d = (n – b) / 10, es el número de décadas para extrapolar el crecimiento. Supóngase que los datos de ambos censos son independientes y que el modelo no posee ningún error de especificación. Se pide: a) Encontrar el nivel de exactitud con el que es posible estimar la población para el año 2000. b) Se ofrece información sobre el censo de 1990, pero se advierte que su nivel de exactitud es menor que el de los dos censos previos: P90 = 265 ± 8 Averigüe si es conveniente la utilización de este valor. c) Repetir el análisis suponiendo que el error de especificación del modelo es proporcional a d, y que puede estimarse como 12d%.



Datos y rol del espacio

3.2. Sea el siguiente modelo de reparto modal entre dos zonas i y j (se omite el índice zonal para simplificar la notación):

P1 ($t /  ) 

exp(  t1 ) 1 1   exp(  t1 ) exp(  t2 ) 1 exp(  (t2 t1 )) 1 exp( $t ) P2 ($t /  )  1 P1 

exp( $t ) 1 exp( $t )

donde tk es el tiempo de viaje total en el modo k, y θ un parámetro a estimar. Durante el desarrollo de un estudio, se calcularon los tiempos de viaje como la media de cinco medidas (observaciones) para cada modo, a un coste de $ 1,0 por observación, obteniéndose los siguientes valores: t1 = 12 ± 2 min t2 = 18 ± 3 min a) Si el valor estimado para θ es de 0,1, calcular un intervalo de confianza para P1. b) Supóngase que se está dispuesto a pagar $3 por cada unidad porcentual de reducción en el error de P1. Encontrar si sería conveniente realizar 10 observaciones adicionales en cada modo, en cuyo caso se tendrían los siguientes valores de tk: t1 = 12 ± 1 min t2 = 17,5 ± 1,5 min 3.3. Considérese un área urbana en la que 100.000 personas viajan al trabajo. Sea la siguiente información sobre las mismas: 1. Información general: Número medio de coches por hogar

Ingreso familiar (1.000 $ / año)

Coche

Modo

2,40

120

Metro

1,60

60

Autobús

0,20

10

Total

0,55

25

MODELOS

DE



TRANSPORTE

2. Distribución de la población: Coches por hogar

Ingreso familiar (1.000 $ / año)

0

1

2+

Total

63,6

15,9

0,0

79,5

Medio (25-75)

6,4

3,7

2,4

12,5

Alto (> 75)

0,0

2,4

5,6

8,0

70,0

22,0

8,0

100,0

Bajo (< 25)

Total

Se requiere recolectar información para una muestra de viajeros con el fin de estimar un conjunto de modelos (con un máximo de 8 parámetros), que garantice un error de especificación despreciable si se cuenta con al menos 50 observaciones por parámetro. También se sabe que si se toma una muestra aleatoria al 20% de los viajeros, el error será despreciable y no habrá sesgos. El problema es elegir el método de muestreo más conveniente (aleatorio puro, estratificado o basado en la elección), y para ello se posee también la siguiente información: Coste horario de un encuestador $ 2 por hora Coste de procesamiento de cuestionarios $ 0,3 por formulario Tiempo necesario para clasificar a un encuestado 4 minutos Tiempo necesario para completar una entrevista 10 minutos También se dispone de la siguiente tabla que contiene información sobre los tamaños de muestra recomendados para el caso de muestreo basado en elección: Tamaño de la subpoblación

% a ser entrevistado

< 10.000

25

10.000-15.000

20

15.000-30.000

15

30.000-60.000

10

> 60.000

5



Datos y rol del espacio

3.4. Los resultados de muestras obtenidas de una cierta población, tanto de forma estratificada (basada en el ingreso I), como basada en la elección, son los siguientes: Muestra estratificada Modo

Coche Autobús

Ingreso bajo

Ingreso medio

Ingreso alto

3,33

18,00

20,00

33,34

7,20

4,00

Metro

3,33

4,80

6,00

Total

40,00

30,00

30,00

Muestra basada en la elección Modo

Ingreso bajo

Ingreso medio

Ingreso alto

Total

6,67

20,00

13,33

40,00

Autobús

17,24

2,07

0,69

20,00

Metro

16,67

13,33

10,00

40,00

Coche

a) Si se sabe que las proporciones de la población según ingreso son del 65, 25 y 15% para los niveles de ingreso bajo, medio y alto respectivamente, se solicita construir una tabla equivalente para el caso de una muestra aleatoria. ¿Es posible validar su respuesta? b) Calcular los factores de ponderación que se necesitarían aplicar a las observaciones en el caso de muestreo basado en la elección para estimar un modelo de elección entre coche, autobús y metro utilizando software usual (es decir, el desarrollado para muestras aleatorias).

4. Modelos de generación de viajes

É

ste es el primero de varios capítulos que tratan de los modelos de demanda agregados o de primera generación. Tal y como se ha visto en el Capítulo 1, en el modelo de transporte la fase de generación de viajes tiene por objetivo predecir el número total de viajes generados (Oi) y atraídos (Dj) por cada zona del área de estudio. Generalmente esto se ha visto como el problema de contestar una pregunta como ¿cuántos viajes origina cada zona? Sin embargo, el tema también se ha visto en ciertas ocasiones como un problema de elección de la frecuencia de los viajes, por ejemplo, ¿cuántos viajes, con diferentes propósitos, realizará un cierto tipo de persona durante una semana promedio? En este último caso el problema generalmente es afrontado utilizando los modelos de elección discreta, tal y como se verá en los Capítulos del 7 al 9, y el planteamiento es: ¿cuál es la probabilidad de que un cierto tipo de persona realice cero, uno, dos o más viajes con este motivo de viaje en una semana? En este Capítulo la atención se centrará en el primer enfoque (esto es, predecir los totales Oi y Dj, a partir de datos sobre los atributos socioeconómicos de los hogares); éste ha sido el método más utilizado en la práctica hasta fines de los 90. Los lectores interesados en temas de elección discreta pueden consultar Ben Akiva y Lerman (1985) y obviamente los Capítulos del 7 al 9 de este libro. En la primera parte del capítulo se definirán algunos conceptos básicos y se examinarán algunos factores que influyen en la generación y la atracción de viajes, así como, posteriormente, se revisarán los principales enfoques de modelización comenzando por la simple técnica del Factor de Crecimiento. A continuación, y avanzando hacia un enfoque de modelización más sofisticado, se presenta una razonable revisión de los modelos de Regresión Lineal, que complementa adecuadamente los temas estadísticos presentados previamente en los Capítulos 2 y 3.



Modelos de generación de viajes

Posteriormente se estudiarán los modelos de generación de viajes por regresión linea1 tanto a nivel zonal como del hogar, haciendo particular referencia al problema de no linealidad que a menudo se presenta en estos casos. Se tratará asimismo y por primera vez, el problema de agregación de datos (es decir, determinar los viajes totales por zona) que, en este caso específico, tiene una solución muy simple precisamente debido a la forma lineal del modelo. A continuación serán analizados los Modelos de Clasificación Cruzada (cross-classifìcation) (cross-classifìcation), considerando no sólo la especificación clásica del análisis por categorías, sino también enfoques más contemporáneos incluyendo los modelos de análisis de categorías a nivel de personas. A continuación se examinará la relación existente entre generación de viajes y accesibilidad, incluyendo además una breve discusión sobre los modelos de frecuencia de viajes. El capítulo se cierra, por un lado, con una breve discusión sobre la previsión de las variables explicativas de los modelos y por otro, con los problemas de estabilidad y puesta al día de los parámetros de generación de viajes.

4.1.

INTRODUCCIÓN

4.1.1. Definiciones básicas • Viaje: representa un desplazamiento en una sola dirección de un punto de origen a un punto de destino (McLeod y Hanks, 1986). Generalmente existirá interés por todos los desplazamientos efectuados en vehículo, aunque muchas veces se consideran también los viajes efectuados a pie, más largos que un cierto umbral definido para cada estudio (p. ej., 300 metros o tres calles). Finalmente, con frecuencia se ignoran en el análisis los viajes efectuados por niños de edad inferior a los cinco años. • Viajes basados en el Hogar (HB): son aquellos que tienen un extremo en el hogar de la persona que efectúa el viaje, independientemente de si éste es el origen o el destino del viaje. • Viajes No basados en el Hogar (NHB): son los viajes en los que ni el origen ni el destino del viaje es el hogar. • Producciones de viajes: se definen como el extremo hogar en un viaje HB, o el origen de un viaje NHB (véase la figura 4.1). • Atracción de viaje: se define como el extremo no-hogar en un viaje HB o el destino de un viaje NHB (véase la figura 4.1).

MODELOS

DE



TRANSPORTE

Casa

Trabajo

Producción

Atracción

Producción

Atracción

Producción

Atracción

Atracción

Producción

Trabajo

Comercio

Figura 4.1. Producción y atracción de viajes.

• Generación de viajes: se entiende como el número total de viajes, sean HB sean NHB, generados por los hogares (familias) de cierta zona. Éste es el valor que proporcionan la mayor parte de los modelos, y por ende resta el problema de asignar los viajes NHB a otras zonas como producciones de viaje. Durante los años 80 se añadieron otros términos al diccionario de modelos de transporte, tales como tours y cadenas de viajes, que encajan mejor con la idea de que la demanda de transporte es derivada y depende fuertemente de la demanda por realizar determinadas actividades, aunque en la práctica han sido utilizados predominantemente por los modelizadores de elección discreta (véase Daly et al., 1983).

4.1.2.

Clasificación de viajes

4.1.2.1.

Por propósito del viaje

Está demostrado que en la práctica se consiguen mejores modelos de generación si se modelizan separadamente los viajes por motivo o propósito. En el caso de viajes HB, se utilizan generalmente las siguientes cinco categorías: • • • • •

Viajes al trabajo. Viajes de estudio (al colegio o universidad). Viajes de compras. Viajes sociales y recreacionales. Viajes por otros motivos.

Los dos primeros generalmente se denominan viajes obligados, mientras que todos los demás se llaman viajes discrecionales (u opcionales). En particular, la última categoría encierra todos los viajes efectuados por motivos



Modelos de generación de viajes

menos rutinarios como, por ejemplo: salud, trámites burocráticos (viajes para conseguir un pasaporte o un certificado), acompañar a una persona, etc. Los viajes NHB, en cambio, generalmente no se subdividen en categorías ya que sólo representan el 15-20% del total de los viajes. 4.1.2.2.

Según la hora del día

Los desplazamientos, usualmente, se clasifican en viajes efectuados en el período de hora punta o fuera de punta, ya que la proporción de viajes, con diferentes motivos, varía enormemente según la hora del día. En la tabla 4.1 se sintetizan los datos de la encuesta Origen-Destino realizada en el Gran Santiago en 1977 (DICTUC, 1978); el período punta mañana (el período punta tarde se asume a veces como su imagen especular) ocurriría entre las 7:00 y las 9:00, y el período representativo fuera de punta fue tomado entre las 10:00 y las 12:00. Ante todo, hay que destacar que, mientras la mayor parte (87,18%) de los viajes en la hora punta de la mañana son obligatorios, es decir, realizados por trabajo o estudio, no sucede lo mismo en el período fuera de punta. En segundo lugar llama la atención la gran proporción de viajes por motivos burocráticos en ambos períodos, que es típica de países en desarrollo. También hay que resaltar los viajes de regreso a casa que representan el 41,65% de los viajes totales en el período fuera de punta, pero indudablemente tienen otro propósito. Tabla 4.1.

Ejemplo de clasificación de viajes

Propósito

Punta AM (7:00-9:00)

Fuera de Punta (10:00-12:00)



%



%

Trabajo

465.683

52,12

39.787

12,68

Estudio

313.275

35,06

15.567

4,96

Compras

13.738

1,54

35.611

11,35

7.064

0,79

16.938

5,40

Actividades sociales Salud

14.354

1,60

8.596

2,74

Trámites

34.735

3,89

57.592

18,35

Acompañamiento

18.702

2,09

6.716

2,14

1.736

0,19

2.262

0,73

24.392

2,72

130.689

41,65

Otros Regresando al hogar

MODELOS

DE

TRANSPORTE



El no haber consignado el motivo por el cual la gente salió de casa, que es obviamente más importante que saber que se trataba de un viaje de regreso, constituye un problema originado por una clasificación errada o quizás una falta de previsión en la fase de codificación. De hecho, fue necesario recodificar estos datos con el fin de tener información adecuada para modelizar la generación de viajes (véase Hall et al., 1987). Este tipo de problemas solían ocurrir antes de que el concepto de producciones y atracciones de viajes reemplazara al concepto de orígenes y destinos, que no hacían referencia explícita a la capacidad generadora de las actividades basadas y no basadas en el hogar. 4.1.2.3.

Por tipo de persona

Ésta es otra clasificación importante ya que las características socio-económicas influyen fuertemente en el comportamiento de viaje de los individuos. Normalmente se utilizan las siguientes categorías: • Nivel de renta (p. ej., en la encuesta OD realizada en Santiago de Chile se consideraron nueve categorías). • Posesión de coche (se utilizan generalmente tres estratos: 0, 1 y 2 o más coches). • Tamaño y estructura del hogar (la mayor parte de los estudios británicos utilizan seis estratos). Es importante resaltar que el número total de estratos puede aumentar rápidamente (en el ejemplo comentado son 9 × 3 × 6 = 162), y esto puede tener fuertes implicaciones en términos de la cantidad de datos necesarios y la calibración y utilización de los modelos. Por esta razón, a menudo son necesarios compromisos, adaptaciones y agregaciones (véase la discusión en Daly y Ortúzar, 1990).

4.1.3.

Factores que afectan a la generación de viajes

En la modelización de la generación de viajes generalmente interesan no sólo los viajes realizados por las personas sino también los viajes de mercancías. Por ello es por lo que normalmente se utilizan modelos para cuatro grupos principales (es decir, personas y mercancías, producciones y atracciones). A continuación, se analizan brevemente algunos factores particularmente importantes a la luz de la experiencia adquirida en estudios reales. No se tratará aquí



Modelos de generación de viajes

la modelización de la generación de viajes de mercancías, quedando postergada su discusión hasta el Capítulo 13. 4.1.3.1.

Producciones de viajes de personas

Los siguientes factores se han considerado en muchos estudios prácticos: • • • • • • •

Renta. Posesión de coche. Tamaño del hogar. Estructura del hogar. Valor del suelo. Densidad residencial. Accesibilidad.

Los cuatro primeros factores (ingreso, posesión de coche, estructura y tamaño del hogar) han sido incluidos en numerosos estudios sobre generación de viajes a nivel de hogares, mientras que el valor del suelo y la densidad residencial son típicos de estudios a nivel zonal. En cambio el último factor, la accesibilidad, raramente ha sido utilizado en estudios de generación de viajes, aunque no han faltado diferentes tentativas de incluirlo. La razón es que dicho factor ofrece la posibilidad de que la generación de viajes pueda ser elástica respecto a variaciones en el sistema de transporte. Se volverá sobre este tema en el apartado 4.3. 4.1.3.2.

Atracciones de viajes de personas

Los factores más utilizados para describir la atracción de viajes de personas son la superficie cubierta disponible para la industria, el comercio y otros servicios. Otro factor generalmente utilizado es el número de empleos en cada zona, aunque ciertos estudios también han intentado incorporar alguna medida de accesibilidad. Sin embargo, es importante destacar que en este caso no se han realizado demasiados avances. 4.1.3.3.

Producciones y atracciones de viajes de mercancías

Las producciones y atracciones de viajes de mercancías generalmente sólo constituyen una pequeña parte de los viajes –en el caso de las naciones industrializadas llegan a lo sumo al 20% del total de los viajes realizados en un área determinada– pero pueden ser relevantes en términos de contri-

MODELOS

DE



TRANSPORTE

bución a la congestión. En este caso, algunas variables importantes son las siguientes: • • • •

Número de empleados. Número de ventas. Superficie cubierta de las empresas. Superficie total de las empresas.

Hasta donde alcanza el conocimiento de los autores, ni la accesibilidad ni el tipo de empresa han sido considerados como variables explicativas en los estudios de transporte; en particular es curioso que el tipo de empresa no haya sido tenido en cuenta dado que parece lógico que productos diferentes tengan exigencias de transporte diferentes.

4.1.4.

Método del factor de crecimiento

Desde principios de los años 50 se han propuesto numerosas técnicas para modelizar la generación de viajes. La mayor parte de los métodos intentan predecir el número de viajes producidos (o atraídos) por los hogares o por las diferentes zonas, como una función (generalmente lineal) que debe ser definida en base a los datos disponibles. Antes de efectuar cualquier comparación entre los resultados conseguidos en áreas o en hitos temporales diferentes, es importante aclarar los siguientes aspectos: • ¿qué viajes tienen que ser considerados? (p. ej., sólo los viajes en coche y aquellos a pie de longitud superior a 300 metros); • ¿cuál es la edad mínima a considerar en el análisis? (p. ej., superior a cinco años); A continuación se ilustrará brevemente una técnica que puede ser aplicada para predecir el número de viajes futuros efectuados por cada una de las cuatro categorías citadas anteriormente. Su ecuación de base es la siguiente: Ti = Fiti

(4.1)

donde Ti y ti son, respectivamente el número de viajes futuros y actuales generados por la zona i, y Fi es el correspondiente factor de crecimiento. El único problema de este método es la estimación de Fi; el resto es trivial. Normalmente este factor de crecimiento está ligado a variables como la pobla-



Modelos de generación de viajes

ción (P), la renta o ingreso (I) y la posesión de coche o Tasa de Motorización (C) según una función del tipo:

Fi 

f ( Pi d , I id , Cid ) f ( Pi c , I ic , Cic )

(4.2)

Donde f puede ser incluso una función multiplicativa sin parámetros, mientras que los superíndices d y c representan el año de la prognosis y el actual respectivamente. Ejemplo 4.1: considérese una zona en la que hay 250 hogares que poseen coche y 250 que no lo poseen. Supóngase que se conoce el número medio de desplazamientos generados en un día por cada uno de los dos grupos siguientes: Hogares que poseen coche generan: Hogares que no poseen coche generan:

6,0 viajes/día 2,5 viajes/día

Con esto es fácil deducir que el número de viajes generado al día actualmente está dado por: ti = 250 × 2,5 + 250 × 6,0 = 2.125 viajes/día Supóngase, además, que en el futuro todas las familias tendrán un coche, y que el ingreso y la población permanecen constantes (hipótesis prudente a falta de otros datos). En este caso, podría calcularse el factor de crecimiento así: Fi = Cid / Cic = 1 / 0,5 = 2 y aplicando la ecuación (4.1), se puede estimar el número de desplazamientos futuros así: Ti = 2 × 2.125 = 4.250 viajes/día Como se ha podido observar el método es bastante simple, pero, como se demostrará, también es bastante pobre. En efecto, si se recurriera a la información existente sobre las tasas de viaje y se supone que éstas se mantienen constantes (que es la hipótesis central que subyace detrás del método de prognosis más popular, como se verá más adelante), es posible estimar el número de viajes como: Ti = 500 × 6 = 3.000 viajes/día

MODELOS

DE

TRANSPORTE



lo cual significa que el método del factor de crecimiento sobrevaloraría el número total de desplazamientos generados en cerca del 42%. Esto constituye un problema serio ya que la generación de viajes representa la primera fase del proceso de modelización y los errores cometidos en ésta se propagan a lo largo de todo el proceso y pueden invalidar el trabajo de las etapas siguientes. Por este motivo, en la práctica el método del factor de crecimiento es generalmente utilizado sólo para predecir el número futuro de viajes externos al área, en cuanto que se trata de un número de viajes limitado (dado que el error que se comete no es demasiado grande), y además porque no existen métodos fáciles para predecir tales desplazamientos. En los próximos párrafos se discutirán otros métodos (mejores) que, en línea con el principio de este capítulo, pueden ser también utilizados para predecir tanto la producción como la atracción de viajes, ya sea de personas o de mercancías. A pesar de ello, en el análisis siguiente se hará explícita referencia solamente al caso de producciones de viajes de personas, por cuanto representa no sólo el sector donde hay mayor número de experiencias prácticas, sino también aquel en el que se han conseguido resultados más interesantes.

4.2.

ANÁLISIS DE REGRESIÓN

En la siguiente sección se proporciona una breve introducción a la Regresión Lineal. El lector que esté familiarizado con este tema puede pasar directamente a la sección 4.2.2.

4.2.1. 4.2.1.1.

Modelo de regresión lineal Introducción

Considérese un experimento que se repite varias veces Y = {Yi} para un valor dado de X fijo. Si dicho experimento no es determinístico, se pueden observar diferentes valores de Yi para cada valor de Xi. Sea f i(Y|X ) la distribución de probabilidad de Yi para un valor dado Xi; se dispone, en general, de una función diferente f i para cada valor de X tal y como se muestra en la figura 4.2. Sin embargo, el caso completamente general así planteado es prácticamente intratable, por ello es necesario realizar ciertas hipótesis simplificatorias respecto a la población para que dicho experimento pueda ser modelizado. Dichas hipótesis son las siguientes:



Modelos de generación de viajes

f (X/Y)

Y

μ2 μ3

μ1 x1

x2

x3

x

Figura 4.2. Distribución general de Y dado X.

1. Las distribuciones de probabilidad f i(Y|X) tienen la misma varianza σ2 para todos los valores de X. 2. Las medias μi = E(Yi) están en una línea recta conocida como “recta de regresión verdadera”, la cual viene dada por: E(Yi) = a + bXi

(4.3)

donde los parámetros de la población a y b que definen dicha línea, deben ser estimados a partir de datos muestreados. 3. Las variables aleatorias Y son estadísticamente independientes; esto significa, por ejemplo, que un valor grande de Y1 no tiende a hacer que Y2 sea grande. Estas tres hipótesis simplificatorias se conocen como hipótesis débiles (véase, p. ej., Wonnacott y Wonnacott, 1977) y pueden escribirse más concisamente como: Las variables aleatorias Yi, son estadísticamente independientes con media a + bXi y varianza σ2.

Si se introducen estos cambios en la figura 4.2, resulta la figura 4.3. A veces es conveniente describir la desviación de Yi de su valor esperado como el error o término de perturbación ei, de forma que el modelo también puede escribirse como: Yi = a + bXi + ei

(4.4)

MODELOS

DE



TRANSPORTE

f (X/Y)

Y

x1

μ1

μ3

x2

x3

μ3

E(Y) = a +bX

(regresión verdadera)

x

Figura 4.3. Distribución de Y considerada en la RL.

Hasta aquí no se ha realizado aún ninguna hipótesis sobre la distribución de Y (ni de e, que es idéntica excepto que sus medias son distintas), que tiene una varianza finita. Sin embargo se necesitarán más tarde para derivar algunos tests formales para el modelo. El término del error está usualmente compuesto de errores de medición y especificación (se remite al lector a la discusión en Capítulo 3). 4.2.1.2.

Estimación de los parámetros a y b

La figura 4.4 puede considerarse el gráfico fundamental de la regresión lineal. En ella se representa mediante trazos discontinuos la línea de la regresión E(Y) = a + bX que es evidentemente desconocida por el analista, y debe ser estimada a partir de los datos Y y X de la muestra. En trazo continuo se repreˆ y, como es obvio, esta línea senta la línea de la regresión estimada Ŷ = â + bX no tiene por qué coincidir con la anterior a menos que el analista sea sumamente afortunado (él nunca lo sabrá). En general, lo más que se puede esperar es que los parámetros estimados estén suficientemente próximos a los de la recta de regresión verdadera. Es importante distinguir entre los errores ei, que no son conocidos y que corresponden a la recta de regresión verdadera, y las diferencias, εi entre los observados (Yi) y los valores ajustados (Ŷi), que son un elemento crucial del método de ajuste de recta más atractivo: la estimación por mínimos cuadrados. Si se define una nueva variable x = Xi – X‾, donde X‾ es la media de X, es fácil mostrar que la recta de regresión anterior mantiene su pendiente (b y bˆ respectivamente) pero obviamente cambia su intercepto (a y â respectivamente)



Modelos de generación de viajes

f (X/Y) ˆ Ŷ = â + bX

(regresión estimada)

Y

Y2

Y3

Y1 x1

Figura 4.4.

e3 E(Y) = a +bX

e2

e1

x2

(regresión verdadera)

x3

x

Rectas de RL verdadera y estimada.

en los nuevos ejes coordenados (Y, x). Este cambio es conveniente porque la nueva variable x tiene la siguiente propiedad importante: Ʃi xi = 0. Entonces el mejor estimador de â resulta ser: â = Y‾

(4.5)

lo cual implica que la recta de regresión estimada pasa por el centro de gravedad (X‾, Y‾ ) de la muestra de n observaciones; el mejor estimador de bˆ es, por su parte:

¤ xY ¤x

i i

bˆ 

i

(4.6)

2 i

i

Estos estimadores tienen las siguientes propiedades interesantes: E(â) = a

σ2 Var (â) = ––– n

E(bˆ ) = b

σ2 ˆ = –––– Var (b) xi2

Σ i

Además, la fórmula para la varianza de bˆ tiene implicaciones muy interesantes en lo que se refiere al diseño experimental. Por ejemplo, si los X están muy juntos (como sucede en la figura 4.5a), sus desviaciones respecto a la media X‾ serán muy pequeñas y consecuentemente la suma de los xi será

MODELOS

DE



TRANSPORTE

Y

Y E(Y) = a + bX

E(Y) = a + bX

ˆ Ŷ = â + bX ˆ Ŷ = â + bX

x

(a)

x

(b)

Figura 4.5. Influencia del diseño del experimento en el ajuste.

pequeña; por esta razón, la varianza de bˆ será grande y en consecuencia bˆ será un estimador inestable o poco fiable. En el caso contrario (Figura 4.5b), aunque los errores ε son del mismo tamaño que los señalados previamente, bˆ será un estimador fiable. 4.2.1.3.

Test de hipótesis para bˆ

Para llevar a cabo los correspondientes tests de hipótesis se necesita conocer la distribución de bˆ , pero para ello se exige añadir otra nueva hipótesis denominada hipótesis fuerte, que corresponde a la suposición de que las variables Y distribuyen Normal. Así, como bˆ es una combinación lineal de los Yi, resulta que también distribuye Normal N(b,σ2 / Ʃi xi2). Esto significa que se puede estandarizar haciendo el siguiente cambio de variable:

z

bˆ b

S / (¤ i xi2 )

(4.7)

También es interesante destacar que z2 es una forma cuadrática y que distribuye χ2 con un grado de libertad. Sin embargo no se conoce σ2 (varianza de Y con respecto a la recta de regresión verdadera). Un estimador natural de σ2 es la varianza residual s2 alrededor de la recta estimada, dada por:

¤ (Y Yˆ ) i

s2 

i

n 2

i

2



Modelos de generación de viajes

Se divide por (n-2) para obtener un estimador insesgado de σ2 porque se han empleado dos grados de libertad en calcular â y bˆ que son los parámetros que definen la recta Yi ' (véase Wonnacott y Wonnacott, 1977). Sin embargo, al sustituir σ2 por s2 en (4.7) resulta que el b̂ estandarizado deja de distribuir Normal para distribuir según una distribución t de Student con (n – 2) grados de libertad:

t

bˆ b s / (¤ i xi2 )

(4.8)

Al denominador de (4.8) se le conoce usualmente como error estándar de bˆ y se representa como sb. Entonces dicha expresión queda: t = (b̂ – b) / sb. Test-t de hipótesis para bˆ : la típica hipótesis nula aquí es H0 : b = 0. Entonces la expresión (4.8) se reduce a: t = bˆ / sb

(4.9)

y este valor necesita ser comparado con el valor crítico del estadístico t de Student para un nivel de significación dado α y los correspondientes grados de libertad. Un problema es que la hipótesis alternativa H1 puede implicar un test unilateral (b > 0) o bilateral (b ≠ 0); esto sólo se puede determinar examinando el fenómeno analizado. Ejemplo 4.2: supóngase que para estudiar el efecto del ingreso (I) en el número de viajes de los hogares que no poseen coche (T) se utiliza la siguiente expresión: T =a + bI Como en teoría se puede concluir a priori que si hay influencia, ésta debe ser positiva (es decir, mayor ingreso siempre significa más viajes) en este caso se debe testear (docimar) H0 contra la hipótesis alternativa unilateral H1: b > 0. Si H0 es cierto, el valor t de la ecuación (4.9) se compara con el valor tσ;d, donde d es el número apropiado de grados de libertad y la hipótesis nula se rechaza si t > tσ;d (ver Figura 4.6). Supóngase ahora que se estuviera considerando incorporar una variable cuyos efectos no se sabe si son positivos o negativos (p. ej., número de trabajadoras, en que no se sabe si éstas van a producir más o menos viajes que sus

MODELOS

DE



TRANSPORTE

f(t)

Región de rechazo (1-α) = 0,95

0

Figura 4.6.

Probabilidad 5% t0,05,d

t = bˆ / Sbˆ

Región de rechazo para b con α = 5%.

colegas los trabajadores varones); en este caso la hipótesis nula debería ser bilateral H1 : b ≠ 0, y se rechazaría H0 si 0 no estuviese incluido en el intervalo de confianza de b. Test F para el modelo completo: la figura 4.7a muestra el conjunto de ̂ para los cuales se aceptarían hipótesis nulas individuales como valores (â, b) las anteriores. Si interesara una dócima de hipótesis que permitiese verificar si ambos estimadores son iguales a ciertos valores preconcebidos, como, por ejemplo:

¥ a *´ ¥ 0 ´ ¦ µ¦ µ §b *¶ §0¶ se podría tener una región como la representada en la figura 4.7b, es decir, aceptar que cada parámetro sea cero individualmente no necesariamente significa que se acepta que ambos, simultáneamente, sean iguales a cero. Típicamente, la región conjunta va a ser menor que la intersección de las regiones para cada parámetro por separado. Ahora bien, para realizar el test sobre los dos parámetros es necesario conocer la distribución conjunta de ambos estimadores. En este caso, como sus distribuciones marginales son Normal, la distribución conjunta de ambos parámetros es la Normal bivariada. La distribución F de Fischer se utiliza en este caso para testear la hipótesis nula H0 : (a,b) = (0,0) lo cual puede realizarse a través de paquetes de software comerciales mediante la siguiente expresión para F:

¥ ´ F  ¦ naˆ 2 ¤ xi2 bˆ 2 µ / 2 x 2 § ¶ i



Modelos de generación de viajes

ˆ Conjunto de valores (â, b) para el cual se aceptan las hipótesis H0 individualmente

H0 Región de aceptación para el modelo completo



H0 Región de aceptación



{ {

â

â

H0 Región de aceptación (a)

(b)

Figura 4.7. Región de aceptación para la hipótesis nula: (a) cada parámetro individualmente; (b) ambos parámetros simultáneamente.

La hipótesis H0 se acepta si F ≤ Fα (2,n – 2). Desafortunadamente este test no es muy poderoso (es decir, se rechaza casi siempre), sin embargo pueden construirse tests con hipótesis nulas más interesantes, como, por ejemplo, — H0 : (a,b) = (Y ,0). 4.2.1.4.

Coeficiente de determinación R2

La figura 4.8 muestra la recta de regresión proveniente de la estimación del conjunto de puntos en ella representados. Si no se conocieran los valores de x, — la mejor predicción de Yi sería Y . Sin embargo, para cada valor xi, el error de — este método puede ser grande (Yi – Y ), es decir la desviación de Yi respecto de la media. Ahora bien, si se conoce xi y se ha calculado la regresión de Yi con xi, se puede predecir el valor de Ŷi a partir de la recta de regresión. Esto reduce bastante el error ya que gran parte de la desviación anterior queda explicada por la regresión; así, se cumple que la desviación total puede descomponerse en desviación explicada y no explicada (ver Figura 4.8). De dicha figura se tiene que: —



(Yi – Y ) = (Ŷi – Y ) + (Yi – Ŷi)

i

MODELOS

DE



TRANSPORTE

Y

Yi -Ŷi Desviación no explicada por la regresión

Yi Y‾ Ŷi - Y‾ Desviación explicada por la regresión

ˆ Ŷ = â + bx o

xi

x

Figura 4.8. Desviación explicada y no explicada.

Desviación total = desviación explicada + desviación no explicada. Si se eleva al cuadrado la expresión anterior y se suma para i resulta que:

¤ (Y Y )  ¤ (Yˆ Y ) ¤ (Y Yˆ ) 2

2

i

i

i

i

i

2

i

(4.10)

i

Variación total = variación explicada más variación no explicada. — ̂ i es fácil ver que la variación explicada es una Entonces, como (Ŷ i – Y ) = bx ̂ El proceso de descomponer función del coeficiente de regresión estimado b. la variación total en las dos variaciones expuestas se conoce como análisis de varianza de la regresión, o ANOVA (hay que destacar que varianza es igual a variación dividida por los grados de libertad). El coeficiente de determinación se define como porcentaje de la variación total que es explicada por la regresión, así:

R

2

¤ (Yˆ Y )  ¤ (Y Y )

2

i

2

(4.11)

i

El máximo valor de R2 es 1 (explicación perfecta) y el valor mínimo es 0 (no explica nada); los valores intermedios pueden ser interpretados como el porcentaje de la variación total explicado por la regresión. Este índice es exactamente igual al cuadrado de la correlación muestral R, la cual mide el grado de asociación entre X e Y (véase Wonnacott y Wonnacott, 1977).



Modelos de generación de viajes

4.2.1.5.

Regresión múltiple

La regresión múltiple es una extensión de lo expuesto en la sección anterior para el caso de más variables explicativas y, obviamente, más regresores (pâ Las ecuaciones que resuelven el problema son similares aunque rámetros b). más complejas, pero aparecen algunos problemas nuevos que son importantes, como los que se exponen a continuación: 1. Multicolineariedad. Este fenómeno ocurre cuando hay una relación lineal entre las variables explicativas; en este caso las ecuaciones para los regresores b̂ no son independientes y no pueden resolverse de forma única. 2. ¿Cuántos regresores se deben incluir? Para tomar una decisión al respecto se deben tener en cuenta los siguientes factores: • ¿Existen razones teóricas fuertes para incluir una variable dada o es importante para las políticas probar con el modelo? • ¿Es significativa la variable (es decir, es H0 rechazada en el test-t) y el signo del coeficiente estimado es consistente con la teoría o la intuición? Ante la duda, una manera de resolver la situación es quitar la variable del modelo y re-estimar la regresión para, así, ver el efecto de su extracción sobre el resto de los coeficientes; si dicho efecto no es demasiado importante, se ha logrado eliminar una variable en dicho modelo de regresión por parsimonia (el modelo es más simple, de forma que el resto de los parámetros pueden estimarse con más precisión). Los paquetes de software comerciales proporcionan un procedimiento “automático” para resolver este problema; sin embargo, esto puede inducir algunos inconvenientes como los que se comentan más adelante. Se volverá sobre esta cuestión en la sección 8.3 (Tabla 8.1) cuando se trate el tema de los modelos de elección discreta y sus problemas de especificación. 3. Coeficiente de determinación. Tiene la misma forma que la presentada en la ecuación (4.11). Sin embargo, en este caso la inclusión de otros regresores aumenta siempre el coeficiente R2; para resolver esta dificultad se utiliza el coeficiente R2 corregido, que se define así:

R 2  ¨ª R 2 k / (n 1) ·¹ ; (n 1) / (n k 1)=

(4.12)

donde n representa el tamaño de la muestra y k es el número de regresô res b.

MODELOS

DE

TRANSPORTE



En la modelización de la generación de viajes, el método de la regresión múltiple se ha utilizado en el caso de datos agregados (zonal) y en el de datos desagregados (hogar e individuos). En el caso de las producciones de viajes, la primera línea de trabajo ha sido prácticamente abandonada, pero aún es el método más importante para la modelización de las atracciones de viaje.

4.2.2.

Regresión zonal múltiple

La regresión zonal múltiple consiste en encontrar una relación lineal entre el número de viajes producidos o atraídos por cada zona y el valor medio de algunas características socioeconómicas de los hogares que residen en cada una de ellas. Algunas consideraciones interesantes son las siguientes: 1. Los modelos zonales sólo pueden explicar la variación en el comportamiento de viaje entre zonas. Por este motivo sólo pueden proveer resultados válidos si las variaciones interzonales reflejan adecuadamente las razones reales que están detrás de la variabilidad de los viajes. Para que esto ocurra es necesario no sólo que las zonas tengan una composición socioeconómica homogénea, sino también que representen el espectro más amplio posible de condiciones. Desafortunadamente, un problema importante es que las principales variaciones en los datos relativos a los viajes de las personas se obtienen a nivel intrazonal. 2. Papel del intercepto en los modelos de regresión. Aunque en general no es de esperar que la recta de regresión pase por el origen es muy frecuente conseguir valores del intercepto bastante grandes (en relación al producto del valor medio de las variables por sus respectivos coeficientes). Si esto sucede, la ecuación de la recta de regresión puede ser rechazada; y si, por el contrario, el intercepto no es significativamente distinto de cero, puede ser útil re-estimar dicha recta de regresión, forzándola a pasar por el origen. 3. Zonas nulas. Es posible que ciertas zonas no ofrezcan información acerca de algunas variables dependientes (p. ej., en las zonas no residenciales podrían no existir desplazamientos tipo HB). En este caso, las zonas nulas deben ser excluidas del análisis; en efecto, aunque su inclusión no debería influir de modo significativo en el valor de los coeficientes estimados (en cuanto que la ecuación debería pasar por el origen), el incremento arbitrario del número de zonas que no proporcionan datos útiles tiende a producir estadísticas que sobrevaloran la precisión de la regresión estimada.



Modelos de generación de viajes

4. Valores totales versus a valores medios. Cuando el analista formula el modelo, puede elegir si utilizar variables agregadas o totales, como por ejemplo, el número total de desplazamientos y el número total de coches por zona, o bien valores medios para cada zona, como el número de viajes por hogar y de coches por familia en cada zona. En el primer caso el modelo de regresión lineal admite la siguiente forma:

Yi   0 1 X 1i  2 X 2 i L  k X ki Ei mientras que el modelo con valores medios adquiere la forma:

yi   0 1 x1i  2 x2 i L  k xki ei donde yi = Yi / Hi; xi = Xi / Hi; ei =Ei / Hi; y Hi es el número de hogares en la zona i. Ambas ecuaciones son idénticas, en el sentido de que intentan explicar la variabilidad del comportamiento de viaje entre zonas, y en los dos casos los parámetros tienen el mismo significado. La única y fundamental diferencia está ligada a la distribución del término de error, en cuanto a que es obvio que la condición de variancia constante del modelo no puede ser cierta en ambos casos, a menos que Hi fuera el mismo para todas las zonas i. Dado que las variables agregadas reflejan directamente el tamaño de la zona, su utilización debería implicar que la magnitud del error depende, efectivamente, de dicho tamaño; los resultados prácticos evidencian la presencia de esta heterocedasticidad (variabilidad de la variancia). La utilización de multiplicadores como, por ejemplo, 1 / Hi, permiten que el modelo sea independiente del tamaño de la zona y, por tanto, reducir dicha heterocedasticidad. En esta misma línea, las variables agregadas tienden a tener una intercorrelación más alta (es decir, multicolinearidad). No obstante, los modelos con variables agregadas a menudo producen valores de R2 más altos, pero esto es sólo un efecto espúreo ya que, obviamente, la dimensión de las zonas ayuda a explicar el número total de viajes (véase Douglas y Lewis, 1970). Lo que ciertamente se debe evitar es mezclar variables agregadas y medias en un solo modelo. Para finalizar esta cuestión, es importante recordar que aunque se utilicen valores medios, las regresiones zonales siempre están influenciadas por la naturaleza y la dimensión de las zonas, debido al problema de agregación espacial. En efecto, tal y como se muestra en la tabla 4.2, construida con datos

MODELOS

DE



TRANSPORTE

correspondientes a Perth (Douglas y Lewis, 1970), la variabilidad interzonal disminuye al aumentar el tamaño de la zona. Tabla 4.2.

Variaciones interzonales en las producciones de viajes personales para dos diferentes sistemas de zonificación Valor medio de viajes por hogar y por zona

Varianza interzonal

75 zonas pequeñas

8,13

5,85

23 zonas grandes

7,96

1,11

Sistema de zonificación

4.2.3.

Regresión a nivel de hogares

Aunque las variaciones intrazonales pueden ser reducidas disminuyendo el tamaño de las zonas, sobre todo si son homogéneas, esto implica un aumento en el número de las zonas, lo cual tiene dos consecuencias: • Modelos más caros en términos de recolección de los datos, calibración y utilización. • Errores de muestreo mayores, que se suponen inexistentes en los modelos de regresión lineal múltiple. Por estas razones parece lógico utilizar modelos que sean independientes de los límites zonales. A principios de los años 70 se pensaba que la unidad de análisis más apropiada era el hogar (y no el individuo), en cuanto a que, en un modelo individual, la serie de interacciones interpersonales presentes dentro de un hogar (p. ej., la disponibilidad del coche, es decir, quién lo utiliza), no puede ser incorporada ni siquiera implícitamente. Esto se discute en el apartado 4.3.3. En una aplicación basada en el hogar, cada familia es tomada como un vector de datos de entrada al modelo, a fin de incorporar toda la gama de variabilidad observada respecto de las características de la familia y de sus viajes. La calibración, como en el caso de los modelos zonales, es un proceso que va paso a paso (stepwise) testeando, iterativamente, cada una de las variables hasta que se obtenga el mejor modelo (en términos de ciertos procesos estadísticos sinópticos para un nivel dado de confianza). Es necesario, sin embargo, poner atención en la utilización de los procedimientos automáticos paso a paso disponibles en paquetes de software



Modelos de generación de viajes

especializado, puesto que puede ocurrir que algunas variables, mucho más fáciles de calcular en las previsiones, queden fuera de dicho software porque predicen ligeramente peor que otras que son incluidas por el procedimiento automático. Ejemplo 4.3: se consideran las siguientes variables: viajes por hogar (Y), número de trabajadores (X1) y número de coches (X2). La tabla 4.3 ilustra los resultados de los pasos sucesivos de un modelo utilizando la técnica paso a paso; la última línea también muestra (entre paréntesis) los valores del test-t (t = b / sb). Para muestras de tamaño grande, el número apropiado de grados de libertad (n – 2) resulta suficientemente grande para poder confrontar los valores del test-t con el valor crítico de 1,645 para un nivel de significación del 95% con un test de una sola cola (en este caso se sabe que la hipótesis nula es unilateral, ya que Y debería crecer al crecer tanto X1 como X2). Tabla 4.3.

Ejemplo de regresión paso a paso

Paso

Ecuación

R2

1

Y = 2,36X1

0,203

2

Y = 1,80X1 + 1,31X2

0,325

3

Y = 0,91 + 1,44X1 + 1,07X2 (3,7)

(8,2)

(4,2)

0,384

Se aprecia que, a pesar del bajo valor del R2, el tercer modelo es el mejor, de hecho el intercepto, igual a 0,91, no es grande (si se compara, p. ej., con 1,44 veces el número de trabajadores) y los coeficientes de la regresión son significativamente diferentes de cero (H0 se rechaza en todos los casos). El modelo probablemente podría mejorarse si se incluyesen otras variables. Se puede obtener un indicador de la bondad de estos modelos confrontando los viajes observados promedio con los modelizados para algunas estratificaciones de la muestra (véase la tabla 4.4). Ciertamente utilizar esta técnica es mejor que comparar los valores totales en cuanto que, en esta última situación, podrían compensarse los errores no permitiendo detectar, por tanto, la correspondiente distorsión. Tal como se muestra en la tabla 4.4, la mayor parte de las celdas presenta una aproximación razonable (es decir, errores inferiores al 30%). Si se presen-

MODELOS

DE



TRANSPORTE

Tabla 4.4.

Comparación de viajes domiciliarios (observados/estimados) Número de trabajadores por hogar

Número de coches

0

1

2

3 o más

0

0,9/0,9

2,1/2,4

3,4/3,8

5,3/5,6

1

3,2/2,0

3,5/3,4

3,7/4,9

8,5/6,7

4,1/4,6

4,7/6,0

8,5/7,8

2 o más

tasen errores superiores, sería necesario ajustar los parámetros del modelo, aunque esto no es una tarea fácil pues no hay reglas claras sobre cómo proceder, y los resultados dependen fuertemente del contexto de aplicación.

4.2.4.

El problema de la no-linealidad

Tal como se ha visto anteriormente, el modelo de regresión lineal supone que cada variable independiente ejerce una influencia lineal sobre la variable dependiente. Desafortunadamente la no-linealidad no es fácil de detectar, ya que relaciones aparentemente lineales pueden terminar siendo no lineales si se permite la incorporación de otras variables al modelo. En este caso, puede ser útil la utilización de gráficos multivariados. Por ejemplo, en la figura 4.9, se ilustran datos para hogares estratificados en grupos de acuerdo a la tasa de motorización (posesión de coche) y al número de trabajadores y puede verse

Viajes por hogar (HB)

5

1 coche 1 trabajador

4 3 2

0 coche 1 trabajador

1 1

2 3 4 5 Personas en el hogar

6

Figura 4.9. Ejemplo de no-linealidad.



Modelos de generación de viajes

que el comportamiento de los viajes no es lineal con respecto a la variable tamaño familiar. Es importante señalar que hay clases de variables (p. ej., las cualitativas), que presentan normalmente un comportamiento no lineal (tipo de vivienda, ocupación del jefe de la familia, edad, sexo, etc.). En general hay dos métodos para incorporar las variables no lineales en el modelo: 1. Transformar las variables de modo que se linealice su efecto (p. ej., tomar el logaritmo o elevar a la potencia). Desafortunadamente la selección de la transformación más adecuada no es un ejercicio fácil o arbitrario y requiere gran atención; si se es acucioso, puede requerir también mucho tiempo y esfuerzo. 2. Utilizar variables dummy. La variable independiente se divide en intervalos discretos y cada uno de ellos se trata separadamente dentro del modelo. Operando de este modo no es necesario asumir que la variable tenga un efecto lineal, en cuanto a que cada parte de la variable es considerada separadamente en términos de efectos sobre el comportamiento de viaje. Por ejemplo, en el caso de posesión de coche, se pueden establecer determinados intervalos discretos como, por ejemplo, 0 coches, 1 coche, 2 o más coches por hogar. Dado que cada hogar de la muestra sólo pertenece a un intervalo, la correspondiente variable dummy asume el valor 1 en la correspondiente clase y 0 en las otras. Es fácil ver que sólo (n – 1) variables dummy son necesarias para representar n intervalos. Ejemplo 4.4: considérese el modelo del ejemplo 4.3 en el que se asume que la variable X2 sea sustituida por las siguientes variables dummy: • Z1 = 1 para hogares con un coche y 0 en otros casos; • Z2 = 1 para hogares con dos o más coches y 0 en otros casos. Es fácil ver que las familias u hogares que no poseen ningún coche corresponden a la situación en la que Z1 y Z2 son nulos. En este caso, el tercer modelo de la tabla 4.3 resultaría ser ahora el siguiente: Y = 0,84 + 1,41X1 + 0,75Z1 + 3,14Z2 (3,6)

(8,1)

(3,2)

R2 = 0,387

(3,5)

Aunque el valor de R2 no hubiera sido mejor que el del tercer modelo de la tabla 4.3, este nuevo modelo habría sido preferible ya que el efecto no lineal de

MODELOS

DE



TRANSPORTE

X2 (o de Z1 y Z2) es ciertamente evidente y no se puede ignorar. Obviamente si los coeficientes de las dos variables dummy hubieran resultado, por ejemplo, iguales a 1 y 2, y no hubiera en la muestra más de dos coches por hogar, el comportamiento sería lineal. Este modelo se representa gráficamente en la figura 4.10. Regresión 2 o más coches

Viajes por hogar (HB)

10 9 8 7 6 5 4 3 2 1

Regresión 1 coche Regresión 0 coche

1

2 3 4 5 6 Empleados por hogar (X1)

Figura 4.10. Modelo de regresión con variables dummy.

Observando la figura cabe preguntarse si no sería preferible estimar regresiones separadas para cada grupo, ya que así no se obliga a que cada una de las rectas tenga la misma pendiente (representada por el coeficiente de X1). La respuesta generalmente es negativa, a menos que se disponga de una razonable cantidad de datos para cada una de las clases. La clave de la cuestión es que el modelo con variables dummy utiliza todos los datos, mientras que regresiones separadas emplearían sólo una parte de la muestra y esto normalmente es desfavorable. Además, también es interesante recordar que la utilización de variables dummy frecuentemente reduce los problemas de multicolinearidad en los datos (véase Douglas y Lewis, 1971).

4.2.5.

Cálculo de los totales zonales

En el caso de los modelos de regresión zonal, el cálculo de los totales zonales no representa un problema puesto que el modelo está estimado a ese nivel. Los modelos basados en hogares, en cambio, requieren una fase de agregación para pasar del nivel hogar a la estimación de viajes totales por zona. No obstante,



Modelos de generación de viajes

dado que los modelos son lineales, esta operación es fácilmente solucionable sustituyendo en cada variable independiente del modelo, el respectivo valor medio que tiene ésta para la zona, y luego multiplicando por el número de hogares en cada zona. Es importante resaltar, sin embargo, que en el caso de modelos no lineales la fase de agregación puede resultar extremadamente compleja, tal como será expuesto en el Capítulo 9. Por ejemplo, para el tercer modelo de la tabla 4.3 se tendría:

Ti  H i (0,91 + 1,44X 1i + 1,07X 2 i ) donde Ti representa el número total de viajes HB en la zona i, Hi el número total de hogares en la misma zona y X‾ji el valor medio de la variable Xj, para la misma zona. Por otro lado, cuando se utilizan variables dummy es necesario conocer el número de familias pertenecientes a cada clase en cada zona; así, para el modelo presentado en el ejemplo 4.4 resultaría:

Ti  H i (0,84 + 1,41X 1i ) + 0,75H1i + 3,14H 2 i donde Hji representa el número de familias pertenecientes a la clase j en la zona i. Esta última expresión permite observar otra ventaja asociada a la utilización de variables dummy con respecto de la estimación de regresiones separadas. Como se aprecia, para agregar los modelos en el último caso haría falta estimar el número medio de trabajadores por familia (X1) para cada grupo de tasa de motorización en cada zona y ello puede resultar bastante complicado.

4.2.6.

Ajuste entre generaciones y atracciones

Es bastante fácil darse cuenta de que los modelos ilustrados anteriormente no garantizan automáticamente que, para cualquier zona, el número total de viajes generados (los orígenes Oi) sea igual al número de viajes atraídos (los destinos Dj); no se garantiza, por tanto, que la siguiente relación se verifique:

¤O  ¤ D i

i

j

j

(4.13)

El problema es que esta ecuación es implícitamente requerida por el siguiente submodelo (distribución de viajes) en la estructura del modelo de demanda. No es posible, en efecto, obtener una matriz de distribución de viajes en la que

MODELOS

DE



TRANSPORTE

el número total de viajes (T) obtenido al sumar todas las filas sea diferente del obtenido al sumar todas las columnas (véase el Capítulo 5). La solución a este problema es pragmática y se basa en el hecho de que los modelos de generación son mucho “mejores”, en todos los sentidos, que los correspondientes modelos de atracción. Esto se debe a que los primeros son modelos basados en el hogar bastante sofisticados que utilizan tradicionalmente buenas variables explicativas. Sin embargo, para la atracción de los viajes en el mejor de los casos se dispone de modelos estimados utilizando datos a nivel zonal. Por este motivo, en la práctica normalmente se considera que el número total de viajes que resulta de la suma de todos los orígenes Oi representa el valor correcto del total de los viajes T. Por ende, los destinos deben ser multiplicados por un factor f, que asegure que la suma de las atracciones sea igual a T. Su valor es:

f 

T ¤ Dj

(4.14)

j

4.3.

ANÁLISIS POR CATEGORÍA O CROSS-CLASSIFICATION

4.3.1. 4.3.1.1.

El modelo clásico Introducción

Hasta fines de los 60 la mayoría de los estudios de planificación de transportes en EE.UU. desarrollaron ecuaciones de generación de viajes basadas en análisis de regresión lineal, especialmente en el caso de producciones de viajes de personas. En efecto, el modelo de regresión fue seleccionado como el método central de la guía para el análisis de generación de viajes de la Federal Highway Administration (FHWA, 1967). A finales de la década de los 60 apareció otro método alternativo para la modelización de la generación de los viajes, que se convirtió rápidamente en el método preferido en el Reino Unido. Fue conocido con el nombre de Análisis por Categoría en Gran Bretaña (Wootton and Pick, 1967) y en EE.UU. recibió el nombre de Análisis de Clasificación Cruzada. Este enfoque siguió el mismo proceso de desarrollo del modelo de regresión lineal, en el sentido de que primeramente se desarrollaron procedimientos a nivel zonal y sólo posteriormente se ha utilizado información a nivel del hogar.



Modelos de generación de viajes

El método consiste en estimar la respuesta (p. ej., el número de viajes producidos por cada hogar por un motivo dado) como una función de los atributos del hogar, y se basa en la hipótesis de que las tasas de generación de viajes son relativamente estables en el tiempo para determinadas categorías de hogares. Estas tasas se determinan empíricamente y para esto generalmente se necesita contar con una gran cantidad de datos; de hecho un elemento crítico en el procedimiento es el número de hogares en cada grupo. Aunque el método fue diseñado originariamente para utilizar los datos del censo británico, un problema serio es la necesidad de estimar el número de hogares en cada categoría a futuro. 4.3.1.2.

Definición de las variables y especificación del modelo

Sea tp (h) el número promedio de viajes realizados por miembros de un hogar de tipo h con motivo p (en un cierto período de tiempo). Los tipos de hogares son definidos en base a la estratificación seleccionada; por ejemplo, una clasificación basada en m categorías relativas al tamaño del hogar y n categorías relativas a clases de tasa de motorización determinará m × n tipos h de hogar. Para calcular las tasas correspondientes a cada celda, el método estándar consiste en asociar los hogares, en los datos de calibración, a cada una de las celdas y calcular, en cada caso, el número de desplazamientos observados T p (h) por motivo. La tasa de viajes t p (h) es, por tanto, igual a la razón entre el número total de desplazamientos en la celda h para cada motivo y el número de hogares H (h) en aquella celda. En términos matemáticos resulta:

t p ( h)  T p ( h) / H ( h)

(4.15)

El “arte” del método consiste en elegir las categorías de forma que la desviación estándar de la distribución de frecuencias, representada en la figura 4.11, sea mínima. El método presenta, en principio, las siguientes ventajas: 1. Las clases son independientes del tamaño de las zonas del área de estudio. 2. No se hace ninguna suposición, a priori, sobre la forma funcional de las relaciones (es decir, la función no tiene por qué ser monótona y, aún menos, lineal). 3. Las relaciones pueden tener forma diferente de clase a clase (de hecho, el efecto de una modificación en el tamaño del hogar puede ser diferente en función del número de coches que posea la familia).

MODELOS

DE



TRANSPORTE

t p (h)

Figura 4.11.

Distribución de tasas de viajes por tipología de hogar.

Sin embargo y al igual que los métodos de clasificación cruzada tradicionales, presenta también varias desventajas: 1. El modelo no permite la extrapolación más allá de los estratos calibrados, aunque las clases externas pueden ser dejadas abiertas (es decir, se puede tener una clase del tipo: familias con dos o más coches y cinco o más domiciliados). 2. No hay técnicas estadísticas de bondad de ajuste del modelo; por lo tanto, sólo se puede medir la cercanía agregada a los datos de calibración. 3. Se requiere una muestra muy grande; de lo contrario, los valores de las celdas varían en fiabilidad a causa de la diferencia en el número de hogares disponibles para la calibración en cada una. Por ejemplo, en el estudio de uso de suelo y transporte de Monmouthshire (véase Douglas y Lewis, 1971), se obtuvo una distribución como la indicada en la tabla 4.5, para 108 categorías (seis niveles de renta, tres niveles de posesión de coche y seis niveles de estructura del hogar), para una muestra de 4.000 hogares. Una regla generalmente aceptada es que para estimar valores medios confiables se requiere al menos 50 observaciones por celda. Así, en la muestra Tabla 4.5.

Distribución de frecuencia de los hogares Nº de categorías

Nº de hogares en la encuesta

21

69

9

7

2

0

1-49

50-99

100-199

200+



Modelos de generación de viajes

de 4.000 hogares, este criterio fue satisfecho sólo en 18 de las 108 celdas consideradas. La utilización de muestras estratificadas puede garantizar una mejor distribución de la muestra entre las diferentes categorías; sin embargo, ello da lugar a un aumento de los costes de muestreo. 4. No hay un modo eficiente para elegir las variables de clasificación o para elegir la mejor clasificación de cada variable; la minimización de las desviaciones estándares, sugerida en la figura 4.11, requiere de un laborioso procedimiento iterativo de “prueba y error”, que puede ser considerado inviable en estudios reales. 5. Es difícil predecir el número de hogares en cada categoría a futuro. 4.3.1.3.

Aplicación del modelo a nivel agregado

Sea n el tipo de persona (p. ej., con o sin coche), sea ai (h) el número de hogares de tipo h en la zona i, y sea H n (h) el conjunto de hogares de tipo h en el que viven las personas de tipo n, las producciones de viajes personales tipo n en la zona i, (Oin) vienen dadas por:

Oinp 

¤

hH n ( h )

ai (h)t p (h)

(4.16)

Para verificar cómo trabaja el modelo, se pueden comparar los valores modelizados (Oinp ) con los valores observados en la muestra de calibración. Los posibles errores, inevitables, se deben a la utilización de valores medios para t p (h); pero, debería esperarse que una mejor estratificación produjese errores menores (en el sentido de minimizar la desviación estándar de la figura 4.11.) Existen diversas maneras de definir las categorías de hogares. El estudio original del método en el Reino Unido (Wootton y Pick, 1967) utilizó 108 categorías de la siguiente forma: seis niveles de ingreso, tres niveles de posesión de coche (0, 1 y 2 o más coches por hogar) y seis grupos de estructura familiar, como se ilustra en la tabla 4.6. El problema más complicado es cómo predecir el número de familias, a futuro, en cada categoría. El método más comúnmente utilizado (véase Wilson, 1974) parte por definir y estimar distribuciones de probabilidad del ingreso (I), de la tasa de motorización (C) y de la estructura familiar (S) con los datos de calibración para, posteriormente, construir una función de distribución de probabilidad conjunta de pertenecer al tipo de hogar h = (I,C,S). Entonces, si

MODELOS

DE



TRANSPORTE

Tabla 4.6. Grupo

Ejemplo de agrupamiento de la estructura familiar Nº de empleados

Otros adultos

1

0

1

2

0

2o+

3

1

1o–

4

1

2o+

5

2o+

1o–

6

2o+

2o+

ϕ(h) = ϕ(I,C,S) es la función de distribución conjunta, el número de hogares ai(h) de la zona i que pertenecen a la clase h viene dado por: ai (h) = Hi ϕ(h)

(4.17)

donde Hi representa el número total de hogares en la zona. Este modelo de estimación de los hogares puede ser parcialmente testeado, ejecutándolo con datos relativos al año de base utilizados para la calibración. Es posible contrastar el total de viajes estimados con la ecuación (4.16), pero utilizando los valores simulados para ai (h), con los valores observados. En esta fase se evidencia otra desventaja posterior del método: 6. En el caso de que fuera necesario incrementar el número de variables de la estratificación, habría que aumentar enormemente el tamaño de la muestra. Por ejemplo, si a la aplicación original, discutida líneas atrás, se sumara otra variable dividida en tres niveles (p. ej., la posesión de motocicletas en un modelo para una ciudad en Asia), el número de categorías aumentaría de 108 a 324 (recuérdese la discusión relativa a la tabla 4.5).

4.3.2. Mejoras al modelo clásico 4.3.2.1.

Análisis de Clasificación Múltiple (ACM)

El análisis de clasificación múltiple es un método alternativo para definir las clases y testear los resultados del Análisis por Categorías y proporciona un procedimiento estadístico potente para la selección y clasificación de las variables, que permite superar muchas de las desventajas anteriores. A continuación



Modelos de generación de viajes

se especifica una síntesis del método, en tanto que para una descripción más detallada se recomienda consultar Stopher y McDonald (1983). Considérese un modelo con una variable dependiente continua (como la tasa de viajes) y dos variables independientes discretas, como el tamaño del hogar y la tasa de motorización. La media de la variable independiente se puede estimar tanto para la muestra completa de hogares como para cada fila y columna de la matriz de clasificación cruzada. A su vez, éstas últimas medias pueden expresarse como desviaciones de la media global. Observando los signos de las desviaciones, se pueden estimar valores de la variable dependiente para cada celda de la matriz, añadiendo a la media global las desviaciones de sus respectivas filas y columnas correspondientes a la citada celda. De este modo, es posible compensar los problemas resultantes de tener pocas observaciones en algunas celdas, como suele suceder. Ejemplo 4.5: en la tabla 4.7 aparecen los datos recogidos en un área de estudio y clasificados según tres niveles de posesión de coche y cuatro niveles de tamaño de hogar. Dicha tabla representa el número de hogares observado en cada celda (categoría) y la media del número de viajes por hogar calculada por fila, columna y total. Tabla 4.7.

Número de hogares por celda y tasas medias de viaje 0 coches

1 coche

2o+ coches

Total

Tasa media de viajes

1 persona

28

21

0

49

0,47

2 ó 3 personas

150

201

93

444

1,28

4 personas

61

90

75

226

1,86

5 personas

37

142

90

269

1,90

Total

276

454

258

988

Tasa media de viajes

0,73

1,53

2,44

Tamaño hogar

1,54

Como puede apreciarse, el rango de valores va desde 0 (ya que es poco probable encontrar hogares con una persona y más de un coche) a 201. Aunque en este ejemplo se haya realizado una clasificación cruzada para sólo dos variables hay, en todo caso, cuatro celdas con un número de observaciones

MODELOS

DE



TRANSPORTE

inferior al número mínimo convencional requerido (50) para estimar valores fiables de la media y de la varianza de las tasas de viaje. Para poder estimar el valor medio de la tasa de desplazamientos (tasas promedio de viaje) para cada celda, incluyendo aquellas sin observaciones en la muestra, se procede de la siguiente manera: por ejemplo, para el caso de 0 coches, se calcula la desviación (de la media global) como 0,73 – 1,54 = –0,81; para el caso de un coche, 1,53 – 1,54 = –0,01 y para dos o más coches resulta 2,44 – 1,54 = 0,90. Procediendo de modo análogo para los grupos de tamaño familiar, se obtienen las siguientes desviaciones: –1,07, –0,26, 0,32 y 0,36. Si las variables no están correlacionadas es posible elaborar una tabla completa de las tasas de viaje a partir de estos valores; así, la tasa de viajes para hogares con una persona y un coche sería 1,54 – 1,07 – 0,01 = 0,46 viajes. Sin embargo, en el caso de un hogar, una persona y ningún coche, la tasa resulta ser negativa (–0,34 = 1,54 – 1,07 – 0,81); como no tiene significado físico una tasa de viajes menor que cero, ésta se “fuerza” a cero. La tabla 4.8 ilustra los resultados de las tasas de viaje incluyendo las desviaciones correspondientes a filas y columnas. Tabla 4.8.

Tasas de viaje calculadas por clasificación múltiple

Tamaño hogar

Tasa de motorización 0 coches

1 coche

2 o + coches

Desviaciones

1 persona

0,00

0,46

1,37

–1,07

2 ó 3 personas

0,46

1,27

2,18

–0,26

4 personas

1,05

1,85

2,76

0,32

5 personas

1,09

1,89

2,80

0,36

–0,81

–0,01

0,90

Desviaciones

A diferencia de los modelos clásicos de clasificación cruzada, en este caso no sólo se calculan las desviaciones por hogar en la celda correspondiente, es decir, una persona-un coche, sino que por cada clase de posesión de coche se calculan las desviaciones con respecto de todos los tamaños del hogar y viceversa. Por tanto, si hay interacciones, las desviaciones deberían ajustarse para tomar en cuenta sus efectos. Ello se puede lograr tomando una media ponderada para cada una de las medias de cada grupo de una variable independiente con respecto de las clases de las otras variables independientes, en lugar de una



Modelos de generación de viajes

media simple (lo cual sería, en efecto, equivalente a asumir que la variación entre los datos de un grupo fuera aleatoria). Si hay interacciones, estas medias ponderadas tenderán, en general, a disminuir el tamaño de los ajustes respecto a la media global. Sin embargo, aún en ese caso las medias de las celdas de una clasificación múltiple estarán basadas en medias estimadas para todos los datos disponibles, y no sólo en los datos correspondientes a la celda en cuestión. Los índices de bondad de ajuste más importantes asociados al ACM son (Stopher y McDonald, 1983): • Un estadístico F para evaluar el esquema completo de clasificación múltiple (recordar la discusión en el apartado 4.2). • Un estadístico de razón de correlación para evaluar la contribución de cada variable de clasificación (ver Stopher, 1975) y • Un índice R2 para el modelo completo de clasificación cruzada. Estas medidas le permiten al analista comparar diferentes esquemas de clasificación y evaluar su ajuste a los datos del año de base. Aparte de las ventajas estadísticas, es importante recalcar que los valores de las celdas ya no dependen solamente del tamaño de la muestra para cada categoría, sino que se basan en la media global –derivada a partir de la muestra completa– y en dos o más medias de clase que se derivan de los datos para cada clase relevante a la celda en cuestión. Ejemplo 4.6: en la tabla 4.9 se presenta un conjunto de tasas de viaje para los mismos datos anteriores, pero calculadas de acuerdo al método estándar de Análisis por Categorías (esto es, utilizando medias individuales para cada celda). Al comparar estos valores con los de la tabla 4.8 se llega a dos conclusiones interesantes. En primer lugar, el método ACM permite estimar tasas de viajes aun para celdas que estén vacías. En segundo lugar, algunas tendencias contra-intuitivas de la tabla 4.9 (p. ej., la disminución de las tasas de viaje para hogares con menos de dos coches al aumentar el tamaño familiar de 4 a 5 o más personas) desaparecen en la tabla 4.8; hay que resaltar también que estos efectos, al menos en uno de los casos, podrían deberse al tamaño, demasiado pequeño, de la muestra. En caso de existir interacciones entre las variables de estratificación, se puede utilizar una versión corregida del ACM (Stophen y McDonald, 1983). Ésta simplemente consiste en calcular las tasas medias para cada nivel de tasa de motorización y tamaño del hogar (e ingreso, si la estratificación lo considera),

MODELOS

DE



TRANSPORTE

Tabla 4.9.

Tasas de viaje para el mismo estudio calculadas mediante análisis por categorías

Tamaño hogar

Tasa de motorización 0 coches

1 coche

2 o + coches

1 persona

0,12

0,94



2 ó 3 personas

0,60

1,38

2,16

4 personas

1,14

1,74

2,60

5 personas

1,02

1,69

2,60

ponderando por la proporción de hogares (o individuos) a ese nivel (independientemente de los niveles de las restantes variables de estratificación), y luego hacer los cálculos normales del ACM para estimar las tasas de viaje por celda. Esto permite tomar en cuenta las interacciones, ya que los promedios ponderados disminuyen el tamaño de la desviación con respecto a la media global. Ortúzar et al. (1998) usaron este método en un estudio sobre la estabilidad de las tasas de generación de viajes en Santiago, Chile, para clases formadas por el cruce de ingreso (cinco niveles), tasa de motorización (tres niveles) y tamaño familiar (tres niveles); se encontró que los resultados eran efectivamente superiores a los del ACM normal. 4.3.2.2.

Análisis de regresión estratificado

En ciertas ocasiones, el método más adecuado para modelizar la generación de viajes puede ser una mezcla de clasificación cruzada y análisis de regresión. Por ejemplo, en un área en el que la distribución del ingreso sea muy desigual, es posible que sea importante medir el impacto diferencial de determinadas políticas en los diferentes estratos de ingreso; de esta forma, puede ser necesario modelizar la demanda de transporte para cada grupo de ingreso de forma separada a través del proceso completo. Si además, en el área está creciendo de forma importante la tasa de motorización y, como usualmente, no queda claro cuán correlacionadas están ambas variables, puede ser útil postular modelos de regresión basados en variables que describan el tamaño y conformación de los distintos hogares, para una estratificación basada en las dos variables anteriores. Ejemplo 4.7: la tabla 4.10 presenta las 13 categorías de ingreso y tasa de motorización (Ci) definidas en el Estudio Estratégico de Transporte del Gran



Modelos de generación de viajes

Tabla 4.10. Ingreso hogar (US$/mes)

Número de hogares en cada estrato en la muestra de Santiago, 1977 Tasa de motorización del hogar 2o+

Totales

0 coches

1 coche

< 125

6.564 (C1)

215 (C2)

6.779

125-250

4.464 (C3)

627 (C4)

5.091

250-500

1.532 (C5)

716 (C6)

87 (C7)

2.334

500-750

305 (C8)

436 (C9)

118 (C10)

859

> 750

169 (C11)

380 (Cl2)

301 (C13)

790

Total

12.974

2.373

506

15.853

Santiago (ESTRAUS, 1989) y el número de hogares en cada una, de acuerdo a la encuesta origen-destino (EOD) de 1977 (DICTUC, 1978). Como se puede observar, la mayor parte de los datos se corresponden con hogares sin coche e ingreso bajo. También se ve que las categorías 7 y 10 tienen menos datos; éste es, desafortunadamente, un problema bastante común de este enfoque (de hecho, las 13 categorías incluyen bastantes agregaciones). Las variables independientes utilizadas en este análisis, después de haber excluido las utilizadas para estratificar, incluyeron variables relativas a la fase del ciclo de vida del hogar, aspecto que será discutido en el apartado 4.4. Una extensa búsqueda de la mejor especificación dio como resultado que las variables de regresión más significativas eran el número de trabajadores (divididos en cuatro categorías, de acuerdo a ingreso y tipo de ocupación), de estudiantes y de residentes. Los modelos de regresión lineal estimados con estas variables para cada una de las 13 categorías resultaron satisfactorios en términos de signos, interceptos pequeños, niveles de significación razonables y valores de R2 (p. ej., entre 0,401 para la categoría 4 y 0,682 para la categoría 7; ver Hall et al., 1987).

4.3.3. 4.3.3.1.

Enfoque basado en categorías de personas Introducción

Ésta es una alternativa interesante a los modelos basados en el hogar, que fue propuesta originariamente por Supernak (1979) y que ofrece las siguientes ventajas (Supernak et al., 1983):

MODELOS

DE

TRANSPORTE



1. Un modelo de generación de viajes a nivel de personas es compatible con otros componentes del sistema clásico de modelización de la demanda de transporte, que se basa en viajeros en lugar de en hogares. 2. Admite un esquema de clasificación cruzada que utiliza todas las variables importantes y permite un número manejable de clases; ello permite, a su vez, predecir la representación de clases más fácilmente. 3. El tamaño de la muestra requerido para desarrollar un modelo por categorías de personas puede ser varias veces más pequeño que el requerido para estimar un modelo basado en categorías de hogares. 4. En un modelo por categorías de personas, los cambios demográficos pueden considerarse más fácilmente, pues ciertas variables demográficas fundamentales en modelización (como la edad) son virtualmente imposibles de definir a nivel de hogar. 5. Las categorías de personas son más fáciles de predecir que las categorías de hogar, ya que en este último caso se requieren previsiones sobre la formación del hogar y sobre su tamaño; estas cuestiones se evitan totalmente en el caso de categorías de personas. En general, la mayor parte de los viajess es realizado ppor personas mayores de 18 años; esta población es más fácil de predecir a 15 ó 20 años vista, ya que sólo se necesitan tasas de migración y de supervivencia para hacerlo. La mayor limitación que puede tener un modelo por categorías de personas se relaciona precisamente con la razón principal de por qué, al final de los años sesenta, se eligieron los modelos basados en el hogar para reemplazar a los modelos de generación zonal; ésta fue la dificultad de introducir, en un modelo basado en categorías de personas, los efectos de interacciones en el hogar así como costes y presupuestos monetarios. Sin embargo, Supernak et al. (1983) defienden que no está claro cuán importantes son estas consideraciones y cuestionan su incorporación eficaz incluso en los modelos de generación de viajes basados en el hogar; de hecho, la discusión en las secciones 4.2.3 y 4.3.1 deja claro que esto debe tratarse de forma implícita solamente. 4.3.3.2.

Definición de variables y especificación del modelo

Sean tj la tasa de viajes, es decir, el número de viajes realizados por un individuo (promedio) de la categoría j durante un cierto período de tiempo y tjp la tasa de viajes por motivo p, Ti el número total de viajes realizados por los habitantes de la zona i (todas las categorías juntas), Ni el número de habitantes de la



Modelos de generación de viajes

zona i y αji el porcentaje de habitantes de la zona i que pertenece a la categoría j. Por lo tanto, se puede escribir la siguiente relación básica:

Ti  N i ¤  ji t j j

(4.18)

Como en otros métodos, los viajes se dividen en basados (HB) y no basados (NHB) en el hogar, y también pueden ser divididos en función del propósito (p) del viaje, lo cual puede ser aplicado tanto a viajes HB como a viajes NHB. El modelo se desarrolla según las siguientes fases: 1. Consideración de varias variables que se espera sean importantes para explicar las diferencias en la movilidad de las personas. Asimismo, definición de categorías de personas plausibles utilizando estas variables. 2. Análisis preliminar de tasas de viajes en orden a encontrar qué variables tienen menor poder explicativo y pueden excluirse del modelo. Esto se realiza comparando las tasas de viaje de categorías que sólo se diferencien por la variable analizada y testeando si sus diferencias son estadísticamente significativas. 3. Realizar un detallado análisis de las características del viaje para encontrar variables que definan categorías similares. Deben ser excluidas aquellas variables que no proporcionen una explicación sustancial de la varianza de los datos y también aquellas que dupliquen la explicación proporcionada por otras variables mejores (es decir, más fácil de predecir o más apropiadas para análisis de políticas). El ejercicio se realiza bajo la restricción de que el número final de categorías no debe exceder de cierto máximo práctico (p. ej., 15 clases). Para este análisis se pueden utilizar los siguientes indicadores: coeficiente de correlación (Rjk), pendiente (mjk) e intercepto (ajk) de la regresión t jp = ajk + mjk tkp. Las categorías j y k pueden ser tratadas de forma similar si los citados índices satisfacen las siguientes condiciones (Supernak et al., 1983): Rjk > 0,900 0,75 < mjk < 1,25 ajk < 0,10

(4.19)

MODELOS

4.3.3.3.

DE



TRANSPORTE

Aplicación del modelo a nivel agregado

Las producciones de viajes zonales a nivel del hogar se obtienen directamente a partir de la ecuación (4.18), o si se desea se puede hacer del mismo modo de forma más desagregada incluyendo los propósitos de viaje. Sin embargo, la estimación de atracciones de viaje en general y las producciones NHB a nivel zonal no son tan sencillas, ya que requieren el desarrollo de métodos ad hoc muy dependientes del tipo de información disponible para cada aplicación (véase Supernak, 1979 para un ejemplo desarrollado en Polonia).

4.3.4.

Generación de viajes y accesibilidad

Tal como se indicó en el Capítulo 1, la especificación clásica del modelo de planificación de transporte urbano (cuatro etapas), sigue un proceso iterativo entre la fase de distribución de viajes y la asignación, dejando inalterada la fase de generación/atracción. Una desventaja importante de este proceso, válida también en el caso de los métodos modernos que intentan resolver de forma apropiada el complejo equilibrio entre oferta y demanda (véase el Capítulo 11), es que supone implícitamente que los cambios en la red no afectan a la cantidad de viajes producidos y atraídos. Esto significa, por ejemplo, que la extensión de una línea de metro hasta una localidad no servida anteriormente no originaría un número mayor de viajes entre esta zona y las restantes. Aunque esta hipótesis podría mantenerse en el caso de viajes obligados, posiblemente no podría en el caso de viajes discrecionales. Por ejemplo, considérese el caso de viajes de compra y una nueva línea de Metro que conecte una zona de bajos ingresos con el mercado central de la ciudad, que tiene precios más competitivos que los de sus tiendas locales. Para resolver este problema, los técnicos en modelización han intentado incorporar una medida de la accesibilidad (es decir, una medida de la facilidad o dificultad de realizar desplazamientos desde/hacia cada zona) dentro de las ecuaciones de generación de viajes. El objetivo es reemplazar Oin = f(Hin) por Oin = f(Hin, Ain) donde Hin representa las características de los hogares y Ain es una medida de la accesibilidad por tipo de persona. Las medidas de accesibilidad típicas tienen la siguiente forma general:

Ain  ¤ f ( E nj , Cij ) j



Modelos de generación de viajes

donde Ejn representa una medida de la atracción de la zona j y Cij el coste generalizado de viaje entre las zonas i y j. Una expresión analítica típica de la accesibilidad es la siguiente:

Ain  ¤ E nj exp(  Cij ) j

donde β es un parámetro de calibración que deriva del modelo gravitacional, como se verá en el Capítulo 5. Desafortunadamente, este procedimiento raramente ha producido los resultados esperados en el caso de modelos agregados, ya que los parámetros estimados de la variable de accesibilidad han resultado no significativos o de signo equivocado. Este tema ha sido, durante muchos años, de gran interés y está ligado claramente a dos interesantes problemas aún no resueltos: la modelización dinámica y la modelización con datos longitudinales en lugar de datos de sección transversal (Capítulo 1). Ortúzar et al. (2000b), realizan una interesante discusión del problema, y ofrecen un ejemplo de lo que se puede ganar utilizando, en este contexto, datos de preferencias declaradas. Un trabajo desarrollado en el Reino Unido sobre los efectos del tráfico inducido en la evaluación de infraestructura vial troncal (Department of Transport, 1997) proporcionó un nuevo impulso a los modelos elásticos de generación de viajes. Este trabajo condujo al estudio de métodos de generación de viajes que fueran sensibles a variaciones en la accesibilidad, ya que se reconoció que los métodos clásicos no eran adecuados en este sentido. Daly (1977) propone un marco de trabajo basado en tres componentes para la generación de viajes: • En su contexto familiar, el individuo estructura sus actividades en el correspondiente período de modelización, por ejemplo, un día. Evidentemente las actividades realizadas fuera de casa son las únicas que generan viajes. • Las actividades fuera de casa se organizan en “estancias” (soujorns), definidas como la permanencia en una localización específica, donde cada una de ellas tiene un objetivo primario (y posiblemente, a la vez, objetivos secundarios también en la misma localización). • Se formula un plan de viaje que relacione las correspondientes “estancias”, en particular para decidir cuáles requieren ser visitadas por tour HB (dos o más viajes) y cuáles pueden ser enlazadas con otras estancias a través de viajes NHB.

MODELOS

DE

TRANSPORTE



A partir de estas tres componentes parece razonable ver la posibilidad de modelizar el número de “estancias” generadas por un hogar o por una persona y luego subdividir estas “estancias” en tours HB y viajes NHB. Un aspecto práctico de modelización que se deriva inmediatamente de ese marco es que las variables dependientes (es decir, el número de tours y/o de viajes o alternativamente el número de “estancias” que pueden ser realizadas), necesariamente será un número entero: 0, 1, 2, 3, etc. Además, puede esperarse que la decisión de efectuar o no efectuar el viaje (es decir, entre 0 y 1), se tome sobre una base diferente de la decisión de hacer más de un viaje (la primera, en efecto, concierne a la decisión de realizar o no cierta actividad, la segunda, en cambio, concierne a cómo organizar el tiempo y el lugar, dado que va a existir algún grado de participación). Otro punto a tener en cuenta en este proceso es que para asegurarse de que todas las actividades sean consideradas, es necesario incluir los viajes realizados en todos los modos; así la no inclusión de viajes cortos o de viajes en modos no motorizados reduciría la calidad del modelo. Todo esto es pues coherente con el tema de recolección de datos O-D tratado en el Capítulo 3. Las variables que deben ser incluidas en el modelo son las mismas que las de los métodos clásicos tratados anteriormente, aunque es de esperar que la accesibilidad pueda incorporarse. Sin embargo puede existir una influencia negativa cruzada entre las accesibilidades HB y NHB; por ejemplo, si pueden realizarse fácilmente viajes HB, como en ciudades pequeñas, entonces habrá una menor necesidad de hacer viajes NHB. La previsión del número de “estancias” debe ser hecha para cada uno de los motivos de viaje (es de destacar que pueden variar las variables que influyen en cada tipo de viaje). Primeramente se deberían modelizar los viajes por motivos obligados y posteriormente los viajes por otros motivos, que evidentemente dependerán de las decisiones tomadas sobre los viajes obligados. De modo análogo, debe ser explícitamente modelizada la elección entre satisfacer una necesidad de viaje a través de un tour HB o un viaje NHB como desviación de un tour anteriormente planificado (Algers et al., 1995), aunque también pueden ser aceptables modelos independientes como simplificación. Por último, aunque sea posible construir modelos de frecuencia de viajes para describir el comportamiento de un hogar completo (p. ej., considerando todas las interacciones que pueden ser relevantes para el número de viajes realizados), en la práctica, dada la naturaleza de los datos disponibles, resulta mucho más simple desarrollar modelos a nivel individual.



Modelos de generación de viajes

Modelo Logit de elección de frecuencias. Daly (1997) analiza diferentes modelos concluyendo que el más adecuado es el que tiene una forma tipo logit (véase el Capítulo 7) y que predice el número total de viajes calculando primeramente la probabilidad de que cada individuo decida hacer un viaje y después multiplicando tal probabilidad por el número relativo de individuos pertenecientes a la categoría correspondiente. El método se puede extender al caso de varios individuos que efectúan más de un viaje, como se muestra más adelante. Si V es la utilidad de realizar un viaje (asumiendo, sin pérdida de generalidad, que la utilidad de no viajar es cero), la probabilidad de hacer ese viaje viene dada por:

P1 

1 1 exp( V )

en que V generalmente se especifica como una función lineal de parámetros desconocidos θ:

V  ¤ k X k k

donde X son datos medidos como el ingreso, la posesión de coche, el tamaño del hogar y la accesibilidad, la cual debe ser introducida en el modelo de forma consistente con la teoría de maximización de la utilidad (que es la teoría que sustenta al modelo logit). Por esta razón, la mejor forma de introducir la accesibilidad es utilizar un resultado popularizado por Ben Akiva y Lerman (1979), que indica que la forma correcta de la accesibilidad es el “logsum” del modelo de elección del destino (o del modo); además, tal y como se tratará en la sección 7.4, ya que en este caso se tiene una estructura logit jerárquica, el parámetro que multiplica la variable logsum de accesibilidad debe estar comprendido entre 0 y 1. Si esta condición no se cumple, las previsiones del modelo pueden ser inconsistentes con el sentido común (Williams y Senior, 1977). El modelo logit representa, para cada individuo, la elección de efectuar o no efectuar un viaje, y por tanto resulta particularmente apto para tratar datos desagregados. También puede ser utilizado con datos agregados, pero en este caso la probabilidad P representa un porcentaje más que una probabilidad. Utilizando datos desagregados se tiene una mayor posibilidad de encontrar

MODELOS

DE



TRANSPORTE

relaciones significativas entre la accesibilidad y el número de viajes, ya que estos datos preservan la cuantía máxima de variancia. Para modelizar frecuencias de viaje superiores a uno, Daly (1997) propone utilizar una estructura jerárquica que represente un número indefinido de elecciones, tal y como se expone en la figura 4.12. Cada nivel jerárquico representa la elección entre efectuar el siguiente viaje o bien detenerse en el número de viajes realizado (de aquí el nombre de modelo “stop-go”). Dado que existen fuertes posibilidades de diferente comportamiento entre la elección 0/1+ y las restantes elecciones, se ha encontrado preferible modelizar la primera elección utilizando un modelo separado. Sin embargo, como a menudo se dispone de pocos datos relativos a viajes múltiples, también es necesario modelizar las restantes elecciones con un único modelo “stop-go” (es decir, que predice la misma probabilidad de detenerse en cada nivel de la jerarquía).

0

1+

1

2+

2

3+ etc.

Figura 4.12. Modelo de generación de viajes del tipo “stop-go”.

La aplicación de este sistema de modelización es bastante fácil. Si la probabilidad de viajar es p (del modelo 0/1+) y la probabilidad de elegir la opción “go” para cada nivel subsecuente es q (calculado siempre por el modelo ”stop-go”), el número esperado de viajes viene dado sencillamente por: t = p / (1 – q)



Modelos de generación de viajes

El método ha sido aplicado en numerosos estudios en Europa (Daly, 1977), habiéndose obtenido coeficientes para la variable de accesibilidad que varían entre 0,07 y 0,33 para diversos motivos de viaje.

4.4.

PREVISIÓN DE VARIABLES EN EL ANÁLISIS DE GENERACIÓN DE VIAJES

La elección de las variables a utilizar para predecir las tasas de viaje generadas por los hogares siempre ha preocupado a los planificadores de transporte; típicamente estas variables corresponden al número de hogares, su tamaño y/o estructura, el número de vehículos que poseen (tasa de motorización) y el ingreso (renta). Sin embargo, el interés por este tema aumentó a principios de la década de los 80 con el inicio de investigaciones que tuvieron como objetivo enriquecer los modelos de generación de viajes con teorías y métodos tomados de las ciencias sociales que estudian el comportamiento. Las principales hipótesis detrás de este trabajo fueron que las condiciones sociales en las que el individuo vive deberían tener estrecha relación con las oportunidades y los vínculos que se le presentan cuando afronta la elección de las actividades a realizar; estas últimas a su vez, pueden llevar, a diferentes comportamientos de viaje. Por ejemplo, está claro que si una persona vive sola, para poder satisfacer sus necesidades de viaje no necesita coordinar e intercambiar actividades con otras personas. En cambio, una pareja con hijos pequeños en edad preescolar generalmente tendrá menor libertad en las elecciones que efectúe, con respecto de una pareja sin hijos o con hijos adultos, ya que éstos solicitan menos atenciones. Las personas ancianas o jubiladas que vivan con adultos jóvenes realizarán, probablemente, más actividades fuera de casa que una pareja de ancianos que vive sola o con personas de la misma edad. A nivel del hogar la situación es bastante parecida: por ejemplo, los hogares compuestos por personas que no tienen parentesco entre ellas, tenderán a tener esquemas de actividad con menor influencia sobre otros miembros del hogar (lo que normalmente traerá consigo un número mayor de viajes); en el caso de parentesco entre los miembros del hogar, la influencia es obviamente mayor (a igualdad de dimensión y otras características del hogar). Ello es debido a la mayor coordinación entre los diferentes miembros del hogar y al hecho de que los esquemas de actividad incluyen un mayor número de actividades ligadas al domicilio. Una forma de introducir estos conceptos en la modelización de la generación de viajes es definir un conjunto de familias tipo que, efectivamente, cap-

MODELOS

DE

TRANSPORTE



turen estas diferencias de comportamiento y luego añadir esta medida a las ecuaciones que predicen el comportamiento de los hogares. Un enfoque posible considera la estructura de edad de los hogares y su estilo de vida. Este enfoque es consistente con la idea de que viajar es una demanda derivada y que el comportamiento respecto a viajes es parte de un proceso más amplio de asignación de tiempo y dinero a diversas actividades en diferentes localizaciones. Por ejemplo, el concepto de estilo de vida puede ser hecho operativo en términos de asignación de varias cantidades de tiempo a los diferentes propósitos (actividades), ya sea en el domicilio o fuera de él, donde viajar sólo es parte de esta asignación de tiempos (véase Allaman et al., 1982). Pudiera parecer que la asignación del tiempo por parte de los individuos varía sistemáticamente entre los diferentes segmentos de la población, en función de la edad, sexo, estado civil y hasta la raza; esto puede deberse a que diferentes estructuras familiares imponen diferentes exigencias a sus miembros. Entonces, se puede testear empíricamente un conjunto de hipótesis respecto de si las principales fases en el ciclo de vida son coherentes con cambios importantes en las asignaciones de tiempo. Por ejemplo, las fases pueden ser: • la llegada de hijos en edad preescolar; • el período en el que el hijo más joven alcanza la edad escolar; • el período en el que un joven deja la familia para ir a vivir solo, con otros adultos jóvenes o contrae matrimonio; • el período en el que todos los hijos de una pareja, todavía no jubilada, dejan la casa; • el período en el que todos los miembros del hogar alcanzan la edad de la jubilación. Normalmente es muy interesante contrastar hogares pertenecientes a un cierto estadio de vida con hogares pertenecientes al estadio inmediatamente precedente. Los conceptos de estilo de vida y estadio del ciclo de vida de una familia son importantes bajo dos puntos de vista: primeramente, en cuanto a que identifican grupos estables (basados en la edad o en el sexo), con diferente organización de actividades y consecuentemente diferentes demandas de viaje y, en segundo lugar, porque permiten observar variaciones sistemáticas que pueden estar basadas en variaciones demográficas (p. ej., cambios en la estructura de la edad, en el estado civil o laboral). Ya desde el inicio de los años 80 se ha prestado una atención creciente a las numerosas tendencias demográficas signi-



Modelos de generación de viajes

ficativas en términos de comportamientos de viaje (véase Spielgerg et al., 1981). Una de las tendencias más significativas para la previsión del comportamiento de viajes es el cambio en la razón entre hogares y población, especialmente en las naciones industrializadas. Aunque la tasa de crecimiento de la población ha ido disminuyendo constante pero establemente desde la década de los 80, la tasa de formación de hogares aumenta en ciertos casos. Ello es debido, entre otros motivos, al aumento del número de hogares compuestos solamente por una sola persona (entre otros, los “solteros”). Por ende, las metodologías de previsión de viajes en las que se asume implícitamente que el porcentaje de familias en la población es estable, como a menudo ocurre, pueden verse afectadas por este cambio estructural en la composición demográfica de la sociedad. Otra tendencia que ha sido discutida en múltiples ocasiones es el envejecimiento global de la población (también en este caso sobre todo en las naciones industrializadas). Esto es importante ya que la mayor edad tiende a ser asociada con una disminución de la movilidad y con cambios en el estilo de vida. Es interesante apreciar, sin embargo, que diferencias en la generación de viajes en función de la edad pueden, en parte, reflejar lo que se denomina efecto de cohorte. Esto significa que las personas ancianas pueden viajar menos, sencillamente porque siempre han viajado poco y no precisamente por causa de su edad. Sin embargo, este efecto quizás sea más grande para la población a partir de los 65 años, y la disminución en las tasas de generación de viajes en otros grupos probablemente refleja un verdadero descenso en la propensión a viajar. Por fin, una ulterior tendencia que también merece ser mencionada, es el crecimiento de la proporción de mujeres que trabajan. Su importancia en términos de la planificación del transporte y la previsión de la demanda proviene de dos efectos: el primero es sencillamente el efecto directo por estar empleadas, que influye intensamente en la asignación del tiempo y consecuentemente en el comportamiento de viajes. El segundo efecto es más sutil y concierne a determinados cambios en los roles dentro del hogar y su impacto sobre el estilo de vida, sobre todo en el caso de parejas con hijos. Para concluir esta sección es interesante mencionar que las ideas tratadas anteriormente conducen a proponer la incorporación de variables relativas a la estructura familiar en la modelización de la generación de viajes. Esta propuesta ha sido probada con datos reales (Allaman et al., 1982), en cuyo caso las categorías de estructura familiar se basaron en la edad, sexo, estado civil y apellido de cada miembro del hogar. Estas variables permitieron determinar la

MODELOS

DE

TRANSPORTE



presencia o ausencia de “dependientes” dentro del hogar (personas que aunque no sean de la familia viven con ella), del número y del tipo de adultos presentes y de la relación entre sus miembros. Sin embargo, aunque Allaman et al. (1982), hayan afirmado que los modelos que utilizando estas variables representaron una mejoría considerable con respecto de las prácticas tradicionales, pruebas posteriores con diferentes datos realizadas por McDonald y Stopher (1983), han conducido a su rechazo. Esto no se basó sólo en evidencia estadística sino también en la sensibilidad respecto a políticas (es decir, no está claro cómo utilizar la estructura familiar como variable de política) y en la facilidad de previsión (en el sentido de que la previsión a nivel zonal resulta ser muy problemática, en particular cuando se quieren conseguir distribuciones de los hogares por categorías de estructura familiar). McDonald y Stopher (1983) sostienen que bajo estos puntos de vista debería preferirse la utilización de una variable relativa a la tipología del hogar que, indudablemente, resultará más fácil de utilizar por parte de las agencias de planificación de las autoridades locales.

4.5.

ESTABILIDAD Y ACTUALIZACIÓN DE LOS PARÁMETROS DE GENERACIÓN DE VIAJES

4.5.1.

Estabilidad en el tiempo

Por lo general, los modelos de transporte se desarrollan para ayudar en la formulación y evaluación de planes y proyectos relacionados con el transporte. Aunque en muchas ocasiones se han empleado estadísticas descriptivas para examinar las tendencias de viaje, la mayoría de los avances han empleado datos de sección transversal para expresar la cantidad de viajes en términos de factores explicativos; éstos tienen que ser tanto plausibles como fáciles de pronosticar para que el modelo sea sensible a la política del año de diseño. Una suposición clave (a menudo, implícita) de este enfoque es que los parámetros del modelo se mantendrán constantes (o estables) entre el año base y el año del diseño. Diversos estudios han examinado esta suposición en el contexto de generación de viajes, encontrándose, por lo general, que no se puede rechazar cuando los viajes en todos los modos se consideren en conjunto (véase Kannel y Heathington, 1973; Smith y Cleveland, 1976), ni siquiera en el caso de modelos zonales bastante simples (aunque de todas formas éstos no se recomiendan por



Modelos de generación de viajes

razones como las que se discuten en el epígrafe 4.2.2; véase Downes y Gyenes, 1976). Sin embargo, análisis más recientes han obtenido resultados diferentes. Por ejemplo, Hall et al. (1987) compararon las tasas de viaje observadas y los coeficientes de regresión de modelos calibrados con datos de hogares, recogidos en Santiago en 1977 y 1986, y encontraron importantes diferencias. Copley y Lowe (1981) observaron que aunque las tasas de viaje en autobús para ciertos tipos de categorías de hogar parecían bastante estables con el paso del tiempo, las tasas de viajes realizados en coche particular parecían muy susceptibles a cambios en el precio real del combustible. Ello tiene las siguientes implicaciones potenciales: 1. Si existe una correlación negativa entre las tasas de viajes realizados en coche y los precios del combustible, entonces la suposición normal de tasas de viaje constantes en un período de crecimiento constante en los precios de la gasolina podría provocar una importante sobre-provisión de carreteras e infraestructuras asociadas. Por otra parte, sin embargo, si los precios disminuyeran en términos reales, la suposición de tasas de viaje constantes llevaría a una sub-previsión (lo cual es precisamente lo que ocurrió en el Reino Unido y otros países industrializados a finales de los años 80). 2. Además, el balance entre las inversiones futuras en instalaciones para el transporte público y privado puede juzgarse de forma incorrecta si se basa en la suposición de que las tasas de viaje son constantes con el paso del tiempo. Claramente, para el análisis de políticas a desarrollar es fundamental calcular correctamente el efecto que tienen los precios del combustible sobre las tasas de viaje (y sobre cualquier otro efecto longitudinal similar). Desafortunadamente, este problema no se puede abordar solamente con las series de datos de sección transversal usualmente disponibles para estudios de transporte.

4.5.2.

Estabilidad geográfica

Queda claro pues que es complicado analizar la estabilidad temporal porque se requieren datos de calidad similar para dos momentos diferentes en el tiempo en la misma zona. Por lo tanto, en muchas ocasiones puede ser más fácil examinar la estabilidad geográfica (o transferibilidad), ya que quizás sea posible disponer de datos pertenecientes a dos áreas diferentes (p. ej., si dos entidades,

MODELOS

DE

TRANSPORTE



localizadas en diferentes áreas deciden llevar a cabo un estudio conjunto). La transferibilidad geográfica debería contemplarse como un importante atributo de cualquier modelo de demanda de viajes, por las siguientes razones: 1. podría sugerir la existencia de ciertas regularidades repetibles en el comportamiento de viajes que podrían incluirse y reflejarse en el modelo; 2. indicaría una mayor probabilidad de que también exista estabilidad temporal; esto, tal y como se ha visto, es esencial para cualquier modelo de previsión; 3. podría permitir una reducción sustancial en la necesidad de costosas encuestas de transporte a gran escala en diferentes zonas metropolitanas (véase la discusión en el Capítulo 9). Está claro que no se pueden transferir todas las características del viaje entre diferentes zonas o ciudades; por ejemplo, la duración media de un viaje al trabajo claramente depende de su contexto, es decir, debería ser en función del tamaño y la forma del área y de las distribuciones de los lugares de trabajo y de las zonas residenciales. Sin embargo, la transferibilidad de las tasas de viaje no debería verse como poco realista; los viajes reflejan las necesidades que tienen los individuos de participar en diversas actividades fuera del hogar, y si las tasas de viaje están relacionadas con grupos homogéneos de personas, se puede esperar que permanezcan estables y sean geográficamente transferibles. La transferibilidad de los modelos de generación de viaje (normalmente tasas de viaje en un marco de análisis por categorías a nivel del hogar) ha sido analizada pocas veces, y normalmente produce resultados poco satisfactorios (véase Caldwell y Demetski, 1980; Daor, 1981); los pocos casos con éxito sólo han tenido en cuenta algunos de los viajes, por ejemplo, los viajes realizados en coche (véase Ashley, 1978). Por otra parte, Supernak (1979, 1981) ha señalado la exitosa transferibilidad de un modelo de generación de viajes por categorías de personas, para las condiciones específicas de Polonia y Estados Unidos. Más recientemente, Rose y Koppelman (1984) han examinado la transferibilidad de un modelo de generación de viajes de elección discreta, que permite el ajuste de las constantes modales utilizando datos locales. Una de sus conclusiones es que la similaridad del contexto parece ser un determinante importante dentro de la transferibilidad del modelo; advierten asimismo, ya que sus resultados demostraron una variabilidad considerable, que se debe



Modelos de generación de viajes

ser extremadamente cuidadoso a fin de asegurar que el modelo transferido se pueda utilizar en el nuevo contexto.

4.5.3.

Actualización bayesiana de parámetros de generación

Supóngase que se desea estimar un modelo de generación de viajes y no se dispone de fondos para realizar una encuesta O-D; una solución posible (pero inadecuada) es utilizar directamente modelos que se hayan calibrado para otras áreas relativamente similares. Sin embargo, sería altamente deseable modificarlos, a fin de que reflejaran las condiciones locales de forma más exacta. Esto se puede hacer utilizando técnicas bayesianas que permiten actualizar los parámetros del modelo original a partir de información sobre una pequeña muestra en el contexto de aplicación. La actualización de Bayes considera una distribución a priori (la de los parámetros que se van a actualizar), información nueva (a obtener de la pequeña muestra) y una distribución a posteriori, que corresponde a la información actualizada sobre los parámetros del modelo en el nuevo contexto. Las técnicas de actualización son muy importantes en el marco de la planificación continua y de hecho se pueden encontrar en varias partes de este libro. Por ejemplo, considérese el problema de actualizar las tasas de generación de viajes por categorías; siguiendo a Mahmassani y Sinha (1981) se utilizará la notación expuesta en la tabla 4.11. Tabla 4.11.

Notación para la actualización bayesiana de la generación de viajes

Variable

Tasa promedio de viajes

Información a priori

Información a posteriori

t1

t2

N° de observaciones

n1

n2

Varianza de las tasas de viaje

S1

2

Ss

2

La tasa promedio de viajes de una determinada categoría (o celda) es, obviamente, la media de una muestra de tasas de viajes en hogares. Independientemente de la distribución estadística de las tasas en hogares, la distribución muestral de la media (tasa promedio de viajes) para una celda determinada

MODELOS

DE



TRANSPORTE

puede considerarse Normal, en base al Teorema Central del Límite, si la celda tiene al menos 30 observaciones. Así la distribución a priori de la tasa promedio de una celda en el modelo original (información a priori) es N(t1, S12 / n1), ya que t1 y S12 / n1 son estimadores insesgados de su media y varianza. Para la muestra pequeña ocurre algo similar, lo que implica una distribución Normal con parámetros ts y Ss2/ ns. El teorema de Bayes dice que si las distribuciones a priori y de la muestra son Normales, con varianzas conocidas, la distribución a posteriori (actualizada) de las tasas promedio de viajes es también Normal, con los siguientes parámetros:

1 ¨ © 2 1 t2  © © 1 1 ©ª  12  s2

 22 

1 · ¨ ¸ © 2 s ¸ t1 © ¸ © 1 1 ¸¹ ©ª  12  s2

· ¸ ¸ ts ¸ ¸¹

1 1 1 2 2 1  s

(4.20)

(4.21)

y sustituyendo por los valores conocidos de S2 y n, queda:

t2 

n1 S s2 t1 ns S12 ts n1 S s2 ns S12

(4.22)

S s2 S12 n1 S s2 ns S12

(4.23)

 22 

Es importante subrayar que esta distribución no es la de las tasas individuales de cada hogar en la celda en cuestión, sino la del promedio de las tasas de dicha celda. De hecho, no se conoce la distribución de las tasas individuales, exceptuando que tienen la misma media t2. Ejemplo 4.8: la siguiente tabla muestra la media de las tasas de viaje, su variancia y el número de observaciones para dos categorías de hogares, obtenidas de un estudio realizado hace 10 años:



Modelos de generación de viajes

Categorías de hogares

Variable (datos a priori) Nº viajes al día N° de observaciones Varianza de las tasas de viaje Varianza de las medias de viaje

1 8 65 64 0,98

2 5 300 15 0,05

Se supone que estos valores podrían estar ligeramente obsoletos para su uso directo hoy, pero no hay suficientes fondos como para realizar una nueva encuesta a gran escala. Por ello se ha realizado un pequeño muestreo estratificado, cuyos valores se presentan en la tabla siguiente: Categorías de hogares

Variable (nuevos datos) Nº viajes al día N° de observaciones Varianza de las tasas de viaje Varianza de las medias de viaje

1 12 30 144 4,80

2 6 30 36 1,2

El lector puede verificar que aplicando las ecuaciones (4.22) y (4.23) se pueden estimar las siguientes tasas de viaje y sus correspondientes varianzas: Categorías de hogares

Variable (nuevos datos) Tasas de viaje (viajes/día) Varianza

1 8,68 0,82

2 5,04 0,05

EJERCICIOS 4.1.

Se considera una zona con las siguientes características:

Tipo de hogar

0 coches 1 coche 2 o + coches



Ingresos ($/mes)

Habitantes

Viajes/día

180 80 40

4.000 18.000 50.000

4 4 6

6 8 11

MODELOS

DE



TRANSPORTE

Como consecuencia de una disminución en los impuestos de importación y un incremento de los ingresos reales del 30%, se espera que en los próximos cinco años el 50% de las familias actualmente sin coche adquiera uno. Se desea estimar cuántos viajes generaría la zona en este caso; verifique que el método utilizado sea realmente el mejor disponible. 4.2. Considérense los siguientes modelos de atracción, estimados utilizando un paquete de software estándar (los test-t vienen entre paréntesis); Y = 123,2 + 0,89X1 (5,2)

R2 = 0,900

(7,3)

Y = 40,1 + 0,14X2 + 0,61X3 + 0,25X4 (6,4)

(1,9)

(2,4)

Y = –1,7 + 2,57X1 – 1,78X4 (–0,6)

(9,9)

R2 = 0,925

(1,8)

R2 = 0,996

(–9,3)

en los que Y son los viajes zonales atraídos por motivo trabajo, X1 es el número total de empleos en la zona, X2 el número de empleos en el sector industrial en dicha zona, X3 el número de empleos en el sector comercial también en la zona en cuestión y X4 el número de empleos en el sector servicios. Elegir el modelo más apropiado y justificar tal elección. 4.3. Se consideran los siguientes dos modelos de generación de viajes para la hora punta de mañana por motivo trabajo, estimados utilizando regresión lineal a nivel del hogar: y = 0,50 + 2,0x1 + 1,5x2 (2,5)

(6,9)

R2 = 0,589

(5,6)

y = 0,01 + 2,3x1 + 1,1Z1 + 4,1Z2 (0,9)

(4,6)

(1,9)

R2 = 0,601

(3,4)

donde y son los viajes por hogar realizados por motivo trabajo en la hora punta de la mañana, x1 es el número de trabajadores por hogar, x2 el número de coches por hogar, Z1 es un variable dummy que toma el valor 1 si el hogar posee un coche y Z2 es otra variable dummy que toma el valor 1 si el hogar posee dos o más coches. a) Elegir uno de los dos modelos expuestos, justificando su elección. b) Representar gráficamente ambos modelos utilizando un sistema apropiado de ejes.



Modelos de generación de viajes

c) Si en una zona hay 1.000 hogares (con una media de dos trabajadores por hogar), de los que el 50% no tiene coche, el 35% sólo posee un coche y el resto dos coches exactamente, estimar el número total de viajes generados por la zona, Oi, con ambos modelos. Discutir los resultados obtenidos. 4.4. La siguiente tabla presenta los datos recogidos en una encuesta O-D realizada hace diez años, en tres zonas determinadas: Zona

Residentes/hogar

Trabajadores/hogar

Ingreso medio

Población

I

2,0

1,0

50.000

20.000

II

3,0

2,0

70.000

60.000

III

2,5

2,0

100.000

100.000

Utilizando estos datos, hace diez años se estimaron dos modelos de generación a nivel de hogar. El primero fue un modelo de regresión lineal dado por la siguiente ecuación: y = 0,2 + 0,5x1 + 1,1Z1

R2 = 0,78

donde y son los viajes por hogar realizados en la hora punta; x1 es el número de trabajadores por hogar y Z1 es una variable dummy que toma el valor 1 para los hogares con ingresos altos (> 70.000) y 0 en los otros casos. El segundo fue un modelo del tipo Análisis por Categorías basado en dos clases de ingreso (alto y bajo) y en dos niveles de estructura de hogar (1 o menos, 2 o más trabajadores por hogar). Las tasas de viaje estimadas fueron las siguientes:

Estructura familiar

Ingreso Alto

Bajo

1 o menos

0,8

1,0

2 o más

1,2

2,3

El total de viajes generados en la hora punta por las tres zonas es, respectivamente:

MODELOS

DE



TRANSPORTE

Zona

Viajes HP

I

8.200

II

24.300

III

92.500

y asimismo se estimó que las características de las zonas (ingreso, número de hogares y estructura familiar) han permanecido estables. Indicar cuál es el mejor modelo y justificar la respuesta.

5. Modelos de distribución zonal

E

n el capítulo anterior se ha estudiado cómo pueden ser utilizados los modelos de generación de viajes para estimar el número total de desplazamientos realizados por cada una de las zonas (generación) y atraídos también por cada una de las zonas (atracción) en las que se haya dividido un área geográfica determinada. Las generaciones y atracciones zonales proporcionan una idea de la cantidad de viajes en dicha área, pero son insuficientes en general para modelizar el fenómeno de la movilidad o para decidir sobre políticas de intervención. Es evidentemente necesario pues disponer de una perspectiva más completa del esquema de los viajes, del origen y del destino de los desplazamientos, de los modos de transporte elegidos y, como se verá en el Capítulo 10, de los recorridos utilizados. A lo largo de los años se han propuesto numerosos métodos para simular la distribución de viajes entre varios destinos. Algunos son muy simples y sólo son aplicables a corto plazo, es decir, en estudios tácticos donde no se prevé que se produzcan, por ejemplo, variaciones relevantes en la accesibilidad de la red. Otros métodos, en cambio, responden mejor a las variaciones en los costes de la red y por tanto son aptos para casos de estudios estratégicos a medio y/o largo plazo o también para estudios tácticos que comportan importantes cambios en los costes de transporte. Antes de estudiar los modelos de distribución se establecen algunas definiciones y notaciones que van a ser utilizadas en este capítulo, entre ellos, el concepto de coste generalizado de transporte. El epígrafe 5.2 aborda los métodos que se basan solamente en la Tasa de Crecimiento de los desplazamientos (viajes) en origen y/o en destino, los cuales son aptos para extrapolar tendencias en el corto plazo. En el epígrafe 5.3 se estudiará una familia de modelos denominados sintéticos: el más conocido es el Modelo Gravitacional. En el epígrafe 5.4 se estudia una aproximación a la generación de los modelos, en particular el formalismo de la Maximización de la Entropía. Un aspecto



Modelos de distribución zonal

importante en la utilización de los modelos sintéticos es su calibración, la cual consiste en fijar sus parámetros de modo tal que la estructura de viajes relativa al año base esté bien representada en el modelo; esta parte será estudiada en el epígrafe 5.5, mientras que el 5.6 presenta una variante al sistema de calibración del modelo de gravedad, el cual permite conseguir formas más generales del modelo. Por fin, el capítulo concluye con algunas consideraciones prácticas sobre la modelización de la distribución zonal.

5.1. DEFINICIONES Y NOTACIONES Es tradicional representar la estructura de viajes en un área de estudio a través de la matriz de viajes. Esencialmente es una matriz bidimensional en la que las filas y las columnas representan cada una de las zonas del área de estudio, incluidas las zonas externas, tal como se muestra en la tabla 5.1. Tabla 5.1. Orígenes

Estructura general de una matriz de viajes bi-dimensionales Destinos

ƩT j

1

2

3

…j

…z

1

T11

T12

T13

2

T21

T22

T23

…T1j …T2j

…T1z …T2z

O2

3

T31

T32

T33

…T3j

…T3z

O3

i

Ti1

Ti2

Ti3

…Tij

…Tiz

Oi

z

Tz1

Tz2

Tz3

…Tzj

Oz

D1

D2

D3

Dj

…Tzz …D z

ƩT i

ij

ij

O1

ƩT i

ij

=T

Las celdas de cada una de las filas i contienen los viajes con origen en la zona i y destino en las zonas de las columnas correspondientes. La diagonal principal corresponde a los viajes intrazonales, mientras que Tij representa el número de viajes entre el origen i y el destino j; Oi el número total de viajes con origen en la zona i, y Dj es el número total de viajes atraídos por la zona j. En lo que sigue se utilizarán las letras minúsculas tij, oi y dj para representar datos tomados de la correspondiente muestra o valores de otros estudios.

MODELOS

DE



TRANSPORTE

En mayúscula se representa el objetivo o bien los valores que se quieren modelizar para el correspondiente período de análisis. La matriz anterior puede desagregarse en varias matrices, por ejemplo, según tipo o clase de individuos (n) y/o modo (k), motivo, hora del día… Por tanto: Tijkn son los viajes de i a j en el modo k realizados por los individuos de tipo n. Oikn son los viajes generados por la zona i en el modo k por los individuos de tipo n, etcétera. A efectos de simplicidad en la exposición se omitirán los índices de los sumatorios (tanto inferiores como superiores) quedando, por tanto, implícitos. Por ejemplo:

Tijn  ¤ Tijkn k

T  ¤ Tij

y t  ¤ tij

ij

ij

En algunos casos puede ser interesante considerar la proporción de viajes que utilizan un modo en particular así como el coste de viaje entre dos puntos: pijk es la proporción de viajes entre i y j en el modo k. cijk es el coste del viaje para ir de i a j en el modo k. La suma de los viajes por cada una de las filas debería ser igual al número total de viajes generados por la zona a la que se refiere dicha fila; análogamente la suma de los viajes por cada columna debería corresponder al número de viajes atraído por la zona a la que se refiere la columna. Es decir:

¤T

ij

 Oi

(5.1a)

¤T

ij

 Dj

(5.1b)

j

i

El modelo tiene que satisfacer ambas condiciones; en este caso dicho modelo es doblemente acotado. En cambio, en algunos casos sólo se dispone de



Modelos de distribución zonal

información sobre una de las dos restricciones, por ejemplo, si se conocen todos los Oi el modelo se denomina simplemente acotado a orígenes. Por tanto, el modelo podrá estar acotado a orígenes (generación) o a destinos (atracción), según se cuente con los Oi o los Dj respectivamente. Por cuanto se refiere al coste de viaje, éste puede ser expresado en términos de distancia, tiempo o unidades monetarias. A menudo resulta conveniente utilizar lo que se denomina coste generalizado de transporte (viaje), que representa una medida en la que se combinan todos los atributos principales que están asociados a la desutilidad del viaje. El coste generalizado es típicamente una función lineal de los atributos del viaje ponderada por coeficientes que representan la importancia relativa de los atributos tal como son percibidos por el viajero. Una posible representación del coste generalizado para el modo k (el sub-índice k se omitirá por sencillez de notación), sería:

Cij  a1tijv a2tijw a3tijt a4tnij a5 Fij a6 ϕj + δ

(5.2)

donde: tijv es el tiempo de viaje a bordo del vehículo para ir de i a j; tijw es el tiempo andando hacia y desde la parada (o estacionamiento); tijt es el tiempo de espera en la parada (o búsqueda de lugar para aparcar); tnij es el tiempo de transbordo, si existe; Fij es la tarifa para ir de i a j (o el coste monetario de usar el automóvil); ϕj es un coste “terminal” (usualmente coste de aparcar), asociado al viaje de i a j; δ es una penalidad modal, es decir un parámetro que representa los restantes atributos no incluidos en el coste generalizado de viaje, por ejemplo, la seguridad, el confort, etcétera. a1 … a6 son las ponderaciones asociadas a cada elemento del coste; dichas ponderaciones tienen su correspondiente dimensión apropiada para convertir cada atributo en la misma unidad, por ejemplo, monetaria o tiempo. Si el coste generalizado se expresa en unidades monetarias (a5 = 1), entonces a1 se interpreta a veces como el valor del tiempo (o más precisamente el valor del tiempo a bordo del vehículo), en cuanto que su unidad es dinero/tiempo. En este caso a2 y a3 representan el valor del tiempo a pie y el del tiempo de

MODELOS

DE

TRANSPORTE



espera respectivamente, el cual se percibe, en muchos casos prácticos, como dos o tres veces el valor de a1. Si el coste generalizado se expresase en términos monetarios, a5 normalmente se fijaría igual a uno. El coste generalizado de viaje, tal como se expuso anteriormente, representa una interesante interrelación entre la desutilidad subjetiva y objetiva del viaje; con ello se desea representar la desutilidad del viaje tal y como es percibida por el usuario que se desplaza, y en este caso el valor del tiempo debería ser el valor subjetivo (percibido) en lugar del objetivo, basado en el valor de los recursos consumidos. Sin embargo, los coeficientes a1 … a6 a menudo se definen externamente al proceso de modelización, siendo a veces precisados por el gobierno, el cual presupone para dichos parámetros su estabilidad y su transmisibilidad, cuestión que de momento es, con las limitaciones oportunas, respaldada por la evidencia. Ya que el coste generalizado puede ser medido en términos monetarios o en unidades de tiempo, resulta bastante fácil pasar de una unidad a otra. Por ejemplo, si el coste generalizado es medido en unidades de tiempo, a1 sería igual a 1, a2 y a3 estarían entre 2 y 3, mientras a5 … a6 representarían algo así como la “duración” del dinero. Medir el coste generalizado en unidades de tiempo proporciona bastantes ventajas teóricas y prácticas. Por ejemplo, considérese el efecto del incremento del nivel de ingresos con respecto al tiempo; este efecto hace crecer el valor del tiempo y consecuentemente también crecen los costes generalizados haciendo, aparentemente, el mismo destino más caro. Si, al revés, los costes generalizados se miden en unidades de tiempo, al crecimiento de los niveles de ingresos debería corresponder una reducción del coste para alcanzar el mismo destino, lo cual parece intuitivamente más aceptable. Un modelo de distribución trata de estimar el número de viajes en cada celda de la matriz, en base a cierta disponibilidad de información. Asimismo, se han propuesto diferentes modelos de distribución para diferentes tipos de problemas y condiciones. A continuación, se analizan, en primer lugar, los modelos que se utilizan fundamentalmente para actualizar las matrices de viajes o para prever matrices futuras, en cuyo caso, la única información disponible es el porcentaje de viajes futuros o también el factor de crecimiento relativo. Posteriormente serán analizados modelos más generales y en particular la familia de los modelos gravitacionales. Por último, será explorada la posibilidad de desarrollar modelos de distribución o reparto modal a partir de principios similares.



5.2.

Modelos de distribución zonal

MÉTODOS DE FACTOR DE CRECIMIENTO

Considérese la situación en que se conoce una matriz de viajes de base t, obtenida, por ejemplo, de algún estudio anterior o estimada a partir de una encuesta reciente, y se pretende estimar la matriz correspondiente al año de diseño (p. ej., dentro de 10 años). Puede ser que se disponga de información acerca del crecimiento esperado en este período de 10 años para toda el área, o bien, alternativamente, puede ser que se disponga de información acerca del crecimiento esperado del número de viajes generados o atraídos por cada zona. Dependiendo de estas informaciones, es posible utilizar distintos métodos de factor de crecimiento para estimar los viajes futuros.

5.2.1. Factor de crecimiento uniforme En el caso en que la única información disponible sea un porcentaje general τ del crecimiento de viajes relativos al área de estudio, entonces la única posibilidad es que se aplique este porcentaje a todas las celdas de la matriz: Tij = τtij

para cada par i, j

(5.3)

Obviamente τ = T/t, es la relación entre el número de viajes totales futuros e iniciales. Este método supone que toda el área va a crecer de forma uniforme. Es, aun dentro de esta clase simple, muy aproximado y poco realista. Ejemplo 5.1: considérese la matriz 4 × 4 del año base de la tabla 5.2. Si se espera que el factor de crecimiento del tráfico en el área de estudio sea, en los próximos tres años, del 20%, entonces la nueva matriz se obtendrá sencillamente multiplicando los valores de todas las celdas por 1,2 tal como queda reflejado en la tabla 5.3. Tabla 5.2. 1 2 3 4

Ʃ

i

Matriz de viajes para el año base 1

2

3

4

Ʃ

5 50 50 100 205

50 5 100 200 355

100 100 5 250 455

200 300 100 20 620

355 455 255 570 1.635

j

MODELOS

DE



TRANSPORTE

Tabla 5.3. Matriz futura estimada de viajes con τ = 1,20 1 2 3 4

Ʃ

i

1

2

3

4

Ʃ

6 60 60 120 246

60 6 120 240 426

120 120 6 300 546

240 360 120 24 744

426 546 306 684 1.962

j

La hipótesis en la que se basa el método del factor de crecimiento uniforme generalmente es irreal, excepto quizás en el caso de previsiones a cortísimo plazo (uno o dos años). En la mayor parte de los casos, en efecto, es normal esperarse que exista un crecimiento diferencial en muchas partes del área de estudio.

5.2.2. Factor de crecimiento simplemente acotado Supóngase que se dispone de información sobre el crecimiento esperado de viajes originado por cada zona, por ejemplo, de los viajes por motivo de compras. En este caso es posible aplicar, a las correspondientes filas de la matriz, un factor de crecimiento específico para cada origen τi. La misma aproximación puede realizarse en el caso de que haya información disponible sobre los viajes atraídos por cada zona; en este caso el factor de crecimiento específico para cada destino τj ha de ser aplicado a las correspondientes columnas. En términos matemáticos sería: Tij = τitij Tij = τjtij

para factores específicos a orígenes para factores específicos a destinos

(5.4) (5.5)

Ejemplo 5.2: considérese la siguiente versión modificada de la tabla 5.2, en la que se dispone también de los viajes predichos para cada uno de los orígenes. Tabla 5.4. 1 2 3 4

Ʃ

i

Matriz de viajes con crecimiento acotado a orígenes 1

2

3

4

Ʃ

5 50 50 100 205

50 5 100 200 355

100 100 5 250 455

200 300 100 20 620

355 455 255 570 1.635

j

Oi

400 460 400 702 1.962



Modelos de distribución zonal

El número de viajes para cada par O-D (cada celda), se puede determinar rápidamente multiplicando cada fila por la relación entre el total de los viajes generados previstos Oi y el total de viajes relativos al año base (Ʃj). El resultado se presenta en la tabla 5.5. Tabla 5.5.

1 2 3 4

Ʃ 5.2.3.

i

Matriz de viajes expandida con el crecimiento acotado a orígenes 1

2

3

4

Ʃ

5,6 50,5 78,4 123,2 257,7

56,3 5,1 156,9 246,3 464,6

112,7 101,1 7,8 307,9 529,5

225,4 303,3 156,9 24,6 701,2

400 460 400 702 1.962

j

Oi

400 460 400 702 1.962

Factor de crecimiento doblemente acotado

Un problema interesante surge cuando se cuenta con información acerca del número de viajes que serán generados y atraídos en el futuro por cada zona. En este caso se dispone de diferentes factores de crecimiento para los viajes generados y atraídos por cada zona y consecuentemente, dos conjuntos de factores de crecimiento para dicha zona; sean τi y Гj los factores de crecimiento para los orígenes y para los destinos respectivamente, la aplicación de un factor de crecimiento “medio”, por ejemplo, Fij = 0,5(τi + Гj), no sería una buena idea ya que no quedarían satisfechas las dos condiciones relativas a los totales por fila y por columna. Históricamente han sido propuestos muchos métodos iterativos que permiten conseguir una matriz de viajes que satisface ambas acotaciones (totales por fila y por columna) o, lo que es el mismo, ambos conjuntos de factores de crecimiento. Todos estos métodos comportan el cálculo de un conjunto intermedio de coeficientes de corrección que tienen que ser aplicados posteriormente de forma apropiada a las celdas de cada fila y columna. Después de haber aplicado estas correcciones, por ejemplo, a cada fila, es necesario calcular la suma de las celdas para cada una de las columnas y confrontar esta suma con los valores totales previstos. Si las diferencias son significativas, se procede al cálculo y a la aplicación de nuevos factores de corrección.

MODELOS

DE



TRANSPORTE

El más conocido entre todos estos métodos es el de Furness (1965), que introdujo “factores de balanceo” Ai y Bj como se muestra a continuación: Tij = tijτiГjAiBj

(5.6)

o, análogamente, incorporando los porcentajes de crecimiento en dos nuevas variables ai y bj, queda: Tij = tijaibj

(5.7)

con ai = τiAi y bj = ГjBj Los factores ai y bj se calculan a fin de satisfacer las restricciones de orígenes y destinos. Para esto se requiere el siguiente proceso iterativo: 1. Háganse todos los bj = 1 y encuéntrense los ai tal que queden satisfechas las correspondientes restricciones a orígenes (generaciones). 2. Con los últimos valores de ai encuéntrense los bj, de forma que la matriz satisfaga la restricción de destinos (atracciones). 3. Manteniendo los bj fijos, encuéntrense los ai y repítanse los pasos 2 y 3 hasta la convergencia. Este método proporciona, en pocas iteraciones, soluciones que se alejan más o menos del 3-5% del valor de los viajes previstos en las acotaciones a origen (generación) y a destino (atracción), considerándose que es un buen resultado y que no merece la pena imponer que las acotaciones tengan un nivel de afinación superior. Este método se denomina usualmente algoritmo bi-proporcional a causa del tipo de correcciones utilizadas. Hay que destacar que este problema no se limita solamente al campo de los transportes, ya que estas técnicas de solución han sido “inventadas”, entre otros, por Kruithof (1937) para el tráfico telefónico y por Bacharach (1970) para la puesta al día de las matrices input-output en economía. El mejor tratamiento de las propiedades matemáticas de estos métodos parece ser el debido a Bregman (véase Lamond y Stewart, 1981). Como podrá verse más adelante, este método es un caso especial de los modelos de maximización de la entropía de tipo gravitacional cuando no se considera el efecto de la distancia o separación entre zonas. En todo caso, el método de Furness trata de producir el número mínimo de correcciones necesarias a la matriz de base t para satisfacer las restricciones relativas a los totales generados y atraídos futuros. La condición más importante para que el



Modelos de distribución zonal

método converja, es que los factores de crecimiento produzcan valores objetivo Ti y Tj, tal que:

¤ ¤ t  ¤ ' ¤ t i

i

ij

j

j

j

ij

T

(5.8)

i

Imponer esta condición puede requerir la corrección de las estimaciones de los totales producidas por los modelos de generación de los viajes. Ejemplo 5.3: en la tabla 5.6 se presenta un problema de factor de crecimiento doblemente acotado, mientras que en la siguiente tabla 5.7 se ilustra su solución, después de tres iteraciones sobre filas y columnas (tres conjuntos de correcciones para todas las filas y tres para todas las columnas). Tabla 5.6. 1 2 3 4

Ʃ

i

Objetivo Dj

Tabla 5.7.

1 2 3 4

Ʃ

i

Objetivo Dj

Problema de expansión de la matriz doblemente acotada 1

2

3

4

Ʃ

5 50 50 100 205 260

50 5 100 200 355 400

100 100 5 250 455 500

200 300 100 20 620 802

355 455 255 570 1.635

j

Objetivo Oi

400 460 400 702 1.962

Solución al problema de expansión de la matriz doblemente acotada 1

2

3

4

Ʃ

5,25 45,30 77,04 132,41 260,00 260

44,12 3,81 129,50 222,57 400,00 400

98,24 84,78 7,21 309,77 500,00 500

254,25 329,11 186,58 32,07 802,00 802

401,85 462,99 400,34 696,82 1.962

j

Objetivo Oi

400 460 400 702 1.962

Destacar que esta matriz estimada presenta un nivel de afinación más que suficiente para este tipo de problemas; en efecto, sólo se aleja del 1% de los totales de los viajes previstos.

MODELOS

5.2.4.

DE

TRANSPORTE



Ventajas y limitaciones de los métodos del factor de crecimiento

Los métodos del factor de crecimiento son simples de comprender y utilizan directamente las matrices de los viajes observados y las previsiones de crecimiento de los totales de generación y atracción. Estas técnicas tratan de mantener, lo más inalteradas posibles, las relaciones de la matriz observada de forma consistente con las informaciones disponibles sobre las tasas de crecimiento. Esta ventaja, sin embargo, también representa una limitación, en cuanto que estas técnicas resultan razonables sólo para horizontes de planificación a corto plazo o donde no se esperan grandes cambios en los costes de viaje. Los métodos del factor de crecimiento requieren la misma base de datos que los métodos sintéticos, es decir, una matriz de viajes observada (obtenida mediante muestreo), cuya obtención es bastante cara. Además, dependen fuertemente de la confiabilidad de la matriz de viajes relativa al año base. Tal como se ha podido ver, los valores de las celdas individuales no tienen nunca una exactitud muy elevada y, por tanto, las matrices resultantes no son mucho más fiables que las de la muestra u observadas. Además, los eventuales errores relativos del año base pueden quedar amplificados en las siguientes aplicaciones de los factores de corrección. Más aún, los datos no-observados de la matriz relativa al año base, no quedan modificados en la matriz futura. Por tanto, estos métodos no pueden ser utilizados para rellenar celdas vacías de las matrices de viajes observadas parcialmente. Una limitación ulterior es que estos métodos no tienen en consideración variaciones en el coste de viaje debido a determinadas mejoras en la red (o a una nueva situación como, por ejemplo, congestión). En definitiva, su empleo se debe limitar al análisis de políticas de intervención que no prevean la introducción de nuevos modos de viajes, nuevos arcos de la red, nuevas zonas o nuevas políticas de tarificación.

5.3.

MODELOS SINTÉTICOS O GRAVITACIONALES

5.3.1. Modelo de distribución gravitacional Para poder prever la estructura de los viajes cuando se realizan importantes cambios en la red, se ha desarrollado otro tipo de modelos de distribución basa-



Modelos de distribución zonal

dos en la hipótesis del comportamiento de grupos de viajeros y en la influencia que ejercen sobre ellos factores externos como, por ejemplo, el número total de viajes realizados y la distancia recorrida. Entre estos modelos el más conocido es el gravitacional, originariamente derivado por la analogía de la ley de la gravedad de Newton. Estos modelos estiman el número de viajes en cada celda de la matriz sin utilizar directamente la estructura de viajes observada y, por ello, a menudo se denominan también modelos sintéticos en contraposición a los modelos de factor de crecimiento. Probablemente la primera utilización rigurosa de un modelo gravitacional se debe a Casey (1955), el cual sugirió esta aproximación para sintetizar los viajes realizados por compras y sus áreas de captación entre ciudades de una región. En su formulación más simple el modelo presenta la siguiente forma funcional:

Tij 

α PP i j

dij2

(5.9)

donde Pi y Pj son la población de las ciudades origen y destino de los viajes, dij es la distancia entre i y j y α un factor de proporcionalidad. Esta formulación pronto se consideró una analogía demasiado simplista de la ley de la gravedad de tal forma que la siguiente mejora fue la utilización de los totales de las generaciones y atracciones (Oi y Dj) en lugar de las poblaciones, incorporándose además un parámetro n de calibración como potencia de dij. Este nuevo parámetro no tiene por qué ser un número entero y de hecho, numerosos estudios han estimado valores comprendidos entre 0,6 y 3,5. Posteriormente el modelo se generalizó considerando que el efecto de la distancia o “separación” podía ser modelizado más eficientemente mediante la utilización de una función (a precisar) decreciente con la distancia o con el coste de viaje entre las zonas. El modelo resultó por tanto, así: Tij = αOiDjf(cij)

(5.10)

f(cij) es una función generalizada del coste de viaje que contiene uno o varios parámetros a calibrar y que, generalmente, es llamada “función de resistencia al viaje o función de fricción”, en cuanto que representa la impedancia o resistencia a desplazarse cuando aumenta la distancia, el tiempo o el coste del viaje. Las versiones más populares de la función de resistencia al viaje son:

MODELOS

DE



TRANSPORTE

f(cij) = exp(–βcij)

Función exponencial

(5.11)

f(cij) = cij–n

Función potencial

(5.12)

f(cij) = cijn exp(–βcij)

Función combinada

(5.13)

La forma general de estas funciones, para diferentes valores de sus parámetros se presenta en la figura 5.1.

5.3.2.

Modelos gravitacionales simple y doblemente acotados

Al objeto de asegurar que las restricciones 5.1 se cumplan, es necesario reemplazar el factor individual de proporcionalidad α por dos factores de balanceo Ai y Bj, tal como se señaló en el modelo de Furness. El modelo gravitacional adopta entonces la siguiente expresión: Tij = AiOiBjDjf(cij) 1,8 f(cij)

(5.14)

Leyenda:

1,6

c-2 exp (–1,0 c) exp (–0,01 c) exp (–0,3 c) c0,5 exp (–0,1 c)

1,4 1,2 1,0 0,8 0,6 0,4 0,2 0

0

10

20 30 40 50 60 Coste del viaje (min)

70

Figura 5.1. Tipos de funciones de fricción.

Análogamente se pueden incluir Oi y Dj en los dos factores de balanceo quedando el modelo de la siguiente manera: Tij = aibjf(cij)

(5.15)

Las expresiones (5.14) y (5.15) representan la versión clásica del modelo gravitacional doblemente acotado. Las versiones simplemente acotadas, ya sea a



Modelos de distribución zonal

orígenes o a destinos, pueden ser derivadas haciendo al conjunto de factores de balanceo Bj o Ai igual a uno respectivamente. En el caso de un modelo acotado a orígenes sería Bj = 1, con lo que:

Ai 

1 ¤ D j f (cij )

(5.16)

j

En un modelo doblemente acotado, en cambio, los valores de los factores de balanceo son:

Ai 

1 ¤ B j D j f (cij )

(5.17)

1 AO ¤ i i f (cij )

(5.18)

j

Bj 

i

Los factores de balanceo son, pues, interdependientes; eso significa que para calcular un conjunto de factores se necesita utilizar los valores del otro conjunto y viceversa. Por ello es necesario realizar iteraciones análogas a las de Furness que, en la práctica, producen buenos resultados. Entonces, dado un conjunto de valores para la función de fricción (o impedancia o de resistencia al viaje) f(cij), el proceso debe iniciarse haciendo todos los Bj = 1 y calculando los valores de Ai mediante (5.17). A continuación, con estos valores hay que reestimar de nuevo los Bj y repetir estos pasos hasta que el proceso converja. En una versión más general de la función de fricción se pueden incluir valores empíricos que dependen sólo del coste generalizado de viaje. Los costes de viaje pueden agregarse, por tanto, en un número pequeño (10 ó 15) de intervalos de coste, indicados con el superíndice m y la función de fricción asume entonces la forma:

f ( cij )  ¤ F mdijm m

(5.19)

donde Fm representa el valor medio del coste para el intervalo m, mientras que δijm es igual a 1 si el coste de viaje entre i y j pertenece al intervalo m e igual a 0 en otro caso.

MODELOS

DE



TRANSPORTE

Nº de viajes

Las formulaciones (5.11) y (5.12) tienen solamente un parámetro a calibrar. La formulación (5.13) tiene dos (β y n), mientras la formulación (5.19) tiene varios parámetros, tantos como intervalos. Dichos parámetros tienen que ser estimados de forma que los resultados que se consigan reproduzcan, lo más fielmente posible, la distribución de longitudes (costes) de los viajes (DLV o, en inglés, Trip Length Distribution, TLD) observados. Más adelante se aportará la justificación teórica correspondiente al respecto, aunque por ahora es suficiente reseñar que cuanto mayor es el número de los parámetros más fácil es conseguir una buena adaptación a la distribución de la longitud de los viajes muestreados. Se ha podido observar que, para áreas urbanas y en el caso de viajes motorizados, la distribución de la longitud de los viajes tiene una forma como la indicada en la figura 5.2. en la que puede verse que el número de viajes cortos motorizados es pequeño, aumentando sobre todo para viajes de mediana longitud y volviendo a disminuir paulatinamente al aumentar la distancia (tiempo o coste) de recorrido.

0

10 20 30 40 50 60 70 80 90 100 120

Longitud de los viajes (minutos)

Figura 5.2. Distribución usual de la longitud de viajes en áreas urbanas.

La función exponencial negativa y la función de potencia reproducen bastante bien la segunda parte de la curva pero no la primera, correspondiente a los viajes cortos. Por ello, normalmente, se utiliza una formulación combinada que sea capaz de reproducir ambas partes de la distribución de longitudes de viaje (DLV). La mayor flexibilidad de la formulación por intervalos de coste permite una adaptación aún mejor, aunque tal aproximación requiere la hipó-



Modelos de distribución zonal

tesis de que la DLV sea constante en el futuro, lo cual es análogo a suponer que β sea el mismo para el año base y para los años de prognosis. Merece la pena apreciar que gran parte del valor del modelo gravitacional reside en la función de impedancia o fricción al viaje; y ello es cierto tanto desde el punto de vista de la representación de la matriz observada como desde el punto de vista de su capacidad de modelizar los impactos de políticas de transporte y de uso del suelo.

5.4.

MAXIMIZACIÓN DE LA ENTROPÍA

5.4.1. Entropía y generación del modelo En este epígrafe se presenta el concepto de maximización de la entropía que ha sido aplicado a la generación de numerosos modelos, incluido el modelo gravitacional, modelos por compras y modelos de localización. Este enfoque tiene partidarios y detractores, pero generalmente se reconoce como una de las contribuciones importantes a la mejora de la modelización en el sector del transporte. Hay diferentes formas de presentar esta metodología; aquí se ha elegido un modo intuitivo en lugar de establecer una formulación matemáticamente estricta. Para una presentación más rigurosa así como para el análisis de referencias bibliográficas y para otras aproximaciones al respecto, véase Wilson (1974). Considérese un sistema constituido por un número elevado de elementos distintos. Su descripción total requiere una completa especificación de sus micro-estados, en cuanto que cada estado es distinto y separable. Por ello, sería necesario, por ejemplo, identificar a cada individuo que efectúa un viaje junto con su origen, destino, modo de transporte utilizado, tiempo de viaje, etcétera. Sin embargo, para la mayor parte de los objetivos prácticos puede ser suficiente trabajar sobre una base más agregada pero no tan completa denominada especificación meso-estado; siguiendo el ejemplo anterior, un meso-estado puede precisar sencillamente el número de viajes entre cada origen y cada destino. En general, existen muchas descripciones que pueden catalogarse como meso-estado y también muchos micro-estados del sistema pueden corresponder al mismo meso-estado: si John Smith y Pedro Pérez viven en la misma zona e intercambian su destino, engendran dos micro-estados diferentes pero el meso-estado no varía.

MODELOS

DE



TRANSPORTE

También existe un nivel de agregación superior, definido como macroestado, relativo, por ejemplo, al número total de viajes en determinados arcos o al número total de viajes generados y atraídos por cada zona. Para conseguir datos fiables de un viaje, a menudo es más fácil observar el fenómeno desde este nivel más alto de agregación. En efecto, la mayor parte de las informaciones actuales sobre los sistemas es justamente a este nivel. Análogamente, las estimaciones relativas a situaciones futuras se limitan, generalmente, a descripciones de macro-estados a causa de la incertidumbre asociada a la previsión en niveles más desagregados: por ejemplo, es más fácil prever la población por zonas que el número de familias pertenecientes a una categoría particular que residen en cada zona. La base del método consiste en aceptar que, a menos que se cuente con informaciones contrarias, todos los micro-estados consistentes con nuestra información de estados más agregados (meso o macro-estados) tienen igual probabilidad de ocurrir. De hecho, es una hipótesis bastante razonable si se considera que no se conocen ni los meso ni los micro-estados. Como lo que interesa es la descripción de meso-estados del sistema (una matriz O/D en este caso) se deberían identificar aquellos más probables, dadas las restricciones del mesoestado considerado (restricciones de orígenes, destinos o ambas en modelos de distribución). Se puede comprobar que, según Wilson (1970), el número de micro-estados W{Tij} asociado al meso-estado Tij viene dado por:

W [Tij ] 

T! ” ij Tij !

(5.20)

Por tanto, el meso-estado más probable sería aquel que tuviera un mayor número de micro-estados asociados. Dado que todos los micro-estados son equiprobables, la matriz más probable es la que maximiza W. Por conveniencia, aplicando una transformada monótona creciente (por ejemplo, logaritmo) a la función W, maximizar W es lo mismo que maximizar log W ya que ambas funciones presentan los mismos máximos. Se tiene pues que:

log W  log

T!  log T ! ¤ log Tij ! ij ” ij Tij !

(5.21)

Teniendo en cuenta la fórmula de Stirling (log X! = X log X – X) y sustituyendo, queda:



Modelos de distribución zonal

log W  log T ! ¤ (Tij log Tij Tij ) ij

(5.22)

Dado que el término log T! es constante, puede ser omitido en la maximización. La parte restante de la ecuación es lo que generalmente se define como función de entropía:

log W '  ¤ (Tij log Tij Tij ) ij

(5.23)

La maximización de log W', sometida a las restricciones correspondientes al conocimiento que se posee del estado macro, permite generar modelos para la estimación del estado meso más probable que, en este caso, corresponde a la estimación más probable de la matriz T. La clave de este método de generación del modelo, por tanto, es que representa adecuadamente la descripción idónea de los estados micro, meso y macro, junto con las restricciones del macro-nivel que tienen que ser satisfechas para la solución del problema de optimización. En algunos casos, se puede disponer de informaciones adicionales acerca de determinados valores a priori (o precedentes) de los meso-estados, como por ejemplo, disponer de una matriz t de viajes antigua. En este caso el problema se puede reformular utilizando estas nuevas informaciones, quedando así la función objetivo:

log W ''  ¤ (Tij log Tij / tij Tij tij ) ij

(5.24)

Ésta es una función interesante en la cual cada elemento de la suma toma el valor cero para Tij = tij, de otro modo dicha función es un valor positivo que crece al aumentar la diferencia entre T y t. Por tanto –log W" representa una buena medida de la diferencia entre T y t. Se propone al lector que demuestre que:

log W '' z 0, 5¤ ij

(Tij tij ) 2 tij

(5.25)

donde la parte derecha de la expresión representa otra buena medida de la diferencia entre los meso-estados a priori y los meso-estados estimados. Se

MODELOS

DE



TRANSPORTE

pueden generar los modelos minimizando –log W" sometido a las restricciones que reflejan el conocimiento acerca de los macro estados. El modelo resultante es aquel que tiene los meso más próximos (en el sentido de la ecuación (5.24) o más o menos de la (5.25)) a los meso-estados a priori y que además satisface las restricciones del macro-estado.

5.4.2. Generación del modelo gravitacional Teniendo en cuenta las definiciones de micro, meso y macro-estados tratadas anteriormente, el problema ahora se convierte en maximizar log W' sometido a las siguientes restricciones correspondientes a los meso-estados:

Oi ¤ Tij  0

(5.26a)

D j ¤ Tij  0

(5.26b)

j

i

Estas dos restricciones reflejan las informaciones disponibles acerca de las generaciones y las atracciones en las zonas del área de estudio, ya que se tiene interés en que a los valores de las matrices que puedan ser interpretados como viajes, se les añada la siguiente restricción: Tij ≥ 0

(5.27)

El problema de maximización con dichas restricciones se puede resolver aplicando el Lagrangiano, así:

« º « º L  log W ' ¤ Ai' ¬Oi ¤ Tij » ¤ A ''j ¬ D j ¤ Tij » ­ ¼ i j i ­ ¼ j

(5.28)

Derivando parcialmente respecto a Tij e igualando a cero se obtiene: ∂L ∂Tij

 log Tij α i' α''j  0

y por tanto:

Tij  exp(  i'  ''j )  exp(  i' ) exp( ''j )

(5.29)



Modelos de distribución zonal

Los valores de los multiplicadores de Lagrange se pueden obtener fácilmente realizando un simple cambio de variable: AiOi = exp(–αi') y BjDj = exp(–αj") resultando: Tij = AiOi BjDj

(5.30)

Por otra parte, la utilización de –log W" como función objetivo genera el siguiente modelo: Tij = AiOi BjDjtij

(5.31)

que, obviamente, representa el modelo básico de Furness. La versión que resulta de la ecuación (5.30) corresponde al caso en el que no se dispone de informaciones a priori, es decir en el que tij =1. Estos dos modelos son muy parecidos al modelo gravitacional, pero sin embargo no le representan. Lo que falta realmente es el término relativo a la función de impedancia. Su introducción requiere una restricción adicional:

¤T C ij

ij

C

ij

donde C representa el coste total de los viajes del sistema (p. ej., en unidades de coste generalizado) el cual es desconocido. Esta restricción evidentemente también puede reescribirse así:

C ¤ Tij cij  0 ij

(5.32)

Por lo tanto maximizando log W' sujeto a (5.26), (5.27) y (5.32) y utilizando la misma técnica de optimización se puede plantear el siguiente Lagrangiano:

« « º º « º L  log W ' ¤  i' ¬Oi ¤ Tij » ¤  ''j ¬ D j ¤ Tij »  ¬C ¤ Tij cij » (5.33) i j i ij ­ ¼ ­ ­ ¼ ¼ j Calculando, de nuevo, las derivadas parciales con respecto a Tij e igualándolas a cero queda:

MODELOS

DE



TRANSPORTE

uL  log Tij  i'  ''j  cij  0 uTij

(5.34)

Tij  exp(  i'  ''j  cij )  exp(  i' ) exp(  ''j ) exp(  cij )

(5.35)

y entonces:

y efectuando el mismo cambio de variables realizado anteriormente, queda: Tij = AiOi BjDj exp(–βcij)

(5.36)

que representa el clásico modelo gravitacional. Los valores de los factores de balanceo resultan, entonces, ser:

Ai 

1 1 y Bj  exp(  cij ) ¤ B j D j exp(  cij ) ¤ AO i i j

i

Si no se tuviera en cuenta una de las dos restricciones (5.26a) o (5.26b) se obtendría el modelo gravitacional simplemente acotado. El valor de β está ligado a satisfacer la ecuación (5.32). En general C sólo puede ser estimado y, por tanto, β queda como un parámetro a calibrar de forma que el modelo se adapte a la especificidad del área de estudio, dado que los valores de β no son fácilmente trasladables de un área a otra. Una primera y útil estimación del valor de β consiste en relacionarla con los valores medios de coste de viaje; en efecto β suele tomarse a veces como el inverso del coste medio de viaje. Pueden utilizarse asimismo, diferentes funciones de restricciones de coste que, por ejemplo, transforman la ecuación (5.32) en la (5.37):

C ' ¤ Tij log cij  0 ij

(5.37)

con lo que el modelo toma la siguiente forma:

Tij  AO B j D j exp(  'log cij )  AO B j D j cij  ' i i i i

(5.38)

que es propiamente el modelo gravitacional con una función de fricción igual a la función potencial descrita anteriormente.



Modelos de distribución zonal

El lector puede comprobar que la utilización de las restricciones (5.32) y (5.37) proporciona un modelo gravitacional con una función de fricción combinada. Una posterior e interesante aproximación consiste en descomponer la restricción (5.32) en varios grupos o intervalos de coste de viaje (indicado, como se vio anteriormente, con el súper-índice m) así:

C m ¤ Tij cij ijm  0 para cada m ij

(5.39)

Por tanto maximizando la ecuación (5.23) sometida a las restricciones (5.26), (5.27) y (5.39) proporciona el siguiente modelo:

Tij  AO B j D j ¤ F m ijm  ai b j ¤ F m ijm i i m

m

(5.40)

que obviamente representa el modelo gravitacional con una función de fricción en base a intervalos de coste. Este modelo presenta algunas propiedades interesantes que serán discutidas en el epígrafe 5.6.

5.4.3.

Propiedades del modelo gravitacional

Tal y como se ha observado, la maximización de la entropía representa aproximaciones bastante flexibles a la generación de modelos en general y de distribución en particular, formulando el problema en base a una programación matemática como la ya indicada. Dicha base matemática se fundamenta en la maximización de una función de entropía sometida a ciertas restricciones lineales que representan las informaciones de que se dispone acerca del sistema. La utilización de este formalismo presenta varias ventajas, entre otras, las siguientes: 1. Proporciona un modo riguroso para especificar las propiedades matemáticas del modelo que de dicho formalismo se deriva. Por ejemplo, se puede comprobar que la función objetivo siempre es convexa y que si las restricciones utilizadas, como la (5.26) y la (5.27) tienen un espacio de soluciones factibles, el problema de optimización tiene una solución única aunque el conjunto de parámetros Ai y Bj no sea único. 2. La utilización de una base de programación matemática facilita la utilización de un conjunto de instrumentos de resolución estándar, además del análisis de la eficiencia de algoritmos alternativos.

MODELOS

DE



TRANSPORTE

3. La base teórica utilizada para generar el modelo ayuda a una mejor interpretación de sus soluciones; se ha observado que el modelo gravitacional puede ser generado por analogía con el mundo de la física (consideraciones acerca de la maximización de la entropía). Dichas consideraciones están ligadas estrechamente a la teoría de la información (tratamiento teórico de datos), a las medidas del error y a la máxima verosimilitud en estadística. Estos tres elementos proporcionan modos alternativos de generar la misma forma matemática del modelo gravitacional. Aunque su estructura funcional sea la misma, cada base teórica proporciona diferentes interpretaciones tanto para el problema planteado como para la solución encontrada. Cada una de ellas puede resultar más o menos apropiada según sus circunstancias específicas. Se volverá sobre este problema de la equifinalidad en el Capítulo 8. 4. El hecho de que el modelo gravitacional pueda ser generado de diferentes formas no lo convierte, sin embargo, en “correcto”. La exactitud del modelo depende, en efecto, de la aceptabilidad de las hipótesis requeridas para su generación así como de su interpretación. Ningún modelo está adaptado o es correcto en sí mismo; pueden ser más o menos aptos para tratar cierto fenómeno según el conocimiento que se tenga del problema, de las alternativas a probar, de las informaciones disponibles o que puedan ser recogidas a un coste justificable y del tiempo y de los recursos que se puede destinar a los análisis pertinentes (a este respecto, véase a continuación, la discusión sobre calibración y validación). Es interesante contrastar el clásico modelo gravitacional de la ecuación (5.36) con el método de Furness como derivado en la ecuación (5.31). Se puede suponer que una posible interpretación de la función de fricción o impedancia es que proporciona un conjunto de valores a priori en cada celda de la matriz de viajes (es decir, utilización de exp(–βcij) en lugar de tij). La función de fricción y la matriz a priori tij tienen el papel de proporcionar una “estructura” de viajes a la matriz resultante. Ello puede verse más claramente si se multiplica y divide la parte derecha de la ecuación (5.31) por T y se introduce esta constante en los factores de balanceo, así:

Tij  Tai b j tij / T  ai' b 'j pij

(5.41)



Modelos de distribución zonal

donde pij = tij/T es una forma de lograr una mejor definición del sentido de “estructura” como proporción del total de viajes asignados a cada par origendestino. Ejemplo 5.4: se considera aquí que es útil presentar el modelo gravitacional con un ejemplo ligado al problema de la expansión de una matriz. Teniendo en cuenta la matriz de costes presentada en la tabla 5.8 y el total de viajes en la tabla 5.6, se desea estimar los parámetros ai y bj de un modelo gravitacional del tipo Tij = aibjexp(–βcij) en el que β = 0,1. Tabla 5.8.

Matriz de costes y total de viajes para la estimación de un modelo gravitacional Matrices de costes (min) 1

2

1

3,0

2

12,0

3 4

Ʃ

i

Objetivo Dj

3

4

Objetivo Oi

11,0

18,0

22,0

400

3,0

13,0

19,0

460

15,5

13,0

5,0

7,0

400

24,0

18,0

8,0

5,0

702

260

400

500

802

260

400

500

802

1.962

Para ello el primer paso consiste en construir la matriz de los valores de exp(–βcij). Dichos valores se presentan en la tabla 5.9. Tabla 5.9.

Matriz de valores exp(–βcij) y sus sumas, necesarias para ejecutar un modelo gravitacional exp(–βcij) 1

2

3

4

Ʃ

i

1

0,74

0,33

0,17

0,11

1,35

2

0,30

0,74

0,30

0,15

1,49

3

0,21

0,27

0,61

0,50

1,59

4

0,09

0,17

0,45

0,61

1,31

1,34

0,51

1,52

1,36

5,74

Ʃ

j

MODELOS

DE



TRANSPORTE

1

2

3

4

Ʃ

j

Objetivo Oi

Ratio

1

253,12

113,73

56,48

37,86

461,19

400

0,87

2

102,91

253,12

102,91

51,10

510,04

460

0,90

3

72,52

93,12

207,23

169,67

542,54

400

0,74

4

31,00

56,48

153,52

207,23

448,23

702

1,57

1.962

Ʃ

459,54

516,45

520,15

465,87

Previsto

260

400

500

802

Ratio

0,57

0,77

0,96

1,72

i

Tabla 5.10.

Matriz de resultados del modelo gravitacional con la distribución de la longitud de los viajes j

Objetivo Oi

Ratio

ai

74,17

393,36

400

1,02

1,17

90,98

455,56

460

1,01

1,07

1

2

3

4

1

155,73

99,00

64,46

2

57,54

200,22

106,73

Ʃ

3

25,87

47,01

137,16

192,77

402,81

400

0,99

0,68

4

20,86

53,77

191,65

444,08

710,37

702

0,99

1,28

260

400

500

802

260

400

500

802

Ʃ

i

Previsto Ratio bj

1,00

1,00

1,00

1,00

179,17

253,50

332,37

570,53

1.962

Rangos (min)

Coste

1,0-4,0

4,1-8,0

8,1-12,0

12,1-16,0 16,1-20,0 20,1-24

Suma

Viajes

355,9

965,7

156,5

179,6

1.962

209,2

95,0

Sucesivamente, con estos valores se calcula el total de “viajes” resultantes (5,74) y luego se expande cada celda de la matriz multiplicándola por la relación 1.962/5,74 = 341,67. Esto produce una matriz de base que ahora tiene que ser reformada para que sea congruente con los totales de generación y atracción. Este proceso es idéntico a las iteraciones de Furness. Los valores de ai y bj



Modelos de distribución zonal

son el producto de los correspondientes factores de corrección que serán multiplicados por el factor de expansión de base 341,67. La matriz del modelo gravitacional resultante se ilustra en la tabla 5.10. El lector puede observar que los factores de balanceo ai y bj, son únicos salvo una constante multiplicativa. Y también es posible calcular, como siempre, los factores de balanceo estándares Ai y Bj dividiendo los correspondientes valores de ai y bj por los valores previstos de Oi y Bj.

5.5.

CALIBRACIÓN DE MODELOS GRAVITACIONALES

5.5.1. Calibración y validación Antes de utilizar un modelo gravitacional es necesario calibrarlo para asegurar que sus parámetros sean tales que el modelo reproduzca lo más fielmente posible la estructura de los viajes del año base. Además, calibrar un modelo conlleva un proceso muy diferente al de validación. Dicho proceso de calibración está condicionado por la forma funcional y por el número de parámetros del modelo elegido. Por ejemplo, el clásico modelo gravitacional tiene los parámetros Ai, Bj y β (es decir, si Z es el número de zonas, el de parámetros es Z + Z + 1). Los parámetros Ai y Bj se calibran durante el proceso de estimación del modelo gravitacional como parte del esfuerzo directo por satisfacer las restricciones (5.1). Puede observarse que al menos uno de los dos parámetros (Ai, Bj) es redundante puesto que la condición adicional ƩiOi = ƩjDj = T hace a una de las dos condiciones (5.1) linealmente dependiente del resto. Por otra parte, el parámetro β debe ser calibrado independientemente, ya que no se cuenta con información completa y exacta acerca del coste total C en el área de estudio. Si esta información estuviera disponible podría utilizarse directamente sin tener que estimar β por otros medios. En el caso de que se utilizase la función de fricción combinada (5.13), se tendría un parámetro más, el cual proporcionaría una mayor flexibilidad en la calibración del modelo gravitacional. La actividad de validación es diferente. En efecto, en este caso se pretende estar seguros de que el modelo está bien adaptado para testear las diferentes alternativas ante la toma de decisiones. Sin embargo, puede ocurrir que, para un conjunto de dichas alternativas a examen, el modelo gravitacional no represente eficientemente la realidad. En consecuencia, resulta que el proceso

MODELOS

DE

TRANSPORTE



de validación del modelo depende de la naturaleza de las políticas y de los proyectos que se desean valorar. Una estrategia usual de validación consiste en averiguar si el modelo reproduce con suficiente fiabilidad un estado conocido del sistema, y ya que el futuro es definitivamente desconocido, se utiliza a veces una situación pasada que esté bien documentada, por ejemplo, una matriz de un estudio anterior intentando entonces reproducir este estado. Desafortunadamente es bastante raro encontrar alternativas antiguas que estén suficientemente documentadas. Así, en algunos casos se recurre a realizar una prueba de validación con datos no utilizados durante el proceso de modelización. Esto sucede, por ejemplo, cuando se quiere descubrir si está correctamente reproducido el número de viajes entre líneas cordón importantes o en las vías principales de una ciudad.

5.5.2.

Técnicas de calibración

Tal como se ha citado anteriormente, los parámetros Ai y Bj son estimados como parte de las operaciones de balanceo de los factores en el método de Furness (bi-proporcional). En cambio el parámetro β ha de ser necesariamente calibrado para poder reproducir lo más fielmente posible la distribución de la longitud de los viajes (DLV). Sin embargo, este requerimiento es excesivo para un parámetro individual. Más adelante podrá analizarse cómo puede mejorarse la estimación de dicho parámetro pero por ahora, baste con proponer una técnica práctica y muy simple para estimar el mejor valor (β*) de β. Un procedimiento fácil para solucionar este problema es sencillamente “suponer” un valor de β, ejecutar el modelo gravitacional y confrontar la distribución de los viajes modelizada (DLVM) con la distribución de los viajes observada (DLVO). Si las dos distribuciones no están suficientemente próximas, entonces supóngase un nuevo valor de β y repítase el proceso hasta que se consigan valores de DLVM y DLVO suficientemente próximos; entonces el valor β* obtenido deberá ser tomado como el mejor valor de β. Destacan los muestreos a hogares o a pie de vía pública (road side interviews), pues proporcionan valores de DLVO con un nivel de exactitud superior al de los valores de las celdas individuales de la matriz de viajes calculadas como se ha visto, en cuanto que el porcentaje de muestreo de la longitud de los viajes, en este caso, es mucho más eficiente. Sin embargo, el procedimiento citado anteriormente para el cálculo de β no es muy práctico, puesto que ejecutar un modelo gravitacional doblemente aco-



Modelos de distribución zonal

tado requiere mucho tiempo y si el parámetro que se prueba no es satisfactorio, este método no proporciona ninguna guía sobre cómo elegir un valor adecuado. Además es improbable que las técnicas convencionales de adaptación de la curva produzcan buenos resultados, ya que el modelo gravitacional no es sólo un modelo no-lineal sino también, analíticamente complejo; en efecto, también los valores de Ai y Bj son función de β a través de las ecuaciones (5.17) y (5.18). Existen varias técnicas de calibración implementadas en diferentes paquetes de software. Las más importantes han sido contrastadas por Williams (1976) en las que destaca la técnica debida a Hyman (1969) como particularmente robusta y eficiente. A continuación, se describe brevemente el método de Hyman. En cualquier proceso de calibración está disponible una matriz de los viajes T(β ) función de β, que define también el número total de viajes ƩijTij (β) = T (β). El método se basa en la siguiente condición para dicho parámetro β:

¤ ¨ªT ( )c ·¹ ij

c(  ) 

ij

ij

T ( )

¤ ¨ª N C  c*  ¤N ij

ij

ij

·¹

ij

ij

(5.42)

donde c* es el valor medio del coste del DLVO y Nij es el número de viajes observado (y expandido) para cada par origen-destino. El método se puede describir de la siguiente manera: 1. Iniciar la primera iteración con m = 0 y un valor inicial de β0 = 1/c*. 2. Con este valor β 0, calcular la matriz de viajes del modelo gravitacional estándar. Se obtiene así la media modelizada de costes de viaje c0 pudiendo entonces estimar como mejor valor de β el siguiente: βm = β0 c0/c* 3. Hacer m = m + 1 y, utilizando el último valor hallado para β (es decir βm–1), calcular la matriz de viajes con el modelo de gravitación estándar para así obtener una nueva media modelizada de los costes de viaje cm–1 que será contrastada con c*. Si ambos valores fueran suficientemente próximos, detener el proceso, aceptando entonces a βm–1 como la mejor estimación; en otro caso ir al paso 4. 4. Obtener una mejor estimación de β a partir de:

B m 1 

( c * cm 1 )B m ( c * cm )B m 1 cm cm 1

MODELOS

DE

TRANSPORTE



5. Repetir los pasos 3 y 4 cuantas veces sea necesario, es decir, hasta que la última media de costes cm–1 modelizada sea suficientemente próxima al valor observado c*. El paso 3 se repite de modo que se consiga una aproximación lo más cercana posible a la igualdad (5.42). Está claro que pueden aportarse ciertas mejoras a este método, sobre todo desde el punto de vista computacional. Lo que sí es cierto es que se ha demostrado que el método de Hyman es robusto y que presenta en general ventajas sobre otros algoritmos alternativos.

5.6.

ENFOQUE TRI-PROPORCIONAL

5.6.1. Adaptación del método bi-proporcional En el párrafo 5.4.2. se ha observado cómo el método de Furness puede ser derivado a partir de una base de referencia mediante programación matemática. Este programa matemático no lineal puede ser resuelto con numerosos algoritmos, incluido el método de Newton. Sin embargo, es posible demostrar que el método originariamente propuesto por Furness representa un algoritmo práctico y eficiente, sobre todo para matrices grandes. Es, usualmente, denominado algoritmo bi-proporcional en cuanto que requiere realizar sucesivas iteraciones de filas y columnas para que sean satisfechas las restricciones. El algoritmo se detiene cuando las correcciones son suficientemente pequeñas, es decir cuando las restricciones están cumplimentadas dentro de una tolerancia razonable. Las condiciones necesarias para la existencia de una solución única es que las restricciones (5.26a) y (5.26b) definan un espacio de soluciones factibles no negativas de los Tij. Ello requiere que ƩiOi = ƩjDj, lo cual es una condición necesaria, pero no suficiente. El modelo tiene una estructura multiplicativa y, por tanto, no modifica los ceros presentes en la matriz a priori {tij}; además la existencia de muchos valores nulos en la matriz a priori, puede impedir que sean satisfechas una o más restricciones. Ejemplo 5.5: considérese, en la situación actual, el caso de una zona k que está vacía (es decir, no hay nada) pero en la que se espera en el futuro un desarrollo que será punto crucial de una cierta generación y atracción de viajes. Por tanto, los valores de las celdas para {tik} serán cero, mientras los



Modelos de distribución zonal

valores futuros de Oi y Dk serán, evidentemente, diferentes de cero. En este caso, pues, no hay factores multiplicativos de corrección capaces de generar una matriz que satisfaga las restricciones para la zona k. Se puede, entonces, reemplazar los valores de estas celdas vacías con ciertas “hipótesis”, es decir con valores oportunos tomados de zonas parecidas, pero en cualquier caso la presencia de ceros en la matriz de partida puede causar pequeños problemas, aunque siempre menos difíciles. Si se trata de resolver el problema del ejemplo 5.1, pero utilizando la matriz a priori indicada en la tabla 5.11, es posible comprobar que este problema no tiene una solución factible en el espacio no negativo Tij. Así pues, hay 11 incógnitas y sólo 7 restricciones independientes, de forma que la posición de los ceros es tal que no hay solución factible y el algoritmo bi-proporcional oscila sin converger. Tabla 5.11.

Versión reexaminada del problema del factor de crecimiento doblemente acotado de la tabla 5.6 1

1

5

Ʃ

2

3

4

50

100

200

j

355

Objetivo Oi

400

2

0

50

0

0

50

460

3

50

100

5

100

255

400

100

200

250

20

570

702

155

400

355

320

1.230

260

400

500

802

4

Ʃ

i

Objetivo Dj

1.962

Los lectores que tengan familiaridad con el álgebra lineal podrán interpretar este problema estudiando el rango de la matriz original y el de la matriz aumentada con los valores de la última columna de la tabla 5.7. Además, el lector puede comprobar también que, después de 10 iteraciones, la matriz correcta resulta ser la de la tabla 5.12. Llegados a este punto pueden hacerse los siguientes comentarios: 1. La matriz después de 10 iteraciones parece diferente de la matriz a priori, poniendo en duda la veracidad, ya sea de la matriz anterior, de sus ceros, o de los nuevos totales de generaciones/atracciones. 2. El problema principal parece estar en la segunda fila donde hay una gran diferencia (cerca del 20%) entre los totales previstos y los modelizados.

MODELOS

DE



TRANSPORTE

Tabla 5.12.

Matriz del problema de la tabla 5.11 después de 10 iteraciones Furness 1

2

1

3,4

0,7

2

0

3

63,5

2,8

4

191,2

8,3

Ʃ

i

Objetivo Dj

388,2

Ʃ

3

4

61,0

355,3

420

400

0

0

388

460

5,9

345,7

420

400

433,1

101,0

734

702

260

400

500

802

260

400

500

802

j

Objetivo Oi

1.962 1.962

No hay, en efecto, ninguna forma de lograr que en esta fila pueda resultar un valor de 460 viajes visto que la única celda no nula a lo máximo que podría llegar es a 400 viajes. Las restricciones por tanto no generan un espacio de soluciones factibles. 3. El problema parece mal-acondicionado, por ejemplo, una pequeña variación en el valor de una celda puede hacer que el problema sea factible así como producir una matriz de viajes bastante diferente. Así, el valor cero en la celda t2,4 puede ser debido a la muestra utilizada; reemplazando este valor cero por un 1, después de las mismas 10 iteraciones, se consigue la matriz de la tabla 5.13. Con una matriz diferente, la adaptación resulta mejor y los totales previstos tienen un nivel de exactitud superior al 1%. Por tanto, ahora ciertamente sí que hay un espacio de soluciones factibles. Tabla 5.13.

Matriz modificada del problema de la tabla 5.11 añadiendo un viaje en la celda 2,4, después de 10 iteraciones Furness 1

2

1

4,1

4,5

2

0

339,2

3

77,3

4

Ʃ

i

Objetivo Dj

Ʃ

3

4

76,2

315,4

420

400

0

119,1

388

460

17,0

7,2

298,5

420

400

178,6

39,3

416,6

68,9

734

702

260

400

500

802

260

400

500

802

j

Objetivo Oi

1.962 1.962



Modelos de distribución zonal

Casos de esta complejidad no deben ser considerados como puramente académicos. La falta de convergencia en pocas iteraciones también puede indicar que la presencia y la localización de ceros en la matriz de salida impide la existencia de soluciones factibles con los nuevos totales de viajes.

5.6.2. El problema tri-proporcional En los epígrafes anteriores se ha presentado el modelo gravitacional con una función de impedancia muy flexible que considera valores discretos relacionados con la forma funcional para cada intervalo de coste. En particular de la ecuación (5.40) se tenía que:

Tij  ai b j ¤ F m ijm m

Las principales ventajas de este modelo son su flexibilidad y la facilidad de calibración. En efecto, se puede definir un número cualquiera de intervalos de coste para los que la función de impedancia puede asumir cualquier valor positivo. Y también se pueden representar situaciones en que, por ejemplo, haya pocos viajes cortos, muchos viajes intermedios, pocos viajes largos y un gran número de viajes sistemáticos de larga distancia. La calibración de un modelo como éste requiere que se encuentren valores adecuados del factor de impedancia Fm para cada intervalo de coste de modo que el número de viajes, para una distancia dada, sea lo más próximo posible al número observado. Este procedimiento, de hecho, es muy parecido al problema de expansión de una matriz de modo que se satisfagan los totales generados y atraídos. En este caso se puede iniciar el proceso tomando un valor unitario para los factores de impedancia y luego corregirles así como también a los parámetros ai y bj, hasta que los totales de los viajes satisfagan las restricciones de distribución de longitudes de viaje DLV. Entonces, se puede extender el algoritmo bi-proporcional de forma que también se tenga en cuenta esta tercera dimensión (intervalos de coste), y utilizar un método tri-proporcional para calibrar el modelo. Los principios de base de esta técnica fueron propuestos por Evans y Kirby (1974). Por otro lado, Murchland (1977) pudo demostrar que la aplicación de sucesivas correcciones en un espacio bi-tri o multi-dimensional, para solucionar este tipo de problemas corresponde a un sólo grupo de algoritmos de solución;

MODELOS

DE



TRANSPORTE

además, el método es sencillo de programar y no requiere de excesiva memoria de ordenador. Ejemplo 5.6: el algoritmo tri-proporcional puede ser desarrollado con el problema indicado en la tabla 5.8 y con los valores previstos de la distribución de la longitud de los viajes (intervalos de costes) de la tabla 5.14. El modelo se puede resolver, por tanto, realizando las operaciones de balanceo pertinentes para encontrar la correspondencia entre los valores previstos de estimación y el intervalo de coste para cada origen. Después de cinco iteraciones completas se obtiene la matriz de viajes simulada para cada intervalo de coste Tk, tal y como se muestra en la tabla 5.15. Tabla 5.14.

Valores previstos de DLV para la calibración de un modelo gravitacional tri-proporcional Intervalos

1,0-4,0

4,1-8,0

8,1-12,0

12,1-16,0

16,1-20,0

21,1-24+ 21,1-

365

962

160

150

230

95

DLV

Tabla 5.15.

1 2 3 4

Ʃ

i

bj

Matriz del problema de la tabla 5.14 después de cinco iteraciones, incluyendo los valores de los factores de balanceo ai y bj y F k 1

2

3

4

Ʃ

161,6 56,5 18,9 23,0 260 0,57

102,5 199,4 48,7 49,5 400 0,70

60,8 101,2 116,7 221,3 500 0,87

72,5 101,0 217,1 411,5 802 1,63

397,4 458,0 401,4 705,3 1.962

1,0-4,0

4,1-8,0

8,1-12,0

12,1-16,0

16,1-20,0

21,121,1-24+

365 360,9 224,55

962 966,5 220,13

160 159,0 87,54

150 149,8 102,05

230 230,3 54,66

95 95,5 34,90

j

ai

1,27 1,13 0,60 1,14

Intervalos

DLV Tk Fk



Modelos de distribución zonal

Obviamente en este caso los factores de balanceo no son, una vez más, únicos; en efecto, hay hasta dos constantes multiplicativas arbitrarias. También se puede expresar este hecho diciendo que los factores de balanceo tienen dos grados de indeterminación, representados por las dos constantes multiplicativas. Es fácil ver que si se multiplica cada ai por un factor Г y cada uno de los bj por otro factor τ , y luego se divide cada F* por Гτ la matriz simulada permanece inalterada.

5.6.3. Técnicas de matrices parciales El método de calibración tri-proporcional se ha utilizado con una distribución completa de las longitudes de los viajes, es decir, tiene una entrada de observaciones en cada celda. Definitivamente sería ventajoso si se pudiese calibrar un modelo gravitacional sin necesidad de disponer de una matriz de viajes completa. Esto es especialmente importante, ya que se sabe que el coste de recoger datos para obtener una matriz de viajes completa es bastante alto; además, no es muy alta la exactitud de algunos datos en las celdas y en la calibración, pues se utilizan agregaciones de datos, principalmente la DLV así como del total de viajes Oi y Dj. En cualquier caso, debe quedar claro que existe la posibilidad de calibrar modelos gravitacionales con una matriz no completa o parcial. Por ejemplo, se puede calibrar un modelo gravitacional utilizando una función de coste exponencial solamente con el origen-destino del viaje total y una buena estimación del coste medio del viaje, c*. La calibración de un modelo de gravedad con una función general de impedancia utilizando el método tri-proporcional es incluso más atractiva en este caso, ya que se pueden utilizar solamente entrevistas a pie de calle, en cordones y líneas pantalla para obtener buenas DLVs, así como el total de viajes para algunas zonas en el área de estudio. No habrá ninguna necesidad de utilizar modelos de generación de viajes a menos que la finalidad sea hacer pronósticos. En resumen, el producto ai bj ck debe ser único, pero obsérvese que los factores individuales no lo son: hay dos grados de indeterminación:

¥ 1 ´ (ai . )(b j . ) ¦ ck µ  ai b j ck §  ¶ que se pueden remover sin afectar a la matriz resultante. El problema surge cuando hay indeterminación adicional.

MODELOS

DE



TRANSPORTE

Ejemplo 5.7: la idea básica explicada anteriormente puede describirse con la ayuda de una matriz 3 × 3. En primer lugar, considérese un caso bi-proporcional donde el problema de actualizar la matriz completa consiste en ajustar una matriz del año base de la forma siguiente: Caso biproporcional Ajustado a produce.

a d g

b e h

c f i

P Q R

A B D E G H

C F I

S T U • En el caso de una matriz parcial, como por ejemplo, una encuesta en la que no puedan ser observadas las entradas a y h, se ajustarían solamente los finales de los viajes excluyendo el total correspondiente: Ajustado a

d g

b e

c f i

produce

P A Q R H

B C D E F G I

S A T H U Para rellenar las celdas que faltan, emplearíamos un modelo gravitacional; en el caso de este ejemplo, uno que no tenga una función de impedancia: Tij = aibj Los valores estimados de ai y bj (utilizando datos de las celdas observadas) se emplearían para rellenar estas celdas que faltan. La extensión de esta idea a un caso tri-proporcional es muy sencilla. Kirby (1979) ha demostrado que existen dos condiciones básicas para una aplicación válida de esta aproximación: 1. El modelo gravitacional debería encajar tanto con los datos disponibles como con los no disponibles, es decir, debería ser un modelo bueno para las dos regiones de la matriz: la observada y la no observada.



Modelos de distribución zonal

2. Las dos regiones de la matriz no deberían ser separables, es decir no debería ser posible partir la matriz en dos o más matrices independientes: El problema es que cada área separada tiene dos (tres en el caso tri-proporcional) grados de indeterminación y, por lo tanto, los factores de balanceo no pueden generar resultados únicos ni estimaciones de viaje. Este problema también se denomina no identificabilidad de resultados únicos en las celdas no observadas. Como se demostró en la figura anterior esto sólo ocurre cuando se hacen las entrevistas a pie de vía pública en un cordón de una zona de estudio. La realización de entrevistas en una línea pantalla probablemente eliminaría el problema, ya que generaría las observaciones para la matriz “interna-interna”. Interna

Interna

Externa

Externa

×××××××××××× ×××××××××××× ×××××××××××× ×××××××××××× ×××××××××××× ×××××××××××× ××××××××××××

******** ******** ******** ******** ******** ******** ******** * * * * * * * * * * * * ×××××××× * * * * * * * * * * * * ×××××××× * * * * * * * * * * * * ××××××××

Donde * = 0 o desconocido × = es un dato observado. Ésta es una matriz separable y cada parte tiene su propio conjunto de αiβjγk. Sea, por ejemplo, la Matriz Parcial Cp en la que la celda (1,3) no fue observada:

2´ ¥1 2 ¦ µ C  ¦3 2 1 3µ ¦1 3 2 2µ § ¶ p

Puede que αiβjγk no sea único en (1,3). Test: α1β1γ1 = 1 para cada celda observada.

MODELOS

DE



TRANSPORTE

Haciendo un cambio de variable (αi = eui ; βj = evj ; γk = eγk) las condiciones son: ui + vj + wk = 0 i, j, k observado. Resulta un sistema de n ecuaciones lineales con rango r ≤ n. Si r = i + j + k – 2 entonces es identificable. ¥1 2´ Dada la matriz parcial: ¦ µ , las condiciones serían: §2 ¶ α1β1γ1 = 1 α1β2γ2 = 1 α2β1γ2 = 1

i+j+k–2=4

Está claro que estas condiciones no son suficientes para garantizar identificabilidad. De hecho, una solución general es tomar: α1,β1,β2 arbitrarios, luego γ1 = 1/α1β1, γ2 = 1/α1β2 y α2 = α1β2/β1 . Destacar que si el intervalo de coste para cada celda no observada (2,2) se pudiera igualar a 1, el estimador de los viajes en ella sería: V12 = a2b2c1 (β2/β1)2 que tiene un grado de arbitrariedad dado por (β2/β1).

5.7.

OTROS MODELOS SINTÉTICOS

El modelo gravitacional es, con n ventaja, el más utilizado de los modelos agregados de distribución de viajes. Tiene varias ventajas teóricas y no faltan programas de ordenador útiles para calibrarlo y utilizarlo. Puede ampliarse si se necesita incorporar más tipologías de individuos, así como utilizarse para la modelización de ciertos tipos de transporte de mercancías. No obstante, el modelo gravitacional no cubre todas las posibilidades teóricas. A continuación se presentan dos aproximaciones más que, aunque su uso es mucho más restringido, ofrecen una alternativa real al modelo gravitacional. La primera es el modelo de distribución de oportunidades relevantes (intervening-opportunities model) que será expuesto en este epígrafe, y la segunda es la familia de modelos de demanda directa, los cuales serán tratados en el Capítulo 6.



Modelos de distribución zonal

La idea básica que subyace en el modelo de distribución de oportunidades relevantes es que la realización de un viaje no se relaciona explícitamente con la distancia, sino con la accesibilidad relativa a las oportunidades de satisfacer el objetivo del viaje. Quien por primera vez promovió este método y aplicó su filosofía a la migración y a la localización de servicios y viviendas fue Stouffer (1940). Sin embargo, fue Schneider (1959) quien desarrolló la teoría de la forma en que se presenta hoy. En primer lugar considérese una zona de origen i y confórmese una lista ordenada de todos los destinos posibles en función de las correspondientes distancias incrementadas desde i. A continuación, examínese un par origen-destino (i, j), donde j es el destino mésimo según la distancia desde i. Existen m–1 destinos alternativos, efectivamente más cercanos (más accesibles) a i. El individuo que vaya a realizar un viaje, consideraría dichos destinos como posibles lugares para satisfacer el motivo que origina el viaje: éstas son las oportunidades relevantes que influyen en la elección del destino. Sea α la probabilidad de que un viajero estuviese satisfecho con una sola de estas oportunidades; entonces la probabilidad de que sea atraído por una zona con D oportunidades es αD. Ahora, considérese la probabilidad qim de que el motivo de viaje no sea satisfecho por ninguna de las oportunidades ofrecidas por los mésimos destinos desde i. Ello es igual a la probabilidad de no ser satisfecho por el primero ni el segundo, etc. hasta el mésimo:

qim  qim 1 (1  Dim )

(5.43)

Por lo tanto, suprimiendo ell superíndice i por simplicidad de notación, se llega a

q m q m 1   D m qm

(5.44)

Ahora, si xm representase las atracciones acumuladas de las oportunidades intermedias en el destino mésimo:

xm  ¤ D m m

se puede reescribir (5.44) así:

MODELOS

DE



TRANSPORTE

q m q m 1   ; xm 1 xm = q m 1

(5.45)

El límite de esta expresión para incrementos infinitesimalmente pequeños es, por tanto

dq ( x)   dx q( x)

(5.46)

Integrando (5.46) se obtiene:

log q ( x)   x ctte o

q ( x)  Ai exp(  x)

(5.47)

donde Ai es un parámetro de calibración. Esta relación expresa la posibilidad de que un motivo de viaje no sea satisfecho por ninguno de los destinos m (m = 1, … , M) desde i, como una función exponencial negativa de las oportunidades acumuladas o intermedias, hasta la distancia de que se trate desde dicho origen. Los viajes Tijm desde el origen i hasta el destino j (que es el mésimo punto en distancia desde i) son pues, proporcionales a la probabilidad de no ser satisfechos por ninguna de las oportunidades m – 1 más cercanas menos la probabilidad de no ser satisfecho por ninguna de las oportunidades hasta el destino mésimo:

Tijm  Oi ; qi ( xm 1) qi ( xm ) =

(5.48)

Es fácil demostrar que la constante Ai debe ser igual a:

Ai 

1 ;1 exp(  xM )=

(5.49)

para asegurar que se satisfacen las restricciones a destino del viaje. Entonces el modelo completo se convierte en:

Tijm  Oi

;exp(  x ) exp(  x )= ;1 exp(  x )= m 1

m

M

(5.50)



Modelos de distribución zonal

Wilson (1970) ha demostrado que esta expresión también puede derivarse de la teoría de maximización de la entropía. El modelo de distribución de oportunidades relevantes es interesante porque comienza a partir de diferentes principios elementales para su derivación: utiliza la distancia como una variable ordinal y no cardinal continua como en el modelo gravitacional. Considera de forma explícita las oportunidades disponibles para satisfacer el motivo de un viaje en zonas cada vez más distantes del origen. Sin embargo, el modelo no se usa con frecuencia en la práctica, probablemente por las siguientes razones: • La base teórica es menos conocida y posiblemente más difícil de comunicar por los profesionales. • La idea de matrices con destinos ordenados según la distancia desde el origen (la celda nésima para el origen i no es el destino n sino el destino nésimo desde i) es más difícil de manipular en la práctica. • Las ventajas teóricas y prácticas de esta función sobre el modelo gravitacional no son muchas. • Falta de programas disponibles. En el Capítulo 12 se tratará una versión más general de este modelo que combina la filosofía de los modelos de gravedad y la de los modelos basados en oportunidades intermedias. Esto se debe a Wills (1986) y se deja a la interpretación de los datos la decisión de cuáles de las combinaciones de los dos modelos encaja mejor con la realidad. Por último, es necesario reconocer que la complejidad computacional de este nuevo modelo es considerable.

5.8.

CONSIDERACIONES PRÁCTICAS

Hasta aquí se ha tratado un cierto número de modelos frecuentemente utilizados para asociar orígenes y destinos y para estimar el número de viajes entre ellos. Sin embargo, aún no se ha estudiado toda una serie de consideraciones prácticas que influyen necesariamente en la exactitud requerida en la utilización de este tipo de modelos. Dichas consideraciones derivan de las limitaciones inherentes al contexto de referencia en el que se modeliza y también de la incapacidad del modelizador de incluir en ellos descripciones detalladas de la realidad. Estos aspectos, en términos generales, se tratan a continuación.

MODELOS

DE

TRANSPORTE

5.8.1.

Matrices incompletas



Las matrices observadas casi siempre son incompletas o poco densas (sparse matrices), en el sentido de que tienen un gran número de celdas vacías. La razón de ello es fácilmente intuible. En efecto, si se considera un área de estudio con 500 zonas (250.000 celdas), se pueden esperar cerca de 2,5 millones de viajes durante la hora punta, lo cual significa una media de unos 10 viajes por celda. Dado que es probable que algunos pares O-D contengan más viajes que otros (en particular los pertenecientes a áreas residenciales y/o a áreas de servicios), resulta que en general hay numerosas celdas con un número muy pequeño de viajes. Por otro lado, si se considera ahora que el método utilizado para observar esta matriz de viajes es, probablemente, realizar entrevistas a pie de vía pública y dado que la tasa de muestreo es del 20% (1 de cada 5) la probabilidad de no tener observaciones de un par O-D en concreto, es muy alta. Esta muestra de viajes será posteriormente expandida utilizando las tasas efectivas de muestreo en cada punto de encuesta, lo que no afectará, en principio, a las celdas vacías. El problema originado por la expansión de celdas vacías ya ha sido indicado en el epígrafe 5.6.1. Se puede intentar reducir este problema rellenando dichas celdas vacías utilizando técnicas de matrices parciales o, alternativamente, puede ser deseable “sembrar” en dichas celdas vacías un valor pequeño y utilizar un método alternativo de expansión de la matriz, tal y como se estudiará en el Capítulo 12. No obstante es importante tener en cuenta que las matrices normalmente “observadas” contienen un gran número de errores, los cuales son generalmente amplificados en el proceso de expansión.

5.8.2.

Tratamiento de zonas externas

Puede ser razonable afirmar que los modelos sintéticos de distribución de viajes son idóneos para modelizar un área de estudio, en particular para los viajes internos. Sin embargo, se sabe que una proporción significativa de viajes puede tener su origen o su destino fuera del área de estudio. La idoneidad de dichos modelos para representar esos viajes Externos-Internos es cuestionable, ya que éstos dependen de la distancia o del coste de viaje, el cual es una variable esencialmente indefinida para los viajes externos. Una práctica común en estos casos consiste en considerar estos viajes fuera del proceso sintético de modelizado: por ejemplo, efectuando las entrevistas



Modelos de distribución zonal

a lo largo de la calle en puntos de cordón a la entrada y a la salida del área de estudio. La matriz resultante de los viajes externos-externos (E-E) y externosinternos (E-I), se trata separadamente para previsiones utilizando los métodos del factor de crecimiento, en concreto el método de Furness. Sin embargo, ya que un cierto número de viajes en los modelos de generación y atracción corresponden a viajes E-I, éstos tienen que ser restados de los totales de viajes e incluidos como restricciones en los modelos sintéticos.

5.8.3.

Viajes intrazonales

Un problema análogo ocurre en el caso de viajes intrazonales. Dadas las limitaciones de cualquier sistema de zonificación, los valores de los costes de viaje se definen entre los conectores de centroides y ello representa una cruda pero necesaria aproximación de los costes reales. Por tanto, la idea de un coste de viajes intrazonales se considera que está pobremente representada por estos costes en los conectores de centroides. Algunos programas comerciales permiten al usuario añadir/quitar costes terminales para facilitar una mejor modelización de estos viajes; la idea de base es que a través de la manipulación de estos costes intrazonales podrían conseguirse modelos gravitacionales más consistentes con la realidad. Sin embargo, este método no es muy eficiente ni realista; en efecto, es preferible quitar los viajes intrazonales del proceso de modelización sintético y calcular la previsión de estos viajes utilizando aproximaciones aún más simples. Usualmente se asume, por ejemplo, que los viajes intrazonales sean una proporción fija de los totales calculados con los modelos de generación. Además, los viajes intrazonales no se asignan normalmente a la red en cuanto que se trata de desplazamientos dentro de un mismo centroide, por ello, resulta menos importante representar dichos viajes en detalle. En la realidad, algunos de estos viajes utilizan la red modelizada, pero generalmente se trata sólo de un problema significativo para algunos sistemas de zonificación bastante agregada.

5.8.4.

Motivo de los viajes

Normalmente se utilizan diferentes modelos para diferentes motivos de viaje y/o para diferentes clases de individuos. Típicamente, los viajes por trabajo o estudio se modelizan utilizando un modelo gravitacional doblemente acotado

MODELOS

DE

TRANSPORTE



mientras que, para casi todos los demás motivos, se utilizan modelos simplemente acotados. Ello se debe al hecho de que es a menudo difícil estimar con precisión las atracciones de viajes por motivos como compras, ocio, actividades sociales, los cuales generalmente son reportados en términos de espacios comerciales, áreas recreativas y población como indicadores de la atracción zonal. Algunos motivos de viaje además pueden ser más sensibles al coste y, por tanto, requieren la utilización de diferentes valores para la función de impedancia.

5.8.5.

Generación-atracción, origen-destino

Los modelos sintéticos han sido desarrollados en la hipótesis de que cada viaje tuviera una generación y una atracción como fin. Los modelos, esencialmente, ligan o relacionan las generaciones a las atracciones. En el caso de los viajes HB, la generación siempre es el hogar. Sin embargo, el origen de dichos viajes, sólo es el hogar para los viajes hacia el lugar de trabajo (o el lugar de estudio o compras, etc.), pero en el viaje de regreso el hogar es ahora el destino del viaje. Antes de que la matriz resultante de viajes sea asignada a la red es necesario que sea trasformada en una matriz origen-destino (O-D). En el caso de matrices diarias, ambas son prácticamente idénticas en cuanto que se supone que cada viaje generado-atraído es efectuado una vez en cada dirección durante el día. En cambio, cuando se precisan matrices O-D para períodos de tiempo corto ha de considerarse que algunos viajes se realizan en la dirección generaciónhacia-atracción mientras que otros sólo se efectúan en la dirección opuesta. Para solucionar este problema pueden utilizarse dos aproximaciones diferentes. La primera consiste en producir solamente una matriz para un único motivo, por lo general “trabajo”, y entonces suponer que estos desplazamientos siguen sólo una dirección de viaje; esto sucede, por ejemplo, con los viajes de la mañana por trabajo desde la generación hacia la atracción. Los datos de la encuesta han de ser utilizados para corregir los casos en que hay turnos de trabajo, flexibilidad en las horas de trabajo y viajes realizados por otros motivos durante las horas punta, aunque la estructura de viajes en la hora punta de la mañana todavía estará dominada por los desplazamientos por motivo de trabajo. Una segunda aproximación consiste en utilizar directamente los datos de la encuesta para determinar la proporción de cada matriz relativa a cada motivo considerado



Modelos de distribución zonal

apropiado para la parte del día en cuestión. Por ejemplo, una matriz típica de la hora punta de la mañana puede contener el 70% de desplazamientos de generación-a-atracción y solamente el 15% de desplazamientos de atraccióna-generación.

5.8.6.

Factores k

Los modelos gravitacionales pueden proporcionar una representación razonable de las estructuras de los viajes en la medida en que expliquen con consistencia, por un lado, la capacidad de generación y atracción de las zonas y por otro la “resistencia” (o el coste generalizado de transporte) al viaje que genera la distancia. Efectivamente, es conocido que la mayor parte de las decisiones individuales acerca de la localización de los hogares y/o la elección del lugar de empleo depende de muchos otros factores; en este caso, el modelo gravitacional sólo puede simular la elección del destino a un nivel agregado si la importancia de estos otros factores fuera muy reducida en dicha agregación. Por tanto, siempre hay efectos agregados que no pueden ser tratados con la utilización simplemente del modelo gravitacional. En este sentido, en algunos casos, pueden ser pares de zonas que tengan una especial asociación o relación en términos de flujos de viajes; por ejemplo, una gran industria manufacturera puede localizarse en cierta zona mientras la mayor parte de los empleados se encuentra en otra, a lo mejor porque la compañía posee un complejo residencial a tal efecto. Es probable que entre estos dos puntos haya más viajes de los previstos por un modelo cualquiera que no considere específicamente tal asociación, como en el caso del modelo gravitacional. Sin embargo, este efecto puede ser considerado con la introducción de un conjunto adicional de parámetros Kij con lo que el modelo quedaría así:

Tij  K ij AO B exp(  cij ) i i ij

(5.51)

En algunos estudios prácticos estos factores han sido utilizados para tratar de mejorar la calibración del modelo, y de hecho la mejoran; con un conjunto j completo de factores K se consigue una flexibilidad superior respecto de lo necesario para reproducir la matriz de viajes observada. Solamente con los parámetros K sería suficiente para reproducir la matriz, por tanto el resto de los parámetros constituyen un añadido con respecto a lo requerido: factores Kij idénticos a los Tij observados podrían resolver el

MODELOS

DE

TRANSPORTE



problema, sólo que entonces no se dispone ya de modelo ni queda capacidad para realizar previsiones. El mejor consejo respecto de los factores K es pues evitarlos. La utilización de un número limitado de factores K sólo se justificaría en el caso de que un área de estudio presentara un número pequeño de pares de zonas (menos del 5% del total), con asociaciones particulares de desplazamientos de viajes que probablemente no variarán en el futuro. Su utilización por tanto, ha de ser siempre moderada y cuidadosa. Sin embargo, no se justifica la utilización del conjunto completo de factores K.

5.8.7.

Errores en la modelización

De todo lo expuesto hasta ahora, se deduce que el número de errores reduce la confiabilidad del proceso de la modelización. Efectivamente, ello es cierto y refleja la imperfección que aún existe en el estado del arte de dicha modelización de los transportes. Estos aspectos prácticos no se limitan solamente a los modelos de distribución, sino que también están presentes, en diferentes formas, en las otras fases del proceso. Los errores correspondientes a las celdas de la matriz son relativamente grandes ya que muchas de ellas tienen valores pequeños, es decir, entre 0 y 5 en la muestra y cerca de 20 ó 30 en la matriz expandida o sintética. Muy pocos estudios han afrontado el problema de la calibración de modelos sintéticos comparando las matrices de viajes simuladas con las observadas. Sikdar y Hutchinson (1981) utilizaron los datos de 28 áreas de estudio en Canadá para calibrar y testear modelos gravitacionales doblemente acotados. En particular encontraron que las prestaciones de estos modelos eran bastante escasas, equivalentes a la introducción en las observaciones de un error aleatorio, comprendido entre el 75 y el 100%, y ello confirma la necesidad de ser cauteloso en la utilización de los resultados de estos modelos. Este resultado no debe sorprender en cuanto que modelizar una matriz de viajes utilizando pocos parámetros (dos veces el número de zonas por una función de impedancia exponencial) es una tarea suficientemente ardua. En efecto, ésta es una de las razones por las que también hoy en día pocos estudios utilizan los modelos gravitacionales en la forma convencional. Cuando sea necesario considerar cómo influyen las variaciones de los costes de transporte en la estructura de los viajes (en particular para motivos como compras y ocio), es mejor utilizar versiones incrementales o análisis de pivoteo del modelo gravitacional (véase epígrafe 12.3.2).



Modelos de distribución zonal

El tratamiento de los errores en la modelización ha recibido una gran atención hacia la mitad de los años 80. Existen dos métodos que merecen ser citados particularmente: la aproximación estadística y la de simulación. Los métodos estadísticos son muy potentes pero no siempre fáciles de desarrollar o de implementar. Siguen las líneas expuestas en el Capítulo 3 cuando se trató el papel de los errores de los datos en la exactitud total del proceso de modelización. Es necesario recordar asimismo que los errores en los datos se traducen posteriormente en errores en los resultados de los modelos. El Traffìc Appraisal Manual del Departamento de Transportes Británico (Department of Transport, 1985) proporciona indicaciones sobre la sensibilidad que los modelos de distribución tienen a los errores en los datos de entrada. En cierto sentido, durante el proceso de construcción de las matrices el método más simple al respecto consiste en realizar un seguimiento detallado de errores de los datos, en particular de los de muestreo. El problema se complica cuando se trata de hacer dicho seguimiento y se utilizan para ello modelos de distribución sintética. A principios de la década de los 80 se desarrollaron técnicas analíticas adecuadas para la estimación de los errores de salida del modelo debidas a la variabilidad de la muestra. Por ejemplo, el trabajo de Gunn et al. (1980) establece expresiones matemáticas aproximadas para el intervalo de confianza de las celdas estimadas en la formulación tri-proporcional del modelo gravitacional. El 95% del intervalo de confianza para el número de viajes en una celda (i,j) viene dado por {Cij / Tij – TijCij}, donde Cij representa el factor de confianza dado por la expresión: 0 ,5 ¥ ¨ · ´ ¦ 1 1 1 ¸ µ Cij  exp ¦ 2 ©© µ nijk ¤ nijk ¤ nijk ¸ µ ¦ ©¤ ¸¹ jk ki § ª ij ¶

(5.52)

nijk representa el número de viajes muestreados en la celda observada, y por tanto las sumas están solamente en las celdas observadas. Esta expresión únicamente cubre los errores debidos al muestreo: es probable que los errores en la recolección de los datos y en su elaboración hagan crecer el intervalo de confianza. En la estimación de los modelos hay, además, otras fuentes de error las cuales son más difíciles de cuantificar; se trata de los errores de especificación inherentes al hecho de que el modelo es solamente una representación

MODELOS

DE

TRANSPORTE



simplificada e imperfecta de la realidad. También este tipo de errores (misspecifìcation) hace aumentar cualquier intervalo de confianza. El segundo método para tratar los errores en la modelización viene representado por las técnicas de simulación; éstas pueden desempeñar un papel útil en los casos en que las expresiones analíticas de los intervalos de confianza de los resultados del modelo no existan o sean difíciles de desarrollar. Para calibrar un modelo se puede, por ejemplo, asumir que los datos disponibles no contienen errores y entonces, recalibrar sucesivamente dicho modelo introduciendo, de modo controlado pero realista, variabilidad en los datos. Este proceso se puede repetir muchas veces para así conseguir un conjunto de parámetros, cada uno de ellos calibrado con un conjunto determinado de “muestra” ligeramente diferente. Este proceso requiere, obviamente, una cierta cantidad de tiempo y recursos por ordenador y es, en efecto, generalmente utilizado sobre todo para objetivos de investigación. Además, este tipo de investigación puede proporcionar indicaciones útiles sobre la estabilidad de los parámetros del modelo con respecto a los errores en los datos. La utilización más simple de la simulación Monte Carlo consiste en testear la sensibilidad de los resultados del modelo con respecto a los datos de entrada en fase de previsión. Dado que se conoce que las previsiones en los datos contienen errores, el uso de esta simulación consiste en introducir en dicho método datos con un “error” razonable y luego ejecutar el modelo con cada uno de estos conjuntos de datos futuros. Los resultados proporcionan una idea de la sensibilidad del modelo con respecto a los errores presentes en las variables de planificación. Como no hay que re-calibrar (se asume que el modelo calibrado en el año base sea sin errores), la cantidad de tiempo y recursos necesarios, aunque grandes, es menor que en el caso anterior.

5.8.8.

Estabilidad de las matrices de viajes

Rara vez se discute la estabilidad en el tiempo de las matrices de viajes. Se sabe por experiencia que la realidad no es estática sino más bien dinámica. El nivel de los flujos de tráfico sobre cualquier arco de la red varía diariamente de modo significativo. Generalmente se espera un 10% de variación de los niveles de flujo en días parecidos y lo mismo para el mismo día de la semana y en semanas parecidas (es decir, se excluyen las variaciones estacionales). Estas



Modelos de distribución zonal

variaciones en los flujos de tráfico generalmente son debidas a dos causas: variaciones en las matrices de los viajes que originan tales flujos y variaciones diarias en la elección del recorrido. Las variaciones en los flujos pueden ser fácilmente detectadas en cuanto que las estaciones de aforos de tráfico permanentes o de cobertura son sencillas de instalar y mantener y también son suficientemente fiables. Los conteos de tráfico son el resultado de la agregación de viajes en matrices y dicho proceso de agregación tenderá a compensar algunas variaciones casuales a nivel de matriz de viajes. Las variaciones diarias de los valores de las celdas de la matriz de los viajes constituyen una información mucho más difícil de obtener puesto que es muy raro que, para las matrices de viajes, se puedan recolectar datos repetidos en la misma localidad para diferentes días. Leonard y Tough (1979) reportan una investigación que recolectó matrices de viajes y conteos de tráfico en cuatro días consecutivos en el centro de Reading, UK. Los datos fueron recogidos para el desarrollo de un modelo de simulación detallada. El trabajo de campo consistió en recopilar y transcribir el número de las placas de matrícula de los coches en diversos puntos trazando su recorrido por el centro de Reading junto con sus puntos de entrada/salida y aparcamiento. De este modo se eliminaron los errores de encuestas. Por razones prácticas se recogió esta información durante cuatro días (de lunes a jueves) para una muestra del 10% en aproximadamente 80 arcos reales y con 40 zonas codificadas. Los datos fueron analizados independientemente por Willumsen (1982) para observar las variaciones diarias de los flujos sobre los arcos y matrices O-D. Utilizó el porcentaje medio del error absoluto (% MAE: Mean Absolute Error) para ambos niveles de tráfico y matrices de viajes:

¥ ¤ V a V b % MAE  100% s ¦ a ¦ ¤V a § a

´ µ µ ¶

(5.53)

¥ ¤ Tija Tijb % MAE  100% s ¦ ij ¦ ¤T a ij ¦§ ij

´ µ µ µ¶

(5.54)

y

MODELOS

DE



TRANSPORTE

donde los índices a y b representan el día de la semana de los flujos observados V y los O-D de viajes de Tij. Willumsen (1982), encontró los siguientes niveles de variaciones:

% MAE

Lunes Martes Miércoles

Martes

Miércoles

Jueves

Arco

Matriz

Arco

Matriz

Arco

Matriz

11

76

11

72

12

75

13

68

14

85

12

70

Puede observarse que las variaciones diarias de los flujos de tráfico son consistentes con las esperadas, mientras que las variaciones de las matrices de los viajes son mucho más grandes. Ello se debe, en parte, al hecho de que las matrices de viajes presentan valores muy pequeños y numerosos ceros; en todo caso la evidencia sugiere que las variaciones a nivel de matrices de viaje pueden ser bastante significativas. De estos resultados se deduce que no vale la pena dedicar grandes esfuerzos para conseguir matrices de viajes observadas muy precisas en cuanto que estos análisis son sólo válidos para un momento determinado (“fotos instantáneas”). Las variaciones día a día de las matrices de viaje son importantes y pretender alcanzar un alto nivel de exactitud en estimarlas parece un esfuerzo difícil de justificar. Los resultados además sugieren que es necesario ser cuidadosos en testear cómo el valor de un plan cambia en función de variaciones en la matriz de los viajes estimada al ser utilizada durante la asignación. El análisis de sensibilidad parece una forma particularmente apropiada para estudiar el efecto de variaciones en la matriz de viajes.

EJERCICIOS 5.1. Considérese una pequeña área de estudio dividida en cuatro zonas. La matriz de viajes para esa área, conseguida utilizando una pequeña muestra, se presenta en la siguiente tabla:



Modelos de distribución zonal

1

2

3

4

1



60

275

571

2

50



410

443

3

123

61



47

4

205

265

75



Y en la siguiente tabla se presenta la previsión del total de viajes generados y atraídos por cada una de las zonas: Origen futuro estimado

Destino futuro estimado

1

1.200

670

2

1.050

730

3

380

950

4

770

265

Utilizar un método apropiado de factor de crecimiento para estimar los viajes futuros interzonales. Sugerencia: verificar primeramente las condiciones de convergencia del método seleccionado. 5.2. Sea un área de estudio atravesada por un río y dividida en tres grandes zonas, de las cuales dos de ellas (A y B) se encuentran en una ribera del río y la tercera (C) en la otra. Se considera que la demanda de viajes entre estas zonas depende del hecho de que los pares O-D estén en la misma o en diferente parte del río. De una encuesta domiciliaria mediante un pequeño muestreo se obtiene la siguiente matriz de viajes, en la que los espacios vacíos representan celdas sin observación:

Origen

A

Destino A

B

C

12

10

8

5

3

B C

4

7

MODELOS

DE



TRANSPORTE

Teniendo en cuenta que el modelo es del tipo Tij = RiSjFk, donde el parámetro Fk puede ser utilizado para representar si el par O-D se encuentra a un lado o a otro del río, calibrar este modelo utilizando el algoritmo tri-proporcional y llenar las celdas vacías de la matriz de viajes expuesta arriba. 5.3. Sea un estudio de transportes en un área que comprende cuatro ciudades (A, B, C y D). Los costes generalizados de viaje entre estas ciudades, expresados en unidad de tiempo generalizado, se presentan en la siguiente tabla:

Origen

Destino A

B

C

D

A



B

1,23

1,23

1,85

2,67



2,48

1,21

C

1,85

2,48



1,44

D

2,67

1,21

1,44



Los desplazamientos intraurbanos se excluyen del estudio. El presente estudio también incluye entrevistas efectuadas a lo largo de las vías públicas en varios puntos. El número de personas entrevistadas, su origen y destino se presentan en la siguiente tabla, en la que, de nuevo, los espacios vacíos representan celdas no observadas:

Origen

A

Destino A

B



6

B



C

8

D

6

18

C

D

2 1

4



8

6



Considérese ahora que para esta área de estudio haya sido utilizado un modelo gravitacional del tipo Tij = RiSjFk con sólo dos intervalos de coste. El primer intervalo incluye los viajes con coste entre 0 y 1,9 y el segundo incluye



Modelos de distribución zonal

los viajes que cuestan más de 1,9. Se pide: calibrar este modelo utilizando el método tri-proporcional para esta matriz parcial. Estimar los parámetros Ri, Sj, Fk y los valores que faltan en las celdas de la matriz, excluyendo los viajes intraurbanos. ¿Es única esta estimación? Justificarlo.

6. Modelos de reparto modal

6.1.

E

INTRODUCCIÓN

n este capítulo se tratarán, en primer lugar, los modelos de elección modal desde un punto de vista agregado. Se verá cuán lejos se puede llegar utilizando enfoques similares a aquellos procedimientos seguidos en la derivación y aplicación de los modelos de distribución de viajes. En segundo lugar, se examinarán métodos de estimación simultánea de modelos de generación, distribución y elección modal, los que se conocen también con el nombre de modelos de demanda directa. Dichos modelos, creados en los años 60, han sido utilizados rara vez en la práctica por razones que se discuten más adelante. La representación de la elección del modo de transporte es uno de los modelos clásicos más importantes en la planificación del transporte, dado el papel tan relevante del transporte público en las políticas de transportes. De hecho, todos los modos de transporte público, casi sin excepción, utilizan el espacio vial de forma más eficiente que los vehículos privados; aún más, sistemas como el metro y el ferrocarril no ocupan la red vial (aunque ocupan espacios de otro tipo) y, por lo tanto, no contribuyen a la congestión. Más aún, si algunos automovilistas pudieran ser persuadidos de utilizar el transporte público en lugar del coche privado, el resto de los usuarios del coche se verían beneficiados en términos de una mejora de los niveles de servicio. Además, es poco probable que las áreas urbanas consigan acoger a todos aquellos que desean utilizar su vehículo privado sin sacrificar zonas importantes de la trama urbana para la construcción de carreteras y aparcamientos. El problema de la elección modal, por lo tanto, representa el elemento más importante en la planificación de los transportes y en la toma de decisiones. La elección modal influye en la eficiencia general del sistema del transporte, en la cantidad del espacio urbano dedicado a las funciones del transporte, así



Modelos de reparto modal

como en el conjunto de alternativas disponibles o no para los viajeros. Dicho problema es igualmente importante en los transportes interurbanos, visto que también los sistemas ferroviarios representan un sistema de transporte eficiente (en términos de recursos consumidos, incluido el espacio) aunque existe una clara tendencia al aumento del transporte por carretera. Por lo tanto, es importante desarrollar y utilizar modelos que sean sensibles a aquellos atributos del viaje que influyen en las elecciones individuales del modo. Se verá en qué medida es posible enfrentarse a este problema a través de enfoques agregados, en los que las políticas alternativas deben expresarse como modificaciones a funciones, como el coste generalizado del viaje, útiles pero poco flexibles. Es necesario recordar que, en el pasado, se consideraba que la elección de modo era influenciada principalmente por las características socio-económicas de los individuos, de ahí que la elección modal estuviese ligada a variables como la renta (cuanto más alta es la renta, más automóviles se adquieren y por lo tanto se utilizan), la posesión de automóvil o la densidad residencial. Estos modelos eran coherentes con una visión general de la planificación que tenía como objetivo prever el aumento de los viajes en coche; en el corto plazo, pueden ser muy exactos aunque son inadecuados, en cuanto a que son insensibles a escenarios políticos como la mejora del transporte colectivo, las restricciones de estacionamiento, etc. Los modelos aplicados después de la fase de distribución (denominados trip-interchange modal split o modelos de distribución y partición modal) tienen la ventaja de facilitar la inclusión de las características del viaje y de las alternativas disponibles para realizarlo, aunque resulta difícil incluir las características de los viajeros que ya se han agregado en la matriz de viajes. Los primeros modelos de este tipo se basaban en curvas experimentales con poca base teórica, por lo tanto su consistencia en fase de predicción es dudosa. Además consideraban pocas características (generalmente solamente el tiempo de viaje a bordo) mientras que no se consideraban variables políticas importantes como la tarifa, el coste del estacionamiento, etc. En fin, siendo modelos agregados, es difícil que prevean correctamente las restricciones y las características de los modos disponibles para cada familia.

6.2.

FACTORES QUE INFLUYEN EN LA ELECCIÓN MODAL

Los factores que influyen en la elección modal se pueden clasificar en tres grupos:

MODELOS

DE

TRANSPORTE



1. Características de las personas individuales que realizan el viaje. En general se consideran importantes: • disponibilidad y/o posesión de coche; • permiso de conducir; • estructura del hogar (pareja joven, pareja con niños, jubilados, solteros, etcétera); • ingreso; • decisiones tomadas en otro lugar, por ejemplo, la necesidad de utilizar el coche para trabajar, acompañar a los niños a la escuela, etcétera; • densidad residencial. 2. Características del viaje. La elección del modo está fuertemente influenciada: • Por el propósito del viaje; por ejemplo, es en general más fácil utilizar el transporte colectivo para ir al trabajo que para otros desplazamientos, dada su regularidad y la posibilidad de ajustes en el largo plazo. • Por el período del día en el que se realiza el viaje. Los viajes realizados en las últimas horas del día se realizan con mayor dificultad en transporte público. 3. Características del medio de transporte. Éstas pueden ser divididas en dos categorías. La primera está constituida por factores cuantitativos como: • el tiempo relativo del viaje: tiempo de viaje a bordo del vehículo, de espera y a pie por cada modo; • los respectivos costes monetarios (tarifas, combustible y costes directos). La segunda está constituida por factores cualitativos, menos fáciles de medir, como: • la comodidad y/o conveniencia; • la confiabilidad y regularidad; • la protección y seguridad; Un buen modelo de elección modal debería incluir los factores más importantes de entre los citados. Los modelos de elección modal pueden ser agregados, si se basan en informaciones a nivel zonal (e interzonal), o pueden ser



Modelos de reparto modal

desagregados, si se basan en datos familiares o individuales. Los modelos agregados pueden incorporar las características del viaje y de los medios de transporte con una segmentación sencilla (p. ej., la disponibilidad de coche); generalmente utilizan el concepto de coste generalizado. Los modelos desagregados pueden, al menos potencialmente, incluir la mayoría de los factores mencionados.

6.3.

MODELOS DE ELECCIÓN DE DESTINO Y PARTICIÓN MODAL

La aplicación de los modelos de elección modal para toda la población proporciona, evidentemente, viajes repartidos según diferentes modos, de ahí viene su nombre de modelos de partición modal. En el pasado, especialmente en EE.UU., se pensaba que las características personales eran los elementos determinantes y más importantes para la elección del modo de viaje y, consecuentemente, se intentaron aplicar modelos de partición modal inmediatamente después de la generación del viaje. De esta forma podrían preservarse las diferentes características de los individuos y utilizarlas para estimar la partición de modo: por ejemplo, para los diferentes grupos después de haber usado un modelo de análisis de categorías. Ya que a ese nivel no había ninguna indicación de hasta dónde pueden llegar los viajes, las características del viaje y los modos fueron omitidos en estos modelos. Esto era consistente con una visión planificadora global según la cual, cuando aumentan los ingresos, la mayoría de las personas adquieren un coche y desean utilizarlo. El objetivo de la planificación de transporte fue pronosticar este crecimiento de la demanda para los viajes en coche con el fin de planificar las inversiones para satisfacerla. Los modelos de partición modal de aquella época, relacionaban la elección de modo solamente con factores como ingresos, densidad de población y propiedad de los coches. En algunos casos se incluyó la disponibilidad de un servicio de transporte público razonable introduciendo un índice de accesibilidad en las correspondientes formulaciones. A corto plazo estos modelos podían ser muy exactos, especialmente si existía transporte público disponible de forma similar en toda la zona de estudio y si había poca congestión. Sin embargo, este tipo de modelos son bastante pesimistas en el sentido de ser insensible a las decisiones de políticas de trasporte; parece que no hubiera nada que pudiesen hacer los que toman las decisiones para influir en la elección de modo. Aspectos como mejorar el transporte pú-

MODELOS

DE



TRANSPORTE

blico, restringir el aparcamiento, cobrar por el uso de carreteras, no tendrían efecto sobre la partición modal según estos modelos de elección.

6.4.

MODELOS DE DISTRIBUCIÓN Y PARTICIÓN MODAL

La modelización del reparto modal tuvo gran auge en Europa, casi desde el principio, por los modelos postdistribución; es decir, son modelos aplicados posteriormente al modelo gravitacional o a otro modelo de distribución. Esta forma de trabajar tiene la ventaja de facilitar la inclusión de las características del viaje y de los modos alternativos; sin embargo, dificulta la inclusión de las características del usuario ya que quizás dichas características se hayan agrupado ya en la matriz o matrices del viaje. Los primeros modelos incluyeron solamente una o dos características del viaje, usualmente el tiempo del viaje (dentro del vehículo). Se observó que una curva de forma S representaba mejor este tipo de comportamiento, tal y como se puede ver en la figura 6.1, la cual muestra la proporción de viajes realizados por el modo 1 (Tij1 / Tij) frente a la diferencia de tiempo o coste.

T 1ij Tij 1,0

0,5

0

Figura 6.1.

(C 2ij – C 1ij)

Curva de partición modal.

Éstas fueron curvas empíricas, obtenidas directamente a partir de los datos y siguiendo una aproximación similar a las curvas utilizadas para calcular la proporción de viajeros que iban a desviarse para usar una ruta alternativa (más larga pero más rápida); de ahí su nombre –curvas de desviación. Por ejemplo,



Modelos de reparto modal

el Estudio del Transporte en Londres (Fase III) empleaba las curvas de desviación para los viajes hacia el centro y los viajes fuera del centro (los primeros normalmente realizados mediante el transporte público) y según diferentes motivos de viaje. Es obvio que estos modelos solamente se pueden utilizar para las matrices de viajes de los usuarios con una elección disponible, es decir aquellos que no se encuentran cautivos de un modo en particular. Esto a menudo se materializa en una matriz de personas con disponibilidad de coche, aunque la partición modal también se puede aplicar a la elección entre diferentes modos de transporte público. Estos modelos tienen poca base teórica, lo cual pone en duda su capacidad de previsión. También ignoran diversas variables políticas sensibles como son las tarifas de viaje, de aparcamiento, etc. Además, como los modelos son de tipo agregado es poco probable que vayan a modelizar con exactitud las restricciones y características de los modos disponibles para los individuos.

6.5. 6.5.1.

MODELOS SINTÉTICOS Modelos simultáneos de distribución y de reparto modal

El enfoque de maximización de la entropía puede utilizarse para generar modelos simultáneos de distribución y elección modal. Para ello, es necesario formular el problema de maximización de la entropía en términos de, por ejemplo, dos modos tal y como se muestra a continuación:

Maximizar log W [Tijk ]  ¤ (Tijk log Tijk Tijk ) ijk

(6.1)

Sujeto a:

¤T

Oi  0

(6.2)

¤T

Dj  0

(6.3)

¤T

Cijk C  0

(6.4)

k ij

jk

k ij

ik

k ij

ijk

MODELOS

DE



TRANSPORTE

Es fácil ver que este problema lleva a la siguiente solución:

Tijk  AO B j D j exp(  Cijk ) i i 1 ij

P 

Tij1 Tij



exp(  Cij1 ) exp(  Cij1 ) exp(  Cij2 )

(6.5) (6.6)

donde Pij1 es la proporción de viajes realizados entre i y j con el modo 1. La forma funcional en (6.6) se conoce como logit y se estudiará con detalle en el siguiente capítulo. Sin embargo, es útil citar algunas de sus propiedades: • • • •

Genera una curva en forma de “S”. Si C1 = C2, entonces P1 = P2 = 0,5. Si C2 >> C1 entonces P1 → 1. El modelo puede extenderse fácilmente al caso de más de dos modos 1 ij

P 

exp(  Cij1 )

¤ exp(  C

k ij

(6.7)

)

k

Hay que destacar que en esta formulación, β desarrolla un doble papel; por un lado, como parámetro que controla la dispersión en la elección modal y por otro en la elección de diferentes destinos que se encuentran a distancias diferentes del origen. Aunque esté justificado mediante base teórica, se considera que sólo dicho parámetro asume demasiada responsabilidad (en cierto modo es “pedirle demasiado” a un parámetro solo). Por lo tanto, en muchos estudios se ha utilizado un modelo conjunto de distribución y elección modal, más práctico, de la forma: kn ij

n i

n i

n ij

T  A O B j D j exp(  n K )

exp( n Cijk )

¤

' k

exp( n Cijk ' )

(6.8)

donde Kijn es el coste compuesto de viaje entre i y j percibido por el individuo de tipo n. El coste compuesto puede ser especificado de muchas formas diferentes; por ejemplo, puede ser el mínimo entre los dos costes o, quizás mejor, igual a su promedio ponderado:

K  ¤ Pk C k k

(i y j se omiten por simplicidad de notación)



Modelos de reparto modal

Es interesante señalar que la mayoría de las formulaciones utilizadas en muchos estudios hasta 1970 eran inapropiadas. Ejemplo 6.1: considérese la expresión de la media ponderada representada más arriba y analícese lo que sucede cuando se añade a un sistema unimodal actualmente existente, un nuevo modo más costoso (C2 > C1). k k 1 En el estado inicial se tiene que: K  ¤ P C  C k

Mientras en el estado final, después de la introducción del modo 2, quedaría:

K *  P1C 1 P 2 C 2 Sin embargo, se sabe que P1 + P2 = 1 y, por lo tanto:

K *  (1 P 2 )C1 P 2C 2  C1 P 2 (C 2 C1 ) K *  K P 2 (C 2 C1 ) Ahora, siendo P2 y (C2 – C1) mayores que cero, se puede concluir que K > K, lo cual carece de sentido porque la introducción de una nueva alternativa, aunque sea más costosa, no debería hacer que los costes compuestos creciesen; en el peor de los casos, deberían quedar iguales. Williams (1977) ha demostrado que la única especificación correcta, compatible con la teoría predominante del comportamiento de elección racional (ver epígrafe 7.2) es: *

K ijn 

1 log ¤ exp( n Cijk ) n k

(6.9)

donde tiene que satisfacer la siguiente restricción: βn ≤ λ n

(6.10)

Se volverá a tratar dicha restricción en el Capítulo 7. La medida del coste compuesto (6.9) tiene las siguientes propiedades: k • K b Mink [C ]

K  Mink [C k ] , que corresponde a la elección del modo “todo o nada”. • lim  md

MODELOS



DE

TRANSPORTE



dK  Pk k dC

El modelo [(6.8) – (6.10)] representa “la buena práctica” de la modelización agregada del reparto modal y de la distribución, sobre todo para las áreas urbanas. Aunque un número importante de modelos de este tipo se sigue aplicando en la práctica, actualmente están siendo reemplazados por los modelos desagregados, ya que responden mejor a los elementos fundamentales de la elección modal y utilizan los datos de manera más eficiente justificando el esfuerzo requerido para su recolección; nuevamente se tratarán estos modelos en los Capítulos 7 y 9.

6.5.2. Modelos de reparto multimodal La figura 6.2 ilustra las estructuras posibles de un modelo de elecciones entre más de dos modos. La estructura dee NN-ramas independientes que, como se verá en el Capítulo 7, es muy popular en la modelización desagregada, es la más simple; sin embargo, tal y como se indica en el ejemplo famoso del bus azul-bus rojo (Mayberry, 1973), cuando algunas alternativas se parecen más que otras (o sea, cuando las alternativas están correlacionadas), esta estructura puede crear problemas, porque asume que todas las alternativas tienen un “peso” igual. Ejemplo 6.2: considérese una ciudad donde el 50% de los viajeros eligen el coche (C) y el 50% el autobús (B). De acuerdo con el modelo (6.7), es decir una estructura de N-ramas independientes, esto significa que CC = CB. Supóngase que el director de la empresa de transporte, en un punto de ingenio, decida pintar la mitad de los autobuses de rojo (BR) y los otros de azul (BA) sin modificar el nivel del servicio. Esto significa que CBR = CBA y, debido a que el modo coche no ha cambiado, su coste todavía es igual a CC. Es interesante apreciar que el modelo (6.7) ahora prevé para el modo coche la siguiente probabilidad de elección:

PC 

exp(  CC )  0, 33 exp(  CC ) exp(  CBR ) exp(  CBA )

cuando cabría esperar que la PC fuera 0,5 y que los autobuses se dividieran la mitad del mercado de igual manera entre el autobús rojo y el azul.



Modelos de reparto modal

El ejemplo es, obviamente, exagerado pero sirve para indicar el problema de la estructura de N-ramas independientes en presencia de alternativas correlacionadas (en este caso totalmente correlacionadas). Se volverá a tratar este tema en el Capítulo 7. La estructura modo-anidado, que se ilustra en la figura 6.2b, ha sido utilizada por muchos profesionales “pragmáticos” hacia finales de los 60 y a principios de los 70, pero se ha demostrado que produce resultados diferentes según el modo que se considere como modo añadido (Langdon, 1976). Además, utilizando la simulación de Monte Carlo se ha demostrado que la forma del modo añadido que mejor funciona en el año base, en presencia de algunos cambios, no es necesariamente la mejor en el futuro (Ortúzar, 1980a). La tercera posibilidad, ilustrada en la figura 6.2c, es la estructura jerárquica (o nested structure). En este caso, las alternativas que tienen elementos en común (es decir que son más similares a otras o están correlacionadas) se agrupan en una primera división (p. ej., transporte público). Después de que han sido “separadas” de la alternativa no correlacionada, se agrupan en una agrupación secundaria. Esta forma de proceder ha representado la práctica usual en la década de los 60 y principios de los 70, pero tenía la desventaja de que los costes compuestos para el “transporte público” normalmente se tomaban iguales al mínimo entre los costes de autobús y de tren para cada par de zonas y que la repartición secundaria se obtenía a través de una asignación de coste mínimo “todo o nada”. Este procedimiento “pragmático” implica un valor infinito para el parámetro de dispersión de la función de reparto sub-modal, mientras comúnmente se sabe que, aún satisfaciendo (6.10), tiene un valor del mismo orden de magnitud del parámetro de dispersión en el reparto principal. Ejemplo 6.3: sea nuevamente el problema del autobús rojo/azul del ejemplo 6.2, pero esta vez, considérese la siguiente expresión de la estructura jerárquica:

PC 

1 ; 1 exp [ 1 (CB CC )]

PR/B 

1 1 exp [ 2 (CBA CBR )]

PB  1 PC

MODELOS

DE



TRANSPORTE

Todos los viajes Elección modal Modo A

(a) Estructura de N-ramas

Modo B

Modo C

Todos los viajes Primera elección + nuevo

+ nuevo

Modo B Modo A

Modo C

Segunda elección

Segunda elección

Modo A

Modo B

Modo B

Modo C

(b) Estructura de modos anidados

Todos los viajes Reparto primario Modo compuesto Reparto secundario Modo A (c) Estructura jerárquica

Modo B

Modo C

Figura 6.2. Estructuras del modelo multimodal: (a) estructura de N-ramas independientes, (b) estructura modos-anidados, (c) estructura jerárquica.

PA/B  1 PR/B con

CB 

1 log ¨ªexp( 2 CBR ) exp( 2 CBA ) ·¹ 2

donde PC , como antes, es la probabilidad de elegir el modo coche; (1 – PC))PR/B es la probabilidad de elegir el autobús rojo, (1 – PC))PA/B es la probabilidad de elegir el autobús azul y λ son los parámetros del reparto principal y secundario.



Modelos de reparto modal

Es simple ver que, si CC = CB, este modelo asigna un probabilidad igual a 0,5 para el automóvil y a 0,25 para cada una de las dos alternativas de bus. Sin embargo, el valor del coste compuesto del bus CB no es el mismo que el del bus rojo o azul (CBR y CBA). De hecho, el primero depende del valor de λ2 y para el problema del bus azul/rojo se tiene:

CB  CBA

1 log 2 2

Por lo tanto el coste compuesto de autobús será siempre menor que el coste del autobús azul o rojo. El parámetro de dispersión λ2 permite elegir a los usuarios las alternativas que no minimizan la parte observada de la función de coste generalizado debido a la existencia de variables no incluidas en el modelo. Dado ahora un par O-D donde los costes de viaje en autobús (rojo o azul) y en coche son todos iguales a 50 minutos generalizados. Considérese también que λ2 es igual a 0,9. En este caso el valor del coste compuesto CB no es 50 si no 49,23 y el porcentaje de usuarios que elige el coche dependerá del valor de λ1, tal y como se expone en la siguiente tabla. λ1

PC

0,001

0,500

0,005

0,499

0,010

0,498

0,050

0,490

0,100

0,481

0,500

0,405

0,600

0,386

0,700

0,368

0,800

0,351

0,900

0,333

Puede observarse también que si λ1 = λ2 entonces PC = 1/3 o sea se obtiene el mismo resultado de un modelo logit trinomial, porque la estructura jerárquica colapsa en el modelo logit simple (epígrafe 7.4).

MODELOS

DE



TRANSPORTE

Sin embargo, para valores pequeños, por ejemplo, λ1 = 0,1, la estructura jerárquica prevé un porcentaje de usuarios que escogen el automóvil (48%) muy cercano al valor esperado (50%). Aquí surge la siguiente duda: ¿este 2% que se pierde puede explicarse porque algunos usuarios tienen una preferencia especial por un color o porque algunos usuarios se ven influenciados por cualquier cambio (la nueva pintura) en la oferta de un servicio?

6.5.3.

Calibración de modelos logit binarios

Sea ahora un modelo de elección entre el coche y el transporte público con costes generalizados Cijk dados por una expresión del tipo (5.2). Tal y como se estudió en el Capítulo 5, los pesos “a” asociados a cada elemento de coste se consideran como dados y la calibración consiste solamente en encontrar los mejores valores para los parámetros de dispersión λ y de penalidad modal δ (se considera asociado al segundo modo). Además, sean Cij1 y Cij2 las partes “conocidas” del coste generalizado para cada modo y par O-D, si también se dispone de información acerca del porcentaje de usuarios que elige cada modo para cada par (i,j), Pij*, es posible estimar los valores de λ y de δ utilizando una regresión lineal siguiendo los pasos indicados a continuación. El porcentaje P modelizado para cada par (i,j), eliminando los índices (i,j) por sencillez de notación, da como resultado:

P1 

1 1 exp [  (C2  C1 )]

P2  1 P1 

(6.11)

exp [  (C2  C1 )] 1 exp [  (C2  C1 )]

Por lo tanto, la relación entre los dos porcentajes, es:

P1 / (1 P1 )  1 / exp [  (C2  C1 )]  exp [ (C2  C1 )] y tomando logaritmos en ambas partes, se obtiene:

log ; P1 / (1 P1 ) =   (C2 C1 ) 

(6.12)



Modelos de reparto modal

donde P y C son datos observados y λ y δ son, por lo tanto, las únicas incógnitas. Estos valores pueden calibrarse haciendo una regresión lineal en la que la parte izquierda del (6.12) representa la variable dependiente mientras (C2-C1) es la independiente, λ es la pendiente de la recta y λδ el intercepto. Obsérvese que si se asume que los pesos a en la función de coste generalizado son desconocidos, es todavía posible calibrar el modelo utilizando la ecuación (6.12) y la regresión lineal múltiple. En este caso los pesos calibrados incluirían el parámetro λ. Otros métodos de calibración se discuten en el siguiente epígrafe. Ejemplo 6.4: sean los datos de la tabla siguiente: Tabla 6.1.

Datos agregados para el modelo de reparto binario

Par de zonas

P1 (%)

P2 (%)

C1

C2

log[P1 / (1 – P1)]

1

51,0

49,0

21,0

18,0

0,04

2

57,0

43,0

15,8

13,1

0,29

3

80,0

20,0

15,9

14,7

1,39

4

71,0

29,0

18,2

16,4

0,90

5

63,0

37,0

11,0

8,5

0,53

en la que las primeras cuatro columnas representan los datos relacionados con la elección agregada del modo entre cinco pares de zonas; mientras la última columna de la tabla corresponde a los valores de la parte izquierda de la ecuación (6.12). La ecuación (6.12), puede ser representada gráficamente como se muestra en la figura 6.3, en la que λ ≈ 0,72 y δ ≈ 3,15.

6.5.4.

Calibración de modelos jerárquicos de partición modal

Normalmente la calibración de estos modelos se lleva a cabo de forma heurística o recursiva, comenzando con la partición sub-modal y procediendo hacia arriba hasta la partición primaria. Se postpone hasta el Capítulo 7 la discusión general sobre las ventajas de esta aproximación en comparación a la, teóricamente, superior estimación simultánea. Dentro de esta aproximación general existen varios procedimientos de calibración posible. Se ha demostrado (véase Domencich y McFadden, 1975)

MODELOS

DE



TRANSPORTE

log

2,5

P1 (1 – P1)

2,0

log

P1 = λ(C2 – C1) – λδ (1 – P1)

1,5 1,0 0,5 0

0

-1,0

-2,0

-3,0

(C2 – C1)

Figura 6.3. Recta que mejor se ajusta a los datos de la tabla 6.1.

que las estimaciones mediante máxima verosimilitud son preferibles a las estimaciones por mínimos cuadrados, tanto en la teoría como en la práctica. Ello es especialmente cierto cuando se trabaja con grandes series de datos. Sin embargo, cuando se trata de fuentes de datos agregados normalmente conviene agrupar la información dentro de clases idóneas para su análisis. De forma más importante, los datos normalmente disponibles son, por definición, datos de muestreo que han sido expandidos y multiplicados por algunos factores derivados empíricamente para representar los viajeros. Esto puede provocar discrepancias cuando se utilizan varias fuentes de datos con diferentes factores de expansión, pero, en este momento, el aspecto importante es que la serie de datos reales es muy pequeña. Hartley y Ortúzar (1980) compararon diversos procedimientos y encontraron que la máxima verosimilitud producía no solamente resultados de calibración más exactos sino también más eficientes en términos de tiempo de ordenador. Considérese un problema trinomial que implica la elección entre, por ejemplo, coche, autobús y ferrocarril. También se va a suponer que estos dos últimos modos están correlacionados debido a su naturaleza de “transporte público”. La calibración heurística procede de la siguiente forma. Primero, se obtiene λ2 para la partición sub-modal (autobús frente a ferrocarril) tal y como se explicaba en el ejemplo 6.4 y se utiliza su valor para calcular los costes compuestos de



Modelos de reparto modal

transporte público necesarios para la partición primaria utilizando una expresión como la del ejemplo 6.3. Para los pares de zonas donde hay una elección de modo (es decir, son posibles los viajes de ambos modos) los viajes se clasifican según diferentes intervalos de coste de un cierto tamaño mínimo. Aquellos viajes que no tienen elección de modo se excluyen de la calibración. Entre los intervalos de costes con viajes asignados, pueden existir algunos de ellos sin ningún viaje; por lo tanto los intervalos se deben agrupar en intervalos más grandes hasta que cada estrato contenga algún viaje. Finalmente, para cada estrato se calcula un coste representativo ponderado. Entonces, si N es el número total de intervalos, nk es el número de viajes observado dentro del intervalo de costes k, rk es el número de viajes observado para el primer modo dentro del intervalo, y

Pk 

1 ;1 exp( Yk )=

La probabilidad de elegir el primer modo en el intervalo k, con Yk = axk + b, donde xk es el coste representativo del intervalo k, y a y b son los parámetros que hay que estimar (es decir, λ = a así como la penalización modal δ = b / a), el logaritmo de la función de probabilidad (véase el Capítulo 8 para más detalles) puede escribirse como:

L  ctte ¤ ¨ª nk rk log(1 Pk ) rk log Pk ·¹ k

(6.13)

El procedimiento de maximización se realiza a través de las derivadas primera y segunda de (6.13) con respeto a los parámetros, los cuales en este simple caso tienen expresiones analíticas sencillas:

uL  ¤  rk nk Pk xk ua k uL  ¤  rk nk Pk ub k u2L  ¤ nk Pk 1 Pk xk2 ua 2 k

MODELOS

DE



TRANSPORTE

u2 L  ¤ nk Pk 1 Pk ub 2 k u2 L  ¤ nk Pk 1 Pk xk uaub k Conociendo los valores de las derivadas, cualquier algoritmo de búsqueda va a encontrar el máximo sin ninguna dificultad. Las rutinas de maximización requieren valores iniciales para los parámetros, junto con alguna indicación de su lejanía con respecto al óptimo. La eficacia de la calibración normalmente depende de la exactitud de estas estimaciones. Un procedimiento para generar primeras estimaciones bastante exactas consiste en encontrar el coste equi-probable (véase Bates et al., 1978), donde la probabilidad de elegir cualquiera de los modos es 0,5. Antes de cerrar este capítulo conviene discutir una aproximación alternativa que consolide, en un solo modelo, los aspectos de dos o tres de los sub-modelos clásicos.

6.6. 6.6.1.

MODELOS DE DEMANDA DIRECTA Introducción

La metodología secuencial requiere la estimación de sub-modelos relativamente bien definidos. Un enfoque alternativo consiste en desarrollar directamente un modelo que incorpore la generación, distribución y elección del modo de transporte. Éste es un método muy atractivo en tanto en cuanto evita algunos problemas del enfoque secuencial. Por ejemplo, ya se ha citado anteriormente, que los modelos gravitacionales presentan el problema de tener que tratar los errores de los totales de generación y atracción y los errores generados por viajes intrazonales estimados de forma no muy rigurosa. Los modelos de demanda directa, sin embargo, no presentan este problema puesto que se calibra simultáneamente un modelo para las tres respuestas conductuales: generación, distribución y elección de modo. Los modelos de demanda directa pueden ser de dos tipos: los puramente directos cuando utilizan una sola ecuación estimada para relacionar la demanda de viajes directamente con los atributos del modo, del viaje y del individuo; o casi directos cuando el reparto modal y la demanda de viajes totales (O-D)



Modelos de reparto modal

están, de alguna manera, separados. Los modelos de demanda directa están estrechamente ligados a los modelos generales econométricos de demanda y desde hace mucho tiempo se han inspirado en las investigaciones en este campo.

6.6.2. Modelos de demanda directa y modelos abstractos Los primeros tipos de modelos de demanda directa han sido los de tipo multiplicativo. El modelo SARC (Kraft, 1968), por ejemplo, estima la demanda utilizando una función multiplicativa de variables de actividad y socioeconómicas para cada par de zonas y de atributos de nivel de servicio de los modos que sirven a estas zonas: 1 2 Tijk   ( PP )k 1 ( I i I j )k 2 ” ¨© tijm km  cijm km ·¸ i j ¹ m ª

(6.14)

donde P es la población, I es el ingreso o renta, t y c el tiempo y el coste de viaje respectivamente entre i y j en el modo k, y ϕ, θ y α son parámetros del modelo. Esta complicada expresión puede ser re-escrita más simplemente definiendo las siguientes variables compuestas (Manheim, 1979):  1km

Lijm   tijm

2 m  km ij

c

Yik  Pik 1 I ik 2 Z jk  Pjk 1 I jk 2 Con lo que la ecuación (6.14) queda:

Tijk  Yik Z jk ” Lijm m

(6.15)

así esta transformación facilita la interpretación de los parámetros del modelo; es decir, ϕ es el parámetro de escala que depende del motivo del viaje a estudio. θk1 y θk2 son la elasticidad de la demanda respecto a la población y al ingreso respectivamente; se espera que estos parámetros tengan signo positivo. α1km y α 2km representan la elasticidad de la demanda respecto al tiempo y al coste de viaje; las elasticidades directas (es decir, cuando k = m) han de ser negativas en tanto que las elasticidades cruzadas deberían ser positivas. El mo-

MODELOS

DE



TRANSPORTE

delo, en principio, es particularmente atractivo en cuanto que permite tratar simultáneamente generación, distribución y reparto modal incluyendo atributos de los modos competitivos así como una amplia variedad de variables de nivel de servicio y de actividad. El principal problema que presenta este modelo es el gran número de parámetros necesarios para poder utilizar sus ventajas. Domencich et al. (1968) han propuesto fórmulas alternativas que contienen términos lineales y exponenciales además de los multiplicativos. Otra función directa de demanda originariamente propuesta en el estudio del corredor North Eash en EE.UU. se conoce como modelo McLynn (ver Manheim, 1979) y tiene la siguiente forma:

Tijk   ( PP ) (Ii I j ) i j 1

2

1 k

2 k

t C ¤ ¨©ª t  C k ij

m ij

1m

k ij

m ij

m



« ¨ m 1m m  m2 · º ¬¤  tij  Cij ¸ » 2 m · ­ m ©ª ¹¼ ¸¹

(6.16)

Al objeto de entender esta función, se consideran las siguientes simplificaciones: sean sólo dos modos (p. ej., 1 y 2) y ψ = 0. Omitiendo los índices i y j por simplicidad de notación, se definen las siguientes variables compuestas:

Yij  Y   ( PP )1 ( I i I j )2 i j 1 k

Lk   t k

2 k

C k

Teniendo en cuenta estas transformaciones, se pueden escribir las siguientes expresiones para los modos 1 y 2:

T1 

YL1 YL2 y T2  L1 L2 L1 L2

Siendo el número total de viajes T = T1 + T2 = Y, las proporciones modales vienen dadas por las siguientes ecuaciones: P1 = T1 / T = L1 / (L1 + L2) = 1 / (1 + L2 / L1) P2 = 1 – P1 = 1 / (1 + L1 / L2) que se pueden representar gráficamente como se expone en la figura 6.4. En particular, la figura 6.4a representa la variación de la proporción de utiliza-



Modelos de reparto modal

ción de cada uno de los modos con respecto a la relación entre sus niveles de servicio. Ello significa que si, por ejemplo, se desea aumentar la tarifa del modo 2 sin disminuir su actual cuota de mercado se deben realizar modificaciones para mantener constante el nivel de servicio L2. La figura (6.4b) indica que para poder mantener constante el nivel de servicio se tiene que hacer variar también t2 (obviamente sin variar el otro modo). Volviendo atrás, al modelo general (6.16), es fácil ver que los parámetros tienen, en general, el mismo significado pero su número es mucho menor que en el modelo SARC. Solamente ha aparecido un nuevo parámetro ψ, cuyo análisis es muy instructivo. Dicho parámetro se ha introducido para permitir que el término al que está asociado represente el potencial total de viajes para los diferentes modos; de esta manera, el término anterior, en la ecuación, tiene la función de reparto modal de estos viajes entre los diferentes modos, como se acaba de ver. Pk

Ck

1,0 T2 T1 + T2 0,5 Lk = A Lk = B Lk = C

T1 T1 + T2 0

0 (a)

1

L2 / L1

(b)

tk

Figura 6.4. Funciones de reparto modal en el modelo de McLynn; (a) curvas de reparto modal, (b) curvas de isocoste.

El examen de algunos casos particulares sugiere que el modelo puede no tener una sólida base teórica. Por ejemplo, si ψ = 0, tal y como se vio anteriormente, el último término de la ecuación (6.16) desaparece. Si ψ = 1 el último término y el término del denominador de dicha ecuación se cancelan, conduciendo a la siguiente expresión:

MODELOS

DE



TRANSPORTE

Q1

Q2

Tijk  F ( PP ) ( Ii I j ) i j

A1k

  tijk

Cijk

A k2

que efectivamente dice que lo que sucede en un modo no influye en lo que sucede en los otros y eso es totalmente irreal. De hecho se ha demostrado que si 0 < ψ < 1, el modelo proporciona resultados satisfactorios; en este sentido es importante destacar que el valor de calibración que mejor se ajusta a los datos obtenidos del estudio original era 0,77 (McLynn y Woronka, 1969). Ejemplo 6.5: sea la función de demanda siguiente: T12 = 10.000 t12α c12β q12μ donde t es el tiempo medido en horas, la tarifa c en $US y la frecuencia del servicio q en servicios/día. Los valores estimados de los parámetros son α = –2, β = –1 y μ = 0,8 (obsérvese que los signos son intuitivamente correctos). Si el operador del servicio quiere aumentar las tarifas en un 20%, se pregunta, ¿qué cambios deben realizarse en el nivel de servicio para mantener el mismo volumen de viajes, conservando el resto igual? Se define L12 = L = t–2 c –1 q0,8 y se sabe que si L permanece constante el volumen total T12 no varía (ceteris paribus). Se sabe además que la elasticidad E(L, x) del nivel de servicio (o sea, la demanda) con respecto a cada atributo x (tiempo, coste y frecuencia) es respectivamente –2, –1 y 0,8. Ahora, si sólo variase c, se obtendría que L = k / c donde k es una constante; por lo cual un crecimiento del 20% de c significaría un nuevo nivel de servicio L' = k / 1,2c o bien L' / L = 0,833. Esto es, una disminución del 16,7% de L. Para compensar este efecto, el operador tiene que introducir cambios en el tiempo de viaje, en la frecuencia del servicio o en ambas. Ahora bien, a partir de la definición de elasticidad (ver Capítulo 2), se tiene que:

$L( c ) z E ( L, c) L$c / c z L$c / c $L( t ) z E ( L, t ) L$t / t z 2 L$t / t $L( q ) z E ( L, q ) L$q / q z 0, 8L$q / q Si se desea que ΔL(c) sea igual a –ΔL(q), se requiere que:

L$c / c z 0.8 L$q / q es decir:

$q / q z 1, 25$c / c z 1, 25 x 0, 20  0, 25 o´ 25%



Modelos de reparto modal

Si se quiere modificar, ya sea la frecuencia o el tiempo de viaje, entonces:

$L( c )  ($L( q ) $L( t ) ) es decir:

2$t / t  0,8$q / q – 0,20 que es una recta de soluciones factibles (ver Figura 6.5). t t 0,2 0

0,2

q q

0,4

-0,2

Figura 6.5. Soluciones factibles para el ejemplo 6.5.

Uno de los estudios más influyentes en este tipo de análisis (Quandt and Baumol, 1966) propone un modelo de demanda en forma abstracta en donde los coeficientes no presentan el subíndice relativo al modo. Su forma funcional puede ser generalizada así:

Tijm  F0 ” ( Aik Ajk ) k

Fk

” C ” C Ah

h

ijh

h

/ Cijhb ijhm



Bh

(6.17)

donde φ, α y β son parámetros de calibración; el índice h se utiliza para indicar un atributo de coste, por ejemplo, el tiempo de viaje, la tarifa o el tiempo de transbordo. Aik son diferentes atributos asociados a cada zona, i, por ejemplo, la población y el ingreso; Cijhm es, por lo tanto, el valor del atributo de coste h para el modo m entre i y j y Cijhb es el valor del “mejor” atributo h entre estos dos puntos, por ejemplo, la tarifa más baja entre ellos. Esta dependencia del mejor modo para el reparto modal y de la impedancia generalizada, constituye limitaciones a este enfoque, aunque se puede superar utilizando medias

MODELOS

DE

TRANSPORTE



geométricas respecto a los modos en lugar de utilizar el modo mejor; véase, por ejemplo, Crow et al. (1973). Una de las ventajas de la función (6.17) es que permite la modelización de modos de transporte completamente nuevos sin necesidad de re-especificar el modelo. Sin embargo, es necesario discutir la solidez de dichos modelos y si las elasticidades resultantes son lo suficientemente representativas de cada modo individual, ya que se basan en condiciones promedio del mercado de viajes. Se han propuesto numerosas variantes de los modelos de demanda directa utilizando técnicas heurísticas pero su utilización se ha limitado preferentemente al contexto interurbano con pocas aplicaciones a áreas urbanas. Generalmente se considera el logaritmo de los viajes y de las variables explicativas para obtener modelos de demanda directa log-lineal que se pueden estimar utilizando software para modelos lineales generalizados como el GLIM. Los modelos de demanda directa son una propuesta atractiva para ser utilizados, en particular en aquellas áreas en las que las zonas son muy grandes, como, por ejemplo, en los estudios interurbanos. Timberlake (1988) estudió la utilización de este tipo de modelos de demanda directa en países en vías de desarrollo encontrándolos superiores a los enfoques convencionales. Así, en el corredor Karthoum-Wad Medani en Sudán el modelo de demanda directa utilizado proporcionó un mejor ajuste que el modelo gravitacional, dadas las características únicas de tráfico de Karthoum y Port Sudan en comparación con el resto del país. El modelo de demanda directa fue, de hecho, capaz de tener en cuenta estas diferencias mejor que el modelo gravitacional.

EJERCICIOS 6.1. Se ha llevado a cabo una encuesta de elección de modos de transporte en un corredor que conecta cuatro zonas residenciales A, B, C y D con tres áreas de alta concentración de trabajadores U, V y W. El corredor tiene una buena conexión ferroviaria y una red razonable de carreteras. Las tres zonas U, V y W se encuentran localizadas en un área fuertemente congestionada y, por lo tanto, los desplazamientos en tren son muchas veces más rápidos que en coche. Las informaciones recogidas durante la encuesta se sintetizan en la tabla siguiente:



Modelos de reparto modal

En coche

En tren

x1

x2

x3

x4

x1

x2

x3

Proporción en coche

A-U

23

3

120

40

19

10

72

0,82

B-U

20

3

96

40

17

8

64

0,80

C-U

18

3

80

40

14

10

28

0,88

D-U

15

3

68

40

14

12

20

0,95

A-V

26

4

152

60

23

10

104

0,72

B-V

19

4

96

60

18

9

72

0,90

C-V

14

4

60

60

11

9

36

0,76

D-V

12

4

56

60

12

11

28

0,93

A-W

30

5

160

80

25

10

120

0,51

B-W

20

5

100

80

16

8

92

0,56

C-W

15

5

64

80

12

9

36

0,58

D-W

10

5

52

80

8

9

24

0,64

Par O-D

Donde los costes de viaje por pasajero son los siguientes: X1 = tiempo de viaje a bordo en minutos (sistema de transporte principal más otros sistemas alimentadores). X2 = tiempo de acceso (a pie más la espera), en minutos. X3 = coste de viaje directo (carburante o tarifa) en centavos (coste en efectivo = out-of-pocket o coste pagado en el momento del viaje). X4 = es el coste del aparcamiento asociado a un viaje en una dirección, en centavos. a) Calibrar un modelo de reparto modal Logit considerando que el valor del tiempo de viaje es de 8 centavos por minuto y que el valor del tiempo de acceso es el doble. b) Estimar el impacto en el reparto modal sobre cada par O-D producido por el aumento en el precio de la gasolina que provoca una duplicación del coste percibido de viajes en coche (X3). c) Estimar la variación del reparto modal en el caso en el que el sistema ferroviario fuera gratuito.

MODELOS

DE



TRANSPORTE

6.2. Se está desarrollando un estudio interurbano sobre la elección de modo entre coche y tren. Los valores representados en la tabla siguiente son el resultado de una encuesta sobre cinco pares origen-destino desde A hasta E. Elementos de coste por cada modo Coche

O-D

Proporción que elige coche

Tren

x1

x2

x1

x2

A

3,05

9,90

2,50

9,70

0,80

B

4,05

13,10

2,02

14,00

0,51

C

3,25

9,30

2,25

8,60

0,57

D

3,50

11,20

2,75

10,30

0,71

E

2,45

6,10

2,04

4,70

0,63

donde X1 es el tiempo de viaje en horas y X2 es el coste directo (out-of-pocket) en libras esterlinas. Considerando que el coeficiente de valor del tiempo es de 2,00 por hora, calcular el coste generalizado de viaje por modo. a) Utilizando los datos de la tabla, calibrar un modelo logit binario de reparto modal introduciendo también la penalidad específica del modo. b) Se está pensando en introducir un mejor servicio ferroviario capaz de reducir el tiempo de viaje en 12 minutos por trayecto; ¿cuánto puede aumentar la tarifa del modo ferroviario para que en cada par O-D no se pierdan usuarios? c) ¿Cómo debería modelizarse la introducción de un servicio de bus directo entre estas ciudades? 6.3.

Sea el siguiente modelo de distribución/reparto modal:

Vijn  AO B j D j exp(  M ijn ) i i donde:

M ijn 

1 log ¤ exp(  n Cijk ) n k



Modelos de reparto modal

en el que n = 1 indica los individuos con acceso a coche, n = 2 los individuos sin acceso a coche, k = 1 es el modo coche y k = 2 el modo transporte público. Si el número total de viajes entre las zonas i y j es Vij = 1.000, calcular cuánta gente utilizaría el coche y cuánta el transporte público según este modelo. Los valores estimados de los parámetros son: τ1 = 0,10, τ2 = 0,05 y β = 0,04; además, para los viajes entre i y j los costes modales se calcularon y los resultados fueron: Cij1 = 30 y Cij2 = 40. 6.4.

Sea el siguiente modelo de reparto modal:

Pk 

exp(  Cijk )

¤ exp(  C

m ij

)

m

en la que los costes generalizados vienen dados por:

Cijk  ¤ kp xkp p

donde θ son parámetros ponderados de las variables explicativas del modelo (tiempo, coste, etcétera). a) Escriba una expresión para la elasticidad de Pk con respecto a xkp. b) Considérese ahora un problema de elección binaria donde los costes generalizados tienen las siguientes expresiones concretas:

Ccoche  0, 2ttcoche 0,1ccoche 0, 3etcoche Cbus  0, 2ttbus 0,1cbus 0, 3etbus 0, 3 donde tt es el tiempo de viaje a bordo del vehículo (minutos), c es el coste de viaje ($) y et es el tiempo de acceso (andando y de espera, min). Supóngase que se conocen los siguientes datos medios por cada modo:

Modo

Variable tt

c

et

Coche

20

50

0

Bus

30

20

5

Calcular la proporción de personas que eligen el coche si τ = 0,4.

MODELOS

DE



TRANSPORTE

6.5. Sean dos ciudades A y B que distan 800 km y que están servidas por un servicio de ferrocarril de mercancías a través de un terreno montañoso. El tiempo total de viaje en un sentido, tr, es de 20 horas y la tarifa actual, cr, es de 600 $/ton. Se considera además que, como el servicio se utiliza a baja capacidad, tr es constante, independientemente del volumen de tráfico Vr. En una carretera casi paralela opera también un servicio de camiones, competencia del ferrocarril; su velocidad media es de 50 km/h y su tarifa es de 950 $/ton. Está previsto un proyecto de autopista que conecte también ambas ciudades y se espera que muchos de los vehículos pesados de la carretera se pasen a esta nueva infraestructura, constituyendo su parte más importante de tráfico. La función de nivel de servicio estimada de la nueva autopista es la siguiente: tt = 7 + 0,08Vt (horas) donde Vt es el flujo total de camiones por hora. Por otra parte, el ferrocarril ha estimado su correspondiente función de demanda dada por: Vr / Vt = 0,83(tr / tt) –0,8 (cr / ct) –1,6 Se espera que el volumen total transportado entre las dos ciudades Vr + Vt permanezca constante a medio plazo e igual a 200 camiones/hora. a) Estimar el reparto modal actual (es decir, los volúmenes transportados por el ferrocarril y el servicio de camiones). b) Estimar el reparto modal si la autopista estuviera hecha. c) ¿Cuál sería el reparto modal si: – el servicio de ferrocarril redujera sus tarifas hasta 450 $/ton? – a los camiones se les hiciera pagar un peaje de 4 $/ton para la financiación de la autopista? – sucedieran ambas a la vez?

7. Modelos de elección discreta

E

n este capítulo se hace una completa introducción a los métodos de modelización de elecciones discretas (es decir, la elección de alternativa de transporte de los individuos frente a un conjunto finito de posibilidades). En la primera parte se presentan algunas consideraciones de carácter general, así como el marco de referencia teórico en particular (la teoría de la utilidad aleatoria) dentro de la cual se enmarcan estos modelos. Esta primera parte sirve, asimismo, para introducir algunos conceptos terminológicamente básicos, estudiando además la dualidad individuo-modelizador, la cuall es particularmente útil para una mejor comprensión de los postulados teóricos. A continuación se introducen los dos modelos de elección discreta más conocidos: el modelo logit multinomial y el modelo logit jerárquico, los cuales proporcionan al profesional una familia de instrumentos de modelización particularmente potente. Hay que destacar que la hipótesis implícita para estudiar estos dos modelos es que se disponga de datos de preferencias reveladas correspondientes a un corte transversal (cross-section). También serán tratados aquí brevemente otros modelos de elección discreta, como el modelo Probit Multinomial, dado que permite estudiar el tema (aportando ciertas ventajas y algunos inconvenientes específicos) de la modelización con datos-panel, y otros paradigmas que ofrecen una perspectiva alternativa al enfoque clásico de maximización de la utilidad. Indicar asimismo que en el Capítulo 8 se analizarán los problemas de especificación y estimación de estos modelos con datos, ya sea de preferencias reveladas o declaradas, con el detalle suficiente para poder realizar aplicaciones prácticas. Dicho capítulo analiza además algunos temas interesantes como, por ejemplo, el uso de muestras de validación, que casi nunca se trata en libros de este tipo. En el Capítulo 9 se tratará el problema de la agregación desde diferentes puntos de vista, así como la importante cuestión de la actualización



Modelos de elección directa

del modelo y su transferencia (ello va dirigido particularmente a aquéllos interesados en el enfoque de planificación continua en transporte).

7.1.

CONSIDERACIONES GENERALES

Como ya se ha citado en capítulos precedentes, los modelos agregados de demanda (o de primera generación) se basan en relaciones observadas para grupos de individuos o en relaciones promedio a nivel zonal. Los modelos desagregados (o de segunda generación) se basan en elecciones observadas efectuadas por cada uno de los individuos que se desplazan y por ello se considera que este enfoque puede conducir al desarrollo de modelos más realistas. A pesar de los trabajos de investigación de autores como Warner (1962) y Oi y Shuldimer (1962) en que se señalaban las importantes limitaciones de los métodos convencionales, los modelos de primera generación continuaron siendo utilizados hasta principios de los ochenta en la gran mayoría de los proyectos de transporte casi sin sufrir variaciones. Es precisamente a partir de dichos años cuando se comenzaron a considerar los modelos de segunda generación como una seria alternativa en el proceso de modelización (véase Williams, 1981). Los modelos de elección discreta afirman que: La probabilidad de que los individuos elijan una determinada alternativa es función de sus características socioeconómicas y de la relativa atractividad de la alternativa.

Para representar la atractividad de la alternativa se utiliza el concepto de utilidad (éste es un artificio teórico convenientemente definido en forma tautológica como lo que el individuo intenta maximizar). Las alternativas per se no producen utilidad, sino que la utilidad se deriva (Lancaster, 1966) de las características de las alternativas y de las características de los individuos. La utilidad medible u observable se define generalmente como una combinación lineal de variables como: Vcoche = 0,25 – 1,2 IVT – 2,5 ACC – 0,3 C/I + 1,1 NCOCHE

(7.1)

donde cada variable representa un atributo de la alternativa o del viajero, en tanto que los coeficientes representan la influencia relativa de cada atributo, es decir, la contribución que cada variable aporta a la satisfacción total producida por cada alternativa. Por ejemplo, de la ecuación (7.1) se puede obtener que una

MODELOS

DE



TRANSPORTE

variación unitaria del tiempo de acceso (ACC) tendría, aproximadamente, el doble de impacto que una variación unitaria del tiempo de viaje en vehículo (IVT) y un impacto más de siete veces mayor que un cambio unitario en la variable coste/ingreso (C/I). Las variables pueden también representar características del individuo: por ejemplo, en general sería de esperar que un individuo que pertenece a un hogar en el que hay un elevado número de coches (NCOCHE) tenga una probabilidad mayor de elegir la alternativa coche respecto a un individuo que pertenece a una familia en la que sólo hay un vehículo. En fin, la constante específica de la alternativa (0,25) se puede normalmente interpretar como la representación de la influencia neta de todas las características tanto del individuo como de la alternativa de transporte, no observadas o no explícitamente incluidas en dicha función de utilidad. La constante específica puede incluir, por ejemplo, elementos tales como el confort o la fiabilidad, que son variables nada fáciles de medir o de observar. De acuerdo con el modelo, para poder predecir si una alternativa es elegida, el valor de su utilidad se ha de comparar con el valor de las utilidades de las opciones alternativas y transformarse en un valor de probabilidad entre 0 y 1. Para ello, existe una gran variedad de transformaciones matemáticas, cuyas gráficas tienen forma de S y de entre las cuales se destacan las siguientes: Logit: P1 

Probit:

exp(V1 ) exp(V1 ) exp(V2 )

P1  °

d

d

°

V1 V2 x1

d

« ¨¥ x ´ 2 2 R x x ¥ x ´ 2 · º® 1 ® 1 2 ©¦ 1 µ exp ¬ ¦ 2 µ ¸» 2 ( )

2 1 R S S S ©§ 1 ¶ § S 2 ¶ ¸® 1 2 ®­ ª ¹¼ dx2 dx1 2 2PS1S 2 (1 R )

donde la matriz de covarianza de la distribución Normal asociada a este último modelo tiene la forma siguiente:

¥  12  ¤ ¦   § 1 2

 1  2 ´ µ  22 ¶

Los modelos de elección discreta no se pueden calibrar utilizando técnicas clásicas de ajuste de curvas, como, por ejemplo, el método de los Mínimos Cuadrados, porque su variable dependiente Pi es una probabilidad no-observada



Modelos de elección directa

(entre 0 y 1) mientras que las observaciones son las elecciones realizadas por los individuos (que son solamente 0 ó 1); las únicas excepciones al respecto son los modelos para grupos homogéneos de individuos, o cuando el comportamiento de cada individuo se registra en varias ocasiones, porque, de hecho, las frecuencias observadas de elección son también variables comprendidas entre 0 y 1. Spear (1977) ha realizado una conveniente síntesis de algunas propiedades interesantes de estos modelos: 1. Los modelos desagregados de demanda (DM) se basan en teorías de comportamiento individual y no constituyen analogías físicas de ningún tipo. Por ende, en tanto en cuanto intentan explicar dicho comportamiento, presentan una importante ventaja potencial respecto a los modelos convencionales, en el sentido de que es más probable que sean estables (o transferibles) en el tiempo y en el espacio. 2. Los DM se estiman utilizando datos individuales, lo que implica que: • En cuanto se refiere a la utilización de información pueden ser más eficientes que los modelos convencionales; de hecho requieren un número menor de datos ya que la elección de cada individuo puede ser utilizada como una observación. En los modelos agregados, una observación representa el promedio de (a veces) cientos de observaciones individuales. • Asimismo, el utilizar datos individuales hace que se pueda tener en cuenta toda la variabilidad inherente a dichas informaciones. • En principio, los DM pueden ser aplicados a cualquier nivel de agregación aunque este proceso no es nada sencillo, tal y como se verá más adelante. • Existe una menor probabilidad de que los DM se vean afectados por distorsiones debidas a la correlación entre unidades agregadas. Cuando se agrega información puede aparecer un serio problema debido a que el comportamiento individual puede ser ocultado por características no identificadas asociadas a las zonas. Este problema es conocido con el nombre de falacia ecológica. 3. El ejemplo de la figura 7.1 muestra que si se estimara un modelo de generación de viajes utilizando datos zonales (empleando las medias de cada zona), se obtendría que el número de viajes disminuye con el ingreso, mientras que si se usan los datos individuales se vería claramente que el número de viajes aumenta con el ingreso. Dicho fenómeno, que obviamente

MODELOS

DE



TRANSPORTE

en la figura se ha exagerado, puede suceder, por ejemplo, en el caso en que las características de uso del suelo de la zona B favorezcan la realización de viajes andando. 44. Los modelos desagregados son probabilísticos; ello implica que como proporcionan la probabilidad de elegir cada alternativa, sin indicar cuál se selecciona, se deben utilizar conceptos básicos de la teoría de las probabilidades, tales como: • El número esperado de personas que utilizan una cierta alternativa de viaje es igual a la suma, sobre todos los individuos, de la probabilidad de elección de dicha alternativa:

N i  ¤ Pin

Viajes en coche por hogar

n

Hogares en zona A Media zona A

Media Hogares en zona B zona B Modelo agregado

Ingreso

Figura 7.1. Ejemplo de falacia ecológica.

• Es posible modelizar un conjunto de decisiones independientes considerando a cada una como una elección condicionada; en este caso separadamente, las probabilidades resultantes pueden ser multiplicadas para obtener las probabilidades conjuntas, tal como en: P( f,d,m,r) = P( f )P(d / f )P(m / d,f )P(r / m,d,f ) con f = frecuencia; d = destino; m = modo; r = ruta. 5. Las variables explicativas incluidas en el modelo pueden tener coeficientes explícitamente estimados. Contrariamente a lo que sucede en el caso del coste generalizado de los modelos convencionales, en los que la función



Modelos de elección directa

está generalmente limitada y presenta numerosos parámetros fijos, en la función de utilidad es posible, en principio, insertar un número cualquiera de variables explicativas con cualquier tipo de especificación. Todo ello tiene las siguientes implicaciones: • Los DM permiten una representación más flexible de las variables de política consideradas relevantes para el estudio. • Los coeficientes de las variables explicativas tienen una interpretación directa como utilidades marginales (esto es, representan la importancia relativa de cada atributo). En los párrafos siguientes y en los próximos dos capítulos, se examinarán en detalle numerosos aspectos interesantes de los modelos de elección discreta como sus bases teóricas, estructura, especificación, forma funcional y los procesos de estimación y agregación. Para los lectores interesados, citar que existen al menos otros dos libros que tratan exclusivamente estos temas (Ben Akiva y Lerman, 1985; Hensher y Johnson, 1981).

7.2.

MARCO TEÓRICO DE REFERENCIA

La base (marco de referencia o paradigma) teórica más usual para generar los modelos de elección discreta es la teoría de la utilidad aleatoria (Domencich y McFadden, 1975; Williams, 1977), que fundamentalmente afirma que: 1. Los individuos pertenecen a una determinada población homogénea Q, actúan racionalmente y poseen información perfecta, esto es, eligen siempre la alternativa que maximiza su utilidad neta personal (por ello se ha caricaturizado a esta especie como “Homo Economicus”) sujeto a sus pertinentes restricciones legales, sociales, físicas y/o presupuestarias (en términos de tiempo y de dinero). 2. Existe un cierto conjunto A = {A1, … , Aj, … , AN} de alternativas disponibles y un conjunto X de vectores de atributos medibles de los individuos y de las alternativas. Cada individuo dispone de un conjunto x ū X de atributos y, en general, se enfrenta a un conjunto de opciones de elección disponibles A(q) ū A. En lo que sigue se supondrá que el conjunto de elección de los individuos está predeterminado. Esto implica que el efecto del conjunto de las restricciones ya se ha tomado en cuenta y no influye en el proceso de elección

MODELOS

DE



TRANSPORTE

entre las alternativas disponibles. La determinación del conjunto de elección se tratará en el Capítulo 8 simultáneamente con otros temas importantes aún sin solución. 3. Cada alternativa Aj ū A tiene asociada una utilidad Ujq para cada individuo q. El modelizador, que es un observador del sistema, no posee información completa acerca de todos los elementos considerados por el individuo cuando hace una elección; por lo tanto, considera que la utilidad Ujq tiene dos componentes: • una parte sistemática, medible o representativa Vjq que es función de los atributos medibles x; y • una componente aleatoria εjq que representa la idiosincrasia y/o los gustos (preferencias) de cada individuo y que incluye además los errores de medición y observación que pueda cometer el modelizador. El modelizador propone entonces que: Ujq = Vjq + εjq

(7.2)

Esta expresión permite explicar dos posibles “irracionalidades”: (i) que dos individuos con los mismos atributos y frente al mismo conjunto de elección, seleccionen alternativas u opciones diferentes, y (ii) que algunos individuos puedan no elegir la mejor alternativa (desde el punto de vista de los atributos considerados por el modelizador). Para que la descomposición de la ecuación (7.2) sea correcta, es necesario que exista una cierta homogeneidad en la población objeto de estudio. En principio se requiere que todos los individuos dispongan del mismo conjunto de alternativas y estén sujetos a las mismas restricciones (véase Williams y Ortúzar, 1982a), y para que ello realmente suceda puede ser necesario segmentar el mercado. Aunque el término V se haya definido como representativo de las características medibles del individuo, se ha introducido el subíndice q en cuanto que dicho término V es función de atributos x y éstos pueden variar de individuo a individuo. Además y sin pérdida de generalidad, se acepta que los residuos ε son variables aleatorias con media cero y una cierta distribución de probabilidad a especificar.

V jq  ¤ kj X jkq k

(7.3)



Modelos de elección directa

donde los parámetros θ se consideran constantes para todos los individuos (modelo con coeficientes fijos) pero pueden variar de alternativa en alternativa. En el Capítulo 8 se estudian otras formas posibles de la función de utilidad y se discute cómo debería introducirse cada variable en esta función. Es importante enfatizar la existencia de dos puntos de vista en la formulación de este problema: el primero de ellos hace alusión al individuo que, con tranquilidad, sopesa todos los elementos de interés (sin aleatoriedad) y a continuación elige la alternativa más conveniente; el segundo se refiere al modelizador, el cual observando solamente algunos de los antedichos elementos, necesita incluir los residuos ε para explicar lo que de otra manera podría constituir un comportamiento no racional. 4. El individuo q elige la alternativa que le proporciona su máxima utilidad, es decir elige Aj si, y sólo si: Ujq ≥ Uiq, Ai ū A(q)

(7.4)

Vjq – Viq ≥ εiq – εjq

(7.5)

es decir: Como el analista ignora el valor de (εiq – εjq) no le es posible determinar con certeza si la condición (7.5) se verifica. Por lo tanto, sólo puede plantear que la probabilidad de elegir la alternativa Aj viene dada por: Pjq = Prob {εiq ≤ εjq + (Vjq – Viq), Ai ū A(q) }

(7.6)

y como la distribución de los residuos ε es desconocida, no es posible a estas alturas derivar una expresión analítica para el modelo. Sin embargo, sí se sabe que los residuos son variables aleatorias con una cierta distribución del tipo f(ε) = f(ε1, … , εN). Resaltar que sin pérdida de generalidad se puede suponer que los ε tienen media cero, y por lo tanto la distribución de U tiene la misma distribución anterior f(U), pero con diferente media (es decir, V en lugar de cero). Con lo cual, la ecuación (7.6) se puede escribir de forma más precisa así:

Pjq  °

RN

f ( )d( )

(7.7)

donde RN =

εiq ≤ εjq + (Vjq – Viq), Vjq + εjq ≥ 0

Ai ū A(q)

MODELOS

DE



TRANSPORTE

pudiendo obtenerse diferentes formas para los modelos, según la distribución que se elija para los residuos ε. Es posible generar una clase importante de modelos de utilidad aleatoria mediante funciones de utilidad con residuos distribuidos independiente e idénticamente (IID). En este caso f(ε) se puede descomponer así:

f ( )  f ( 1 ,...,  N )  ” g ( n ) n

donde g(εn) representa la función de utilidad asociada a la alternativa An, de manera que la expresión general (7.7) quedaría reducida a: d V j Vi  j ¨ · Pj  ° g ( j ) ©” ° g ( i )d  i ¸ d  j

d ª i x j d ¹

(7.8a)

en la que los límites de integración de ambas integrales se han extendido a –∞ (leve inconsistencia) para así poder resolverlas. Una interpretación geométrica bidimensional de este modelo así como su extensión a casos más generales de correlaciones y distintas varianzas se discute en Ortúzar y Williams (1982). La ecuación (7.8a) también puede ser expresada así: d ¨ · Pj  ° g ( j ) ©” G ( j V j Vi ) ¸ d  j

d ª ix j ¹

(7.8b)

con X

G ( x)  ° g ( x)dx

d

y es interesante citar que se han realizado múltiples esfuerzos para encontrar formas adecuadas de las funciones g que resuelvan el problema planteado en la ecuación (7.8b). También debe destacarse que el requisito de que los residuos sean IID significa que las alternativas deberían ser, de hecho, independientes. Ello no siempre se verifica, pues se da el caso de que alternativas relativas a modos mixtos,, como, por ejemplo, las combinaciones coche-tren, generalmente no lo son.



7.3.

Modelos de elección directa

MODELO LOGIT MULTINOMIAL (MNL)

El MNL es el modelo de elección discreta más sencillo y el más popularmente utilizado; dicho modelo puede ser generado aceptando que los residuos aleatorios de la ecuación (7.7) distribuyen Gumbel IID (Domencich y McFadden, 1975) así:

Piq 

exp(  Viq )

¤

A j A( q )

exp(  V jq )

(7.9)

en la que las funciones de utilidad tienen generalmente la forma lineal en los parámetros (7.3) y además el parámetro β (cuyo valor en la práctica se normaliza a uno porque no puede ser estimado separadamente de los parámetros θ') está ligado a la desviación estándar común de la variable Gumbel mediante la siguiente relación:

2 

2 6 2

(7.10)

En el Capítulo 9 se utilizará la expresión (7.10) para discutir el problema de los errores de previsión cuando se utilizan datos con diferentes niveles de agregación.

7.3.1.

Búsqueda de la mejor especificación

Para decidir qué variables xk ū x (genéricas o específicas para una alternativa en particular) deben ser insertadas en la función de utilidad, se suele efectuar un proceso “paso a paso” (step-wise, parecido al que se usa en las regresiones múltiples) en el que se comienza por una especificación general que sea teóricamente atractiva (Ortúzar, 1982). Después en cada paso del proceso se testean las variaciones posibles para comprobar si la variable analizada añade poder explicativo al modelo. Los métodos para la búsqueda de la mejor especificación se discutirán en el Capítulo 8. Si para todos los individuos q que tienen disponible una alternativa dada Aj se definiese uno de los valores de x como igual a uno, entonces el coeficiente θ correspondiente a esta variable se interpretaría como una constante específica de la alternativa. Aunque se puede especificar una constante para cada

MODELOS

DE



TRANSPORTE

alternativa, dada la forma en la que trabaja el modelo no es posible estimar sus N parámetros individualmente (como se muestra en el ejemplo 7.1). Por este motivo, una se toma como referencia (sin pérdida de generalidad su valor puede ser fijado en cero) de forma que los restantes (N-1) valores obtenidos en el proceso de estimación se interpreten como valores relativos respecto al citado valor de referencia. El resto de las variables x pueden ser de uno de los dos siguientes tipos: • Genéricas, si aparecen en las funciones de utilidad de todas las alternativas y sus coeficientes pueden ser considerados idénticos; o sea, θjk se sustituye por θk. • Específicas, si no es una hipótesis factible que los coeficientes θk sean iguales; un típico ejemplo acontece cuando la k-ésima variable aparece únicamente en Vj es decir, si xjk sólo aparece en Vj. Es importante destacar que el caso más general es aquel que incluye exclusivamente variables específicas. Las variables genéricas, de hecho, imponen una igualdad en los coeficientes y es de mencionar que esta condición puede ser testeada estadísticamente, tal y como se tratará en el Capítulo 8. Ejemplo 7.1: sea el siguiente modelo Logit binario:

P1 

exp(V1 ) 1  exp(V1 ) exp(V2 ) 1 exp(V2 V1 )

donde se considera que las utilidades observadas son funciones lineales de dos variables genéricas x1 y x2 y dos constantes (con coeficientes θ3 y θ4): V1 = θ1x11 + θ2 x12 + θ3 V2 = θ1x21 + θ2 x22 + θ4 Como puede verse en la expresión del modelo, el factor relevante es la diferencia entre ambas utilidades: V2 – V1 = θ1(x21 – x11) + θ2(x22 – x12) + (θ4 – θ3) y de ello se derivan las siguientes conclusiones: • No es posible estimar ambos parámetros θ3 y θ4, sin embargo, sí su diferencia; por esta razón no se pierde generalidad si una de las dos constantes es



Modelos de elección directa

cero, estimando la otra con respecto a ella (esto se verifica obviamente para cualquier número de alternativas). • Si x1j o x2j tuvieran el mismo valor para ambas alternativas (como en el caso de variables que representan atributos individuales como el ingreso, la edad, el sexo o el número de coches en el hogar), el coeficiente genérico afectado no podría ser estimado en tanto en cuanto se multiplicaría siempre por un valor igual a cero. Lo mismo sucede también en el caso de variables relativas al nivel de servicio cuando presentan valores comunes para dos o más alternativas (p. ej., la tarifa de transporte público en un mercado regulado). En ambos casos, tales variables pueden aparecer, como máximo, en todas las alternativas menos en una. El problema planteado por los atributos individuales se puede complicar bastante por el hecho de que no es fácil o no está claro decidir en qué utilidad(es) o en qué alternativa(s) deben ser insertados. Por ejemplo, sea el caso de una variable como Sexo (que adopta el valor cero para hombres y uno para mujeres) dentro de un contexto de elección modal; si dos de las alternativas de transporte fueran coche-conductor y cocheacompañante y si se considerase que los hombres utilizan más el coche para desplazamientos sistemáticos que las mujeres, entonces la variable Sexo no debería ser insertada en sus funciones de utilidad. Sin embargo, para otros modos como el autobús o el metro, persistiría la duda de si insertar o no esa variable. El problema es que se obtienen resultados diferentes en la estimación de coeficientes, según la variable que se inserte en las alternativas modales, y elegir la mejor solución puede convertirse en un problema bastante difícil, aun si el número de alternativas y de atributos es relativamente pequeño, ya que el número de combinaciones posibles es normalmente muy elevado. En el caso en que no se tenga ninguna idea sobre cómo insertar un atributo individual y no existan elementos teóricos para justificar la presencia de una forma u otra, siempre queda el procedimiento de la prueba y el error para intentar resolver el problema.

7.3.2. Algunas propiedades del MNL El modelo MNL satisface el axioma de independencia de las alternativas irrelevantes (IIA), que puede ser enunciado así:

MODELOS

DE



TRANSPORTE

En el caso de cualquier par de alternativas que tengan una probabilidad no nula de ser elegidas, la razón entre ambas no está influenciada por la presencia o ausencia de otras alternativas adicionales presentes en el conjunto de elección (Luce y Suples, 1965).

Pj

 exp ¨ª  (V j Vi ) ·¹ es Pi constante e independiente de las utilidades del resto de las alternativas. Inicialmente esta propiedad fue considerada como una ventaja del modelo, ya que permitía tratar fácilmente el problema de la alternativa nueva (es decir, permitía obtener la previsión de la proporción de mercado de una alternativa no presente en el momento de la calibración del modelo si se conocían sus atributos, sin recalibrar el modelo). Sin embargo, hoy en día dicha propiedad se percibe como una desventaja, ya que no permite al modelo considerar la presencia de correlaciones entre alternativas, lo cual puede conducir a predicciones sesgadas (recuérdese el ejemplo del problema de los autobuses rojos y azules del Capítulo 6). Se volverá sobre este tema en el apartado 7.4. Cuando el número de alternativas es muy elevado, como en el caso de la elección de destino, se puede demostrar (MacFadden, 1978) que se obtienen parámetros insesgados estimando el modelo sólo con una muestra aleatoria del conjunto de elección disponible (p. ej., siete destinos para cada usuario). Los modelos que no presentan dicha propiedad pueden requerir una gran cantidad de tiempo de cálculo para más de 50 alternativas, aunque su proceso de estimación no sea complicado. Desgraciadamente, en un contexto de elección de destino, no es difícil superar esta cifra en sistemas de zonificación de tamaño normal. Si se estima el modelo con datos para una sub-área, o con datos de una muestra sesgada en términos de la cantidad de usuarios que elige cada alternativa en relación a la población, se puede demostrar que si éste tiene un conjunto completo de constantes específicas (N-1, si hay N opciones como ya se demostró) y todos los individuos tienen disponibles todas las alternativas, entonces basta recalcularlas como se indica en (7.11) para el área total obteniéndose un modelo insesgado: En el caso del MNL se tiene que el cociente:

¥q ´ K i'  K i log ¦ i µ § Qi ¶

(7.11)

donde qi es la proporción de mercado de la alternativa Ai en la muestra y Qi es la proporción de mercado en la población. Por tanto todas las constantes deben



Modelos de elección directa

ser corregidas, incluida la que fue considerada de referencia e igualada a cero durante la estimación. En el modelo MNL se pueden derivar ecuaciones bastante simples para las elasticidades directas y cruzadas. Por ejemplo, la elasticidad directa puntual, que es la variación de la probabilidad de elegir Ai respecto a una variación marginal en un atributo Xikq viene dada por:

EPiq , X ikq 

uPiq X ikq . uX ikq Piq

y a partir de aquí se puede deducir fácilmente que:

EPiq , X ikq   ik X ikq (1 Piq )

(7.12)

mientras que las elasticidades cruzadas puntuales vienen dadas por:

EPiq , X jkq   jk X jkq Pjq

(7.13)

y representan la variación en porcentaje de la probabilidad de elegir Ai respecto a una variación marginal del valor del késimo atributo de la alternativa j para el individuo q. Notar que este valor es independiente de la alternativa Ai y por tanto la elasticidad cruzada de cualquier alternativa Ai respecto a los atributos Xjkq de la alternativa Aj son iguales. Este resultado, extraño, se debe también a la propiedad IIA o más precisamente a la necesidad de tener funciones de utilidad IID en la generación del modelo.

7.4. 7.4.1.

MODELO LOGIT JERÁRQUICO (HL) Correlación y estructura del modelo

El modelo MNL estudiado en el párrafo anterior presenta una matriz de covarianza muy simple que, para el caso trinomial es:

¥1 0 0´ ¤   ¦¦ 0 1 0 µµ ¦0 0 1µ § ¶ 2

MODELOS

DE



TRANSPORTE

Esta estructura de matriz de covarianza del MNL puede presentar problemas en los siguientes casos: • Cuando las alternativas no son independientes (es decir, cuando existen grupos de alternativas más similares que otras como, por ejemplo, modos de transporte público versus el coche privado). • Cuando hay variaciones de gusto entre los individuos (es decir, si la percepción de los costes varía con el ingreso pero no se ha medido esta variable) en cuyo caso se necesitan modelos con coeficientes aleatorios en lugar de modelos que proporcionen valores medios como es el caso del MNL. El modelo Probit, que puede ser derivado de una distribución normal multivariada (en lugar de una Gumbel IID) presenta una matriz de covarianza completamente general y permite tratar ambos casos anteriores. Sin embargo, tal y como se verá en el epígrafe 7.5, no es fácil resolver dicho modelo excepto para casos de muy pocas (hasta tres) alternativas (ver Daganzo, 1979). Por otro lado hay ciertos casos en que, aun cuando fuera posible implementar un modelo Probit, su completa generalidad sería un lujo innecesario en cuanto a que puede intuirse cuál podría ser la forma de las funciones de utilidad. Un buen ejemplo son los contextos de elección bidimensional, por ejemplo, la elección de la combinación de destino (D) y modo (M), donde las alternativas están correlacionadas pero se puede aceptar que no existen variaciones de gustos. En estas situaciones las alternativas en cada dimensión se pueden denotar como {D1, …, DD} y {M1, …, MM} de forma que su combinación genera el conjunto de elecciones A, cuyo elemento general DdMm puede representar una alternativa específica destino-modo para llevar a cabo una actividad determinada. En este tipo de contexto es interesante considerar funciones del siguiente tipo (Williams y Ortúzar, 1982a): U(d,m) = Ud + Udm

(7.14)

Donde, por ejemplo, Ud podría corresponder a la porción de utilidad específicamente asociada al destino y Udm al coste (desutilidad) de viaje. Reescribiendo (7.14) de acuerdo a la notación utilizada en los epígrafes anteriores, resulta: U(d,m) = V(d,m) + ε(d,m)



Modelos de elección directa

donde: V(d,m) = Vd + Vdm y: ε(d,m) = εd + εdm Se puede demostrar que si los residuos ε son separadamente IID, bajo ciertas condiciones se obtiene el modelo logit jerárquico o anidado (HL) (Williams, 1977; Daly y Zachary, 1978) cuya forma es:

P ( d , m) 

[ ¤ exp [ V

] ] ¤

exp  Vd Vd* exp(Vdm )

d'

d'

* d'

V

exp(Vdm ' ) m'

(7.15)

con

¥1´ Vd*  ¦ µ log ¤ exp(Vdm ' ) m' §¶ Además se puede comprobar fácilmente que si β = λ (lo cual sucede cuando εd = 0) el modelo HL colapsa al MNL uniparamétrico. Para entenderlo, es conveniente antes que nada, escribir las expresiones de la utilidad para el primer destino en el caso simple de un modelo binario: U(1,1) = V1 + V11 + ε1 + ε11 U(1,2) = V1 + V12 + ε1 + ε12 Como se puede observar, la fuente de correlación es el residuo ε1 que está presente en ambas funciones de utilidad U(1,1) y U(1,2). Por lo tanto cuando εd = 0 tal correlación desaparece y el HL es indistinguible del MNL. Finalmente, se puede probar que para que el modelo sea internamente consistente es necesario que se cumpla la siguiente condición (Williams, 1977): β≤λ

(7.16)

Se ha demostrado que modelos que no satisfacen este requerimiento producen elasticidades de dimensiones y/o de signos incorrectos (Williams y Senior, 1977).

MODELOS

DE



TRANSPORTE

7.4.2. El modelo HL en la práctica Como herramienta práctica de modelización, el HL se puede exponer para su mejor utilización, de la siguiente forma (Ortúzar, 1980b; Sobel, 1980): 1. Su estructura se caracteriza por agrupar todos los subconjuntos de alternativas correlacionadas (o más similares) en jerarquías o nidos. Cada nido, a su vez, se representa por una alternativa compuesta frente a las demás que están disponibles para los individuos (en el ejemplo de la figura 7.2 se representa un HL con dos nidos).

NI

AS(q) = A(q) – AI(q) + NI

AI(q)

Figura 7.2. Logit jerárquico (HL) con dos nidos.

2. El HL se puede estimar secuencialmente utilizando el amplio software disponible para el MNL (aunque en algunos casos su utilización pueda proporcionar serios problemas). En el caso de la figura 7.2 se debe estimar primero el MNL de las alternativas A I(q) pertenecientes al nido inferior NI con la precaución de omitir todas aquellas variables (z) que tengan el mismo valor para ese conjunto de opciones (ya que si no, debido a que el MNL funciona a base de diferencias, no se podrían estimar sus parámetros). Estas variables, de hecho, han de ser introducidas posteriormente en el nido superior pues afectan a la elección entre la alternativa compuesta NI y el resto de las alternativas que pertenecen a AS (q). 3. La introducción del nido inferior en la jerarquía superior se realiza a través de la alternativa compuesta, a la cual se asocia una utilidad representativa de todo el nido. Así, la utilidad tiene dos componentes: la primera de



Modelos de elección directa

ellas considera como variable el valor máximo esperado de la utilidad o máxima utilidad esperada (EMU, Expected Maximun Utility) entre alternativas del nido, y la segunda considera el vector z de los atributos comunes a todos los miembros del nido. El EMU tiene la siguiente expresión:

EMU  log ¤ exp(W j ) j

(7.17)

donde Wj es la utilidad de la alternativa Aj en el nido, con la excepción de las variables z comunes a todas las alternativas en el nido AI(q): hay que resaltar que esta ecuación tiene exactamente la misma forma que Vd* en la expresión (7.15) si λ = 1. Por lo tanto, la utilidad compuesta del nido es: VI = ϕEMU + αz

(7.18)

donde ϕ y α son parámetros a estimar. 4. Después de realizar lo indicado en los puntos anteriores, debe procederse a estimar un modelo MNL para el nido superior, el cual comprende todas las alternativas compuestas que representan a las jerarquías inferiores más las alternativas que no estuvieran anidadas en dicho nido superior. 5. Finalmente la probabilidad de que el individuo q elija la alternativa Aj ū AI (q) puede calcularse como el producto de la probabilidad marginal de elegir la alternativa compuesta NI (en el nido más alto) y de la probabilidad condicionada de elegir la alternativa Aj en la jerarquía inferior, dado que q ha elegido la alternativa compuesta. Ejemplo 7.2: considérese el siguiente caso de elección trinomial: coche (C), bus (B) y metro (M) en el que el analista considera que las dos últimas alternativas están correlacionadas. En este caso, por lo tanto, se puede proceder a conformar un nido inferior relativo al transporte público (PT) que es factible modelizar mediante un simple modelo Logit binario de la siguiente forma:

P (M / PT ) 

exp(WM ) exp(WM ) exp(WB )

y P(B / PT) = 1 – P(M / PT), donde las utilidades W contienen sólo aquellos elementos que no son comunes a ambos modos (es decir, si ambos modos tienen la misma tarifa, entonces el coste de viaje no se debería incluir).

MODELOS

DE



TRANSPORTE

Para separar la alternativa coche de la alternativa compuesta relativa al transporte público se requiere en el nido superior otro modelo Logit binario:

P ( C) 

exp(VC ) exp(VC ) exp(VPT )

y P(PT) = 1 – P(C), donde VC incluye todos los atributos de la alternativa coche y, en consecuencia, tiene exactamente la misma forma que en el MNL. La utilidad asociada al transporte público viene dada por:

VPT   EMU ¤  k ' zk ' k'

donde

EMU  log ; exp(WB ) exp(WM ) = y la suma respecto a k’ incorpora todos los elementos comunes z que no fueron incluidos en la estimación del modelo Logit binario del nido inferior. Finalmente la modelización de las probabilidades de elección de cada alternativa se puede expresar de la siguiente manera:

PC  P (C) PB  P (B/PT ) P (PT)  P (B/PT)(1 PC) PM  P (M/PT)P (PT)=(1-P (B/PT))(1-PC) 6. Con esta nueva notación, la condición de diagnóstico interna (7.16) se expresa así: 0 1, el incremento de la utilidad de una alternativa del nido no sólo aumentaría su probabilidad de elección sino que también aumentaría la probabilidad de todas las restantes alternativas del nido.



Modelos de elección directa

Por fin, ϕ = 1 es equivalente a decir que β = λ y entonces el modelo HL sería equivalente matemáticamente al MNL. En estos casos (es decir, cuando ϕ ≈ 1) es más eficiente re-estimar el modelo como un MNL puesto que tiene un número inferior de parámetros. Es obvio que los modelos HL pueden no limitarse a dos niveles jerárquicos; en los casos con más de un nivel de agregación como en la figura 7.3 debe cumplirse la condición siguiente en cada rama: 0 < ϕ1 ≤ ϕ2 ≤ … ≤ ϕS ≤ 1

(7.20)

donde ϕ1 corresponde al parámetro del EMU más interno y ϕS al parámetro del nivel superior. Obsérvese que la condición se aplica a nidos en serie y no en paralelo.

ϕ5 ϕ1 ϕ3 ϕ4

ϕ2

1

2

3

4

5

6

7

8 9 10

Figura 7.3. Logit jerárquico (HL) con varios nidos.

• Por ejemplo, si los ϕ son como los que se muestran en la figura 7.3, se deberían cumplir las siguientes relaciones:

0  1 b 1 0  2 b 3 b 5 b 1 0  4 b 5 b 1 7. Limitaciones del HL: • Tal y como sucede en el MNL, el HL no es un modelo con coeficientes variables y, por lo tanto, no puede tratar problemas de variaciones en los gustos ni heterocedasticidad.

MODELOS

DE

TRANSPORTE



• Brinda la posibilidad de tratar solamente tantas interdependencias entre alternativas como nidos se hayan especificado en la estructura; además, las alternativas de un nido no pueden estar correlacionadas con las de otros nidos (este efecto de correlación cruzada, que puede ser importante testear en un contexto de elección modal entre modos mixtos, puede tratarse con formas más generales, como las de los modelos Probit). • La búsqueda de la mejor estructura HL en ocasiones requiere el análisis tentativo de múltiples estructuras jerárquicas, en cuanto que es fácil ver a priori que el número de agrupaciones posibles aumenta geométricamente con el número de alternativas (Sobel, 1980). Aunque la existencia de información a priori y la experiencia puede ayudar en esta tarea al modelizador, la búsqueda puede ser mucho más larga que con el sencillo MNL. La calibración secuencial del modelo es simple y posible, dada la disponibilidad de software para el MNL, y además produce estimadores consistentes (de hecho al aumentar la cantidad de datos, dichas estimaciones convergen hacia los valores verdaderos de los parámetros). Pese a ello, el enfoque presenta varios problemas potenciales; por ejemplo, si no se dispone de datos suficientes para estimar modelos del nivel inferior, las estimaciones pueden ser ineficientes, tanto porque se omite información en el nivel inferior como porque los errores que se producen pueden transmitirse a los niveles superiores. En esta línea se ha demostrado empíricamente que algunas estructuras interesantes no pueden ser testeadas o aún peor, que el método puede llevar a rechazar estructuras demostradamente mejores (Hensher, 1986; Ortúzar et al., 1987).

7.4.3.

Estimación simultánea del HL

En general la estimación simultánea del HL es más compleja, y requiere un mayor gasto de tiempo (en términos de CPU) con respecto al método más simple de estimación secuencial tratado anteriormente. Hasta la mitad de los años 80 para poder efectuar una estimación simultánea, era necesario escribir software ad hoc (Small y Brownstone, 1982; Hensher, 1986), pero en los últimos diez años se han producido numerosos paquetes que permiten resolver este problema de modo flexible y práctico (p. ej., LIMDEP, HIELOW); actualmente los algoritmos de cálculo son tan eficientes que no existen demasiadas razones para utilizar el método de estimación secuencial, a menos que se esté obligado a hacerlo por algún motivo especial. El primer método de estimación simul-



Modelos de elección directa

tánea y probablemente aún el más conocido es el propuesto por Daly (1987) e implementado en el software ALOGIT (Daly, 1992). Considérese nuevamente el caso simple de sólo dos niveles jerárquicos utilizando una versión simplificada de la notación de Daly (1987); suponiendo que el índice i represente una alternativa o nido del nivel jerárquico superior, y j una alternativa del nivel inferior. En este caso, la función de utilidad puede reescribirse así:

U (i, j )  U i U j / i U (i, j )  V (i, j )  (i, j ) V (i, j )  Vi V j / i

 (i, j )   i  j / i Entonces, la probabilidad de elegir el nido i, y dentro de éste la alternativa j, viene dada por:

Pij  Pi – Pj / i

(7.21)

con:  V j /i

Pj / i 

ei

eiVk / i

¤

Ak A I ( q )

Pi 

e Vi

¤

e

V j

A j A S ( q )

donde Vj/i es la utilidad representativa de la opción j dentro del nido i que incluye solamente aquellos atributos que presentan variación dentro del nido. Los parámetros β y λi representan los factores de escala del nivel superior y del nido i respectivamente. Para las alternativas del nido superior se tiene que:

 Vi   X i i ln

¤

eiVk / i

Ak A1 ( q )

donde Xi es la parte de la utilidad asociada a los atributos comunes de las alternativas dentro del nido. Además el término que multiplica ϕi representa, como

MODELOS

DE



TRANSPORTE

se ha visto anteriormente, la máxima utilidad esperada (EMU o logsum). El parámetro ϕi es igual a la relación entre β y λi, y por lo tanto ha de satisfacer la condición de ser mayor que cero y menor o igual a uno (Williams, 1977). Como también se ha expuesto, en el caso límite en que ϕi = 1 el modelo HL colapsa al MNL. Utilizando esta notación, Daly (1987) consiguió por primera vez estimar el modelo HL de forma simultánea, maximizando una sola función de utilidad y utilizando todos los datos conjuntamente, evitando así los problemas mencionados en el párrafo anterior. Para poder estimar el modelo es necesario fijar (normalizar) uno de los parámetros de escala. Por ejemplo, si a β se le da el valor uno, entonces es necesario multiplicar las utilidades dentro del nido por los correspondientes valores de λi, que pasan a ser iguales a 1 / ϕi. Este requerimiento está detrás de una controversia aparecida en la literatura (Koppelman y Wen, 1998), ya que si se desea estimar modelos HL con variables genéricas y no se tiene especial cuidado, el modelo puede resultar de la clase “no-estandarizada” (es decir, no satisface la condición de que añadiendo una constante a cada utilidad, las probabilidades de elección no varían). Para evitar este problema en el caso del modelo HL más simple, en ALOGIT (en el ejemplo de la estructura HL con tres alternativas de la figura 7.2), se debe especificar la alternativa elemental del nido más alto (es decir el coche), como perteneciente a un nido de alternativa individual (Bradley y Daly, 1997), tal y como se muestra también en la figura 7.4. Éste es el mismo tratamiento que se sigue para estimar modelos mixtos de preferencias reveladas y declaradas tal y como se estudiará en el Capítulo 8. Para una discusión más amplia sobre éste y otros aspectos del HL, véase Carrasco y Ortúzar (2002).

PT ϕ

Coche

Bus

ϕ

Metro

Coche

ϕ

Bus

Figura 7.4. Especificación ALOGIT de una estructura jerárquica con variables genéricas.

Metro



7.5.

Modelos de elección directa

OTROS MODELOS Y PARADIGMAS DE ELECCIÓN

7.5.1.

Modelo probit Multinomial

Tal y como se ha indicado en el epígrafe 7.4.1, el modelo Probit se caracteriza porque los residuos aleatorios ε de (7.2) se distribuyen según una Normal multivariada con media cero y matriz de covarianza arbitraria; esto significa que las varianzas pueden ser diferentes y los términos del error pueden estar correlacionados de cualquier manera. Esta estructura tan general crea, obviamente, el problema de no permitir escribir el modelo de modo tan simple como se hizo para el MNL (salvo en el caso binario) y, por lo tanto, para resolverlo numéricamente es necesario realizar diferentes aproximaciones. 7.5.1.1.

El Modelo Probit Binario

En el caso de que sólo haya dos alternativas, las expresiones (7.2) de la utilidad se pueden escribir así: U1 (θ,Z) = V1 (θ,Z) + ε1 (θ,Z) U2 (θ,Z) = V2 (θ,Z) + ε2 (θ,Z) 0,Σ) con: donde ε (θ, Z) es la distribución bivariada N(0,

¥  12 ¤¦ §  1  2

 1  2 ´ µ  22 ¶

en que ρ es el coeficiente de correlación entre U1 y U2. De la ecuación (7.6), se obtiene que la probabilidad de elegir la alternativa 1 es: P1 (θ,Z) = Prob{ε2 – ε1 ≤ V1 – V2} pero, siendo la distribución Normal cerrada respecto a la suma y a la resta (en tanto que la Gumbel es cerrada respecto a la maximización), se obtiene que (ε2 – ε1) distribuye Normal univariada N(o,σε), donde:

 2   12  22 2  1  2 Dividiendo (ε2 – ε1) por σε se obtiene la Normal estándar N(0,1); por lo tanto se puede escribir la probabilidad de elección de un modelo probit binario, de forma más concisa como:

MODELOS

DE



TRANSPORTE

P1 (θ,Z) = Φ [(V1 – V2) / σε]

(7.22)

en que Φ[x] es la distribución Normal acumulada estándar que está tabulada. Este modelo sencillo es completamente general para el caso de elecciones binarias. Cabe señalar que la ecuación (7.22) no es directamente estimable, ya que los parámetros θ presentes en las utilidades representativas V no pueden ser estimados separadamente de las desviaciones estándar σε . De hecho, tal y como sucede en los modelos MNL y HL, es necesario normalizar antes de obtener una estimación de los parámetros del modelo; en el caso del modelo probit, la normalización consiste en fijar al menos uno de los elementos de σε en un valor constante. 7.5.1.2.

Modelo probit Multinomial (MNP) y variaciones de gusto

Tal como se indicó en los epígrafes 7.3 y 7.4, una dificultad potencialmente importante de los modelos de utilidad aleatoria con coeficientes constantes (como es el caso de los modelos MNL y HL), es su incapacidad de tratar el problema de la variación en los gustos de los individuos. Antes de ilustrar cómo se puede tratar este asunto con el modelo MNP, se explicará mediante un ejemplo qué se entiende por variación de gustos. Ejemplo 7.3: sea un modelo de elección de modo con dos variables explicativas, coste (c) y tiempo (t) y la siguiente función de utilidad:

U  t  c  Supóngase, sin embargo, que la percepción de los costes varía en función del ingreso (I); por ejemplo, si los individuos más pobres son más sensibles a cambios en el coste, la función de utilidad verdadera sería:

U  t c / I  Comparando las dos expresiones es fácil ver que el modelo será correcto sólo si β es tratada como una variable aleatoria con distribución exactamente igual a la de ϕ / I en la población. En este caso, se dice que el modelo contiene variaciones aleatorias de los gustos. Tal y como señala Horowitz (1981a), el problema de las variaciones aleatorias de gustos es en general bastante serio, y puede ser considerado como



Modelos de elección directa

un caso especial del bien conocido error de especificación (la omisión de una variable explicativa relevante), discutido ya en el Capítulo 2. Sea de nuevo la función de utilidad (7.3) que es lineal en los parámetros, como se trató en el epígrafe 7.2. El caso más general considera que el conjunto de parámetros θ es un vector aleatorio distribuido entre la población; en este caso los residuos se pueden modelizar como parámetros específicos de la alternativa y las variables ε en la ecuación (7.2) se pueden omitir sin pérdida de generalidad; consecuentemente, es posible reescribir la ecuación más concisamente como: Uj  ¤ k x jk k

(7.23)

que representa la especificación lineal más general posible ya que permite variaciones de gustos entre la población. Si el vector θ distribuye como una Normal multivariada, el modelo de elección resultante (7.23) es de la forma del MNP (véase Daganzo, 1979). Diferentes procedimientos para estimar el modelo Probit han sido discutidos por Sheffi et al. (1982) y Langdon (1984); se volverá a este tema en el Capítulo 8. 7.5.1.3.

Modelos para Panel de Datos

Ya en el Capítulo 1 se trataron brevemente las ventajas e inconvenientes que pueden surgir cuando se utilizan paneles de datos (datos correspondientes a un grupo de personas, entrevistadas a lo largo del tiempo: ahora, dentro de un año, de dos, etc.), particularmente respecto al método más popular de recolección de datos, que es el de preferencias reveladas bajo el enfoque de corte transversal. A comienzos de la década de los 80, el interés por estos temas surgió de forma coincidente en la modelización del transporte y en el campo más general de la econometría; en el primer caso habría preocupación por la influencia intrusiva del hábito en el comportamiento de elección, en términos de asimetrías en la respuesta a cambios como en el caso del fenómeno de la histéresis, el cual será estudiado en el epígrafe 7.5.4. El mismo problema fue considerado como dependencia estadual (state dependence) en la jerga econométrica y se propusieron modelos para el análisis de elecciones discretas realizadas a lo largo del tiempo (Heckman, 1981). Daganzo y Sheffi (1979) demostraron que los modelos de elección discreta con datos de series temporales y dependencia entre estados, pueden ser aproxi-

MODELOS

DE



TRANSPORTE

mados mediante modelos de series temporales sin dependencia estadual. Su método considera la utilización de una transformación matemática que permite la aplicación de un modelo MNP para datos de panel. Dado su especial interés, a continuación se presenta la derivación matemática para el caso simple de elección binaria relativa a dos períodos temporales solamente. Supóngase que los individuos pueden elegir entre J opciones en dos períodos n = 1, 2. La utilidad de una alternativa, Ujn, se puede expresar como una función lineal de un vector de atributos, X jn, del individuo y de la alternativa en el período considerado:

U jn = n X jn

(7.24)

Para estimar los momentos de θn (su media y su varianza) es necesario basarse en las elecciones observadas. Hay que señalar que si sólo hubiera un período (caso de sección transversal) y θn distribuyera según una Normal, se llegaría al clásico problema de estimación de un MNP. Supóngase ahora la hipótesis de que los vectores θ distribuyen de forma conjunta según una Normal multivariada pero independiente de período en período (de otra forma se produciría un problema muy complejo denominado correlación serial; véase Heckman, 1981). Con el objetivo de permitir la dependencia entre estados distintos, se aceptará que la utilidad de la alternativa Aj en el período n también depende de la elección (cn–1) efectuada en el período anterior:

U jn = n X jn U j ( n -1)

(7.25)

donde ϕ es un parámetro a estimar. Si ϕ es muy grande, la elección efectuada en el período anterior probablemente se repetirá; por otra parte, como θ1 y θ2 son independientes, si ϕ fuera igual a cero, sería como si las decisiones fueran tomadas por personas diferentes. El parámetro ϕ tiende a capturar la inercia del sistema. La expresión (7.25) permite también considerar el hecho de que los individuos que presenten un alto diferencial de utilidad en el primer período serán más reacios a cambiar (ceteris paribus) con respecto a los individuos que, incluso eligiendo la misma opción, presentan un diferencial de utilidad inferior. Considérese ahora el caso de una elección binaria en la que, en ambos períodos, se elige la alternativa A1. La probabilidad de que esto suceda viene dada por:



Modelos de elección directa

P ( A11 , A12 )  Prob [U11 r U 21 y U12 r U 22 ] y reemplazando los valores de la ecuación (7.25) se obtiene: P(A11, A12) = Prob{θ1X11 ≥ θ1X21 y θ2 X12 + ϕU11 ≥ θ2 X22 + ϕU21} o análogamente: P(A11, A12) = Prob{0 ≥ θ1 (X21 – X11) y 0 ≥ θ2 (X22 – X12) + ϕ(U21 – U11)}

(7.26)

Esta expresión sugiere las siguientes transformaciones para las utilidades en (7.25): U11 = 0, U12 = 0 U21 = θ1 (X 21 – X11) U22 = θ2 (X 22 – X12) + ϕ(U21 – U11) = θ2 (X 22 – X12) + ϕU21

(7.27)

Si se indica, además, con V2n al término θn (X2n – X1n), las utilidades pueden ser reescritas sencillamente así:

U 1n  0 U 2 n  V2 n V2 ( n 1)

(7.28)

Si ϕ es un valor fijo, la ecuación (7.28) es una función lineal en θ; en cambio, si ϕ no es conocido, se tiene una especificación no lineal en la que ϕ es solamente otro parámetro a estimar que, en general, no produce graves problemas al software disponible en la actualidad (Daganzo, 1979). Generalizando este procedimiento, definiendo la utilidad de la alternativa elegida en ambos períodos como cero, se puede formular un modelo trinomial equivalente (o N + 1 opcional, en el caso binario con N períodos), con utilidades W dadas por (Daganzo y Sheffi, 1979): W0 = 0 W1 = θ1 (X NC1 – XC1) W2 = θ2 (X NC2 – XC2) + ϕW1

(7.29)

donde NC indica la alternativa no elegida y C la elegida. Utilizando esta especificación, la Prob{W0 ≥ W1 y W0 ≥ W2} de elegir la alternativa nula en ambos períodos viene dada por:

MODELOS

DE



TRANSPORTE

Prob{0 ≥ θ1 (X NC1 – XC1) y 0 ≥ θ2 (X NC2 – XC2) + ϕW1} que es esencialmente la expresión (7.26) pero en forma general. Por lo tanto se puede estimar un modelo MNP evaluando la probabilidad de que cada individuo en la muestra elija la alternativa nula. Johnson y Hensher (1982) aplicaron este procedimiento utilizando datos australianos encontrando que las elasticidades derivadas de un modelo con datos de panel eran significativamente distintas, y menores que las correspondientes a modelos equivalentes calibrados con datos de sección transversal. 7.5.1.4.

Comparación de parámetros de Probit independientes y Logit

Cuando se estima un modelo probit (y esto es fácil de ver en el caso binario), se obtienen los siguientes parámetros:

 iP 

i con  2   12  22 2  1  2 

A su vez, de la ecuación (7.10) se sabe que cuando se estima un MNL se obtienen los siguientes parámetros:

 iL  i con  

P  6

y por tanto:

 iL 

i P  6

Entonces, para poder comparar los dos modelos, es necesario estimar un modelo probit con matriz de covarianza parecida a la del MNL (es decir, un probit con errores idéntica e independientemente distribuidos). En este caso σε2 = σ2 + σ2 y por tanto     2 lo cual implica que  iP   i /  2 . Entonces para comparar los dos grupos de parámetros es necesario multiplicar el βiP (del probit) por un factor que lo iguale a  iL   i /  6 (MNL); este factor es obviamente, el que se presenta a continuación:

K

sP 2 s 6



P 3

(7.30)



Modelos de elección directa

Por lo tanto, para comparar los coeficientes estimados en un MNL con los estimados para un probit idéntico e independiente, se deben escalar los segundos por el factor  / 3 . Este método ha sido utilizado con gran éxito para testear la validez de un código experimental propuesto para estimar modelos probit multinomiales (véase Munizaga et al., 2000).

7.5.2. Modelo Logit Mixto o de Componentes de Error El Logit Mixto es probablemente el modelo del nuevo milenio. Pese a que su forma actual es debida a dos investigaciones paralelas (Ben Akiva y Bolduc, 1996; McFadden y Train, 2000), la formulación del modelo original como modelo hedónico o logit con parámetros aleatorios tiene un origen bastante anterior (véase Cardell y Reddy, 1977). La función de utilidad de la opción Aj para el individuo q en la situación t viene dada por: Ujqt = θq Xjqt + εjqt

(7.31)

donde Xjqt es, como siempre, un vector de variables observadas, mientras θq es un vector de coeficientes desconocidos que, en este caso, varían aleatoriamente según los gustos del individuo. Por último, εjqt es un término de error aleatorio que distribuye Gumbel IID, independientemente de θq y de Xjqt. Observar que esta especificación no es completamente general porque los parámetros θq no dependen de t (ya que en general debería esperarse que las preferencias individuales no cambiasen de situación a situación), aunque puede generalizarse si se desea. La especificación presentada en (7.31) es idéntica a la del MNL, salvo que los coeficientes θq no son fijos sino que varían en la población (la especificación sería la de un probit si θq y εjqt distribuyesen Normal); la varianza en θq induce correlación en la utilidad sobre alternativas y situaciones. Ahora, el vector de coeficientes θq para cada individuo se puede expresar como la suma de su media poblacional θ* y desviaciones individuales ηq que representan los gustos individuales con respecto a los gustos promedio de la población: Ujqt = θ* X jqt + ηq X jqt + ε jqt

(7.32)

La parte no-observada de la utilidad (ηq X jqt + ε jqt), está correlacionada sobre las alternativas y situaciones debido a la influencia de ηq. Es posible lograr patrones muy generales de correlación, variaciones en los gustos y heterocedasticidad, mediante una adecuada especificación de parámetros y variables.

MODELOS

DE



TRANSPORTE

De hecho McFadden y Train (2000), afirman que cualquier modelo de utilidad aleatoria puede ser aproximado de forma arbitrariamente cercana por la especificación de este modelo. Por ejemplo, Train (1998) sostiene que el modelo HL se puede obtener definiendo variables dummy que adopten el valor uno para las alternativas que pertenecen al nido y cero para las otras. Si los coeficientes de estas variables específicas para el nido varían de forma aleatoria, se induce correlación en la componente no-observada de las utilidades de las alternativas del nido, pero no se introduce correlación entre nidos. Es interesante resaltar, sin embargo, que esta estructura no reproduce el modelo HL sino su versión heteroscedástica, como puede comprobarse sencillamente si se trabaja con la estructura del ejemplo 7.2 (Munizaga y Álvarez, 2000). Si los valores de θq son conocidos, el modelo colapsa al MNL ya que los εjqt distribuyen IID Gumbel. Si se acepta que los gustos varían en la población con función de densidad f(θ / τ*), donde τ* representa los parámetros de la distribución (es decir, la media y la desviación estándar de los gustos de la población), la probabilidad de elección del modelo logit mixto viene dada por la integral de la probabilidad de elección MNL (para un valor dado del parámetro θ) ponderada por la función densidad de los parámetros θ; esto es: Q

Pqjt ( T* )  °

e qjt

¤

X qjt

Qqjt X qjt

e

f (θ / τ*)dθ

(7.33)

Aj A ( q )

El método de estimación de este modelo, realmente general y potente, se tratará en el epígrafe 8.6.

7.5.3.

Elección por eliminación y satisfacción

En el Capítulo 8 se estudiará el problema de especificación y forma funcional dando un énfasis especial a la forma lineal en los parámetros que ha acompañado a la gran mayoría de las aplicaciones desagregadas de demanda (normalmente de estructura logit multinominal). Debido a las crecientes críticas dirigidas a las formas lineales en los parámetros, a principios de los 80 surgió un gran interés en la especificación y estimación de formulaciones no lineales para diversos diseños. Los comentarios sobre las características funcionales de estas formas se mezclaron con declaraciones acerca de modelos alternativos en el proceso de decisión considerado como fundamento de los modelos de elección.



Modelos de elección directa

Un punto de vista usual era que como las formas lineales en los parámetros están asociadas a un proceso de toma de decisiones compensatorio (es decir, un cambio en uno o más de los atributos puede ser compensado por cambios en los otros), los modelos no podían ser especificados de forma apropiada para procesos de toma de decisiones caracterizados por la percepción de discontinuidades, que tienen más propiamente una naturaleza no compensatoria (es decir, donde los aspectos buenos de una alternativa quizás no permiten compensar los aspectos malos, ya que éstos tienen un rango mayor de importancia dentro del procedimiento de selección, y la alternativa puede ser eliminada antes en el proceso de búsqueda; véase la discusión en Golob y Richardson, 1981). Ejemplo 7.4: sea un conjunto de individuos, que tienen que hacer una elección determinada y que poseen una serie de objetivos G y una serie de restricciones B. Entonces, el problema de múltiples criterios generales puede describirse formalmente así:

Max (opcion) F ( Z11 )! F1 ( Z N1 )] ´ [ 1 " Max (opcion) F ( Z1k )! Fk ( Z Nk )] ´ [ k

(7.34)

" Max (opcion) F ( Z1K )! Fk ( Z NK )] ´ [ K sujeto al vector de restricciones: f(Z) ≤ B

(7.35)

en el cual Fk(Zjk) es el valor de la función de dichos criterios asociado con el atributo Zjk de la alternativa Aj. Por ejemplo, quizás se esté interesado en encontrar una alternativa de viaje dentro de un conjunto de elección de tamaño N, que minimice el tiempo de viaje y los costes, que maximice el confort y la seguridad, etc. Además, estos atributos que están asociados a una cierta alternativa pueden ser requeridos para satisfacer restricciones absolutas como (7.35). Si se encuentra una alternativa única que satisface a la vez estos criterios de optimalidad (es decir, optimiza las funciones K en la expresión (7.34) y las restricciones (7.35), entonces se obtiene una solución óptima no ambigua. Sin embargo y por lo general, siempre habrá conflictos entre objetivos (es decir, alternativas superiores en algunos aspectos e inferiores en otros).

MODELOS

DE

TRANSPORTE



Antes de poder construir un modelo de elección basado en este problema de múltiples criterios, pueden plantearse una serie de cuestiones importantes tales como: • ¿Qué estrategias pueden adoptarse para solucionar el problema? • ¿Existen diferencias en las estrategias adoptadas por diferentes individuos en una población dada? • ¿Cómo se pueden representar formalmente estas estrategias? • ¿De qué forma debería llevarse a cabo la agrupación sobre la población para producir un modelo que pueda estimarse con datos individuales? Este último aspecto es de especial importancia porque los modelos de elección se derivan por agregación de las acciones de individuos dentro de la población, y mientras cualquiera o todos ellos pueden implicarse en un proceso de decisión no compensatorio, puede o no, ser apropiada la caracterización dentro de estos términos de la suma total de estas decisiones y del modelo de elección resultante (véase la discusión en Williams y Ortúzar, 1982a). Aquí se trata solamente el primero de estos aspectos, principalmente de cómo un individuo, que se enfrenta a un contexto hipotético de decisión, puede resolver el problema de múltiples criterios. Existe, por supuesto, una amplia literatura dispersa en variados campos del conocimiento sobre la aplicación de la teoría de decisión a problemas de este tipo. Se mencionarán tres métodos, comenzando con la aproximación más conocida, más sencilla y más ampliamente utilizada, tal es la estrategia de equilibrio que forma la base de los modelos de decisión compensatoria. 7.5.3.1.

Regla compensatoria

Aquí la alternativa preferida se elige mediante la optimización de una función objetivo única G = G(F1, F2, … , FK). Si las funciones Fk son simplemente los atributos Zk, o transformaciones lineales de ellos, entonces G puede escribirse como:

¥ ´ G  G ¦ ¤ k Z1k ,! ,¤ k Z kj ,! , ¤ k Z Nk µ k k § k ¶

(7.36)

y se trata del problema de equilibrio (trade-off ) lineal convencional. Los parámetros θ se determinan a partir de preferencias declaradas o reveladas del individuo. Una de las características de este enfoque es el tratamiento simétrico de las funciones objetivo.



Modelos de elección directa

7.5.3.2. Reglas no compensatorias Una aproximación general alternativa es la de tratar las funciones objetivo (7.29) de forma asimétrica mediante la clasificación o conversión de algunas o todas las restricciones a través de la introducción de ciertas normas o umbrales. Es decir, se puede requerir que cualquier alternativa aceptable tenga, por ejemplo, un coste de viaje asociado que no supere un cierto valor particular; formalmente, esta restricción impone que:

Z1k ,! , Z kj ,! , Z Nk b Z k

(7.37)

en la cual Zk es un valor máximo (o mínimo cuando se invierta la desigualdad) satisfactorio para el atributo correspondiente. La introducción de umbrales restringe el rango de las alternativas factibles consideradas por los individuos en su proceso de decisiones. Elección por eliminación. En este caso se supone que los individuos poseen, por un lado, un ranking (o clasificación) de atributos (p. ej., el coste es más importante que el tiempo de espera, y éste, más importante que el tiempo andando, etc.) y, por otro, valores o umbrales mínimos aceptables (7.37) para cada uno. Por ejemplo, este proceso decisional puede resolver el problema de múltiples criterios de la forma siguiente: primero se considera el atributo que esté mejor clasificado en el ranking y a continuación se eliminan todas las alternativas que no satisfacen la restricción del umbral (aunque puedan sobresalir en cuanto a atributos que estén peor ranqueados); el proceso se repite hasta que solamente quede una alternativa, o un grupo de ellas, que satisfaga todas las restricciones del umbral y entre ellas se elige una de forma compensatoria (véase Tverski, 1972). Comportamiento de satisfacción. Sin embargo, existen muchas formas de organizar la estrategia de búsqueda anterior; por ejemplo, quizás el individuo utilice un proceso cíclico complejo de forma que los umbrales se modifiquen secuencialmente hasta encontrar una alternativa única. Igualmente puede funcionar un mecanismo de satisfacción en el que el individuo podría estar dispuesto a parar la búsqueda en cualquier momento según una regla o norma pre-especificada, en la cual tal vez no se consideren algunos o todos los atributos o alternativas. De hecho, cuando se aplica la posibilidad de estar satisfecho (véase Eilon, 1972) a decisiones de viajes que

MODELOS

DE

TRANSPORTE



implican localización, el modelo de decisión está muy enlazado con la adquisición de información en el proceso de búsqueda. Tal y como observaron Young y Richardson (1980), una búsqueda puede caracterizarse por un proceso de eliminación basado en atributos o basado en alternativas. En el primer caso, se seleccionan los atributos uno tras otro y se procesan las alternativas, las cuales se aceptan o se rechazan según los valores de los atributos; en el segundo, se consideran las alternativas una tras otra y se examina el grupo de atributos. En cualquier momento del proceso se eliminan las alternativas que no satisfagan las reglas u otras restricciones. Para un estudio más detallado de las estrategias de decisión, se recomienda Foerster (1979) y Williams y Ortúzar (1982a).

7.5.4.

Hábito e histéresis

A finales de los años 70 había un gran interés por la relevancia y por el papel que jugaban las costumbres o hábitos en el comportamiento de la elección de viaje, especialmente en los casos de relocalización (es decir, emigración) u otros fenómenos que proporcionaban un punto de vista renovado a las posibilidades de elección del individuo. La evidencia empírica (Blase, 1979) sugería que el efecto del hábito puede tener importancia práctica y, por tanto, el problema debe ser tratado seriamente. La existencia de hábitos (o lo que puede considerarse como la inercia que acompaña al proceso de decisión del individuo), es posiblemente el más insidioso de los aspectos del comportamiento que representan divergencias con las suposiciones tradicionales que subyacen en los modelos de elección, dado que aparece directamente en el contexto de respuesta. Para examinar los efectos e implicaciones del hábito es pertinente retornar a las suposiciones básicas del enfoque convencional de datos de corte transversal. La figura 7.5a reproduce la curva en forma de S relativa a la elección binaria. Para una diferencia de utilidad dada (V2 – V1) existe una única probabilidad de elección; bajo las condiciones de cambio (V 2' – V 1' ), la probabilidad correspondería a la observada para la diferencia de utilidad en el año base, es decir, la respuesta se determina a partir de la dispersión de datos en el corte transversal (un instante de tiempo). Esta suposición implica, entre otros aspectos, que la respuesta a una política o cambio particular será exactamente la inversa si desaparece el estímulo;



Modelos de elección directa

la relación estímulo-respuesta es simétrica respecto al signo y al tamaño del estímulo. Pero si existe hábito, entonces afectaría a aquellos miembros de la población que están actualmente asociados a una alternativa que experimenta un estímulo frente a la ventaja relativa de otra alternativa. Esto introduce una asimetría básica en el comportamiento de respuesta y da lugar al fenómeno de histéresis (Goodwin, 1977), tal y como se puede ver en la figura 7.5b. En este caso el estado actual de la población, identificado en términos del reparto de mercado de cada alternativa, depende no solamente de los valores de utilidad V2 y V1 sino también de cómo estas variables obtuvieron su actual valor. Formalmente, el estado del sistema P puede expresarse como una integral de línea en el espacio de los componentes de utilidad V; el valor de la integral es independiente del camino de integración cuando el hábito no está presente, pero depende de dicho camino de integración cuando lo está (véase la discusión en Williams y Ortúzar, 1982a).

1,0

1,0

0,8

0,8

0,6

0,6

0,4

0,4

0,2

0,2

0 -60

-40

-20

(a)

0

20

40

60 V2 – V1

0 -60 (b)

-40

-20

0

20

40

60 V2 – V1

Figura 7.5. Influencia del hábito en los modelos de corte transversal: (a) curva de respuesta logit, (b) curva de histéresis para el efecto de hábito en individuos.

EJERCICIOS 7.1. Interesa estudiar el comportamiento de un grupo de viajeros con respecto a dos alternativas de transporte A y B, cuyos tiempos de viaje son respectivamente ta y tb. Cada viajero experimenta las siguientes utilidades según cada una de estas dos alternativas:

MODELOS

DE



TRANSPORTE

U a   ta  I U b   tb donde α y β son parámetros conocidos e I es el ingreso personal de cada viajero. Aunque no hay datos fiables sobre la renta de cada viajero, se sabe que la variable I tiene la siguiente distribución en la población: f(I) 0,5 × 10–4

5.000

25.000

I

En el caso en que sea α = –0,5 y β = 2,10 –4, se desea encontrar la probabilidad de elección de la alternativa A para cada viajero como función del valor (tb – ta); grafique esta función en ejes apropiados. 7.2. Sea un modelo logit binario para coche y autobús, donde las funciones de utilidades representativas siguientes se han estimado a partir de una muestra de 750 individuos pertenecientes a un sector particular de un área urbana: Vc = 3,5 – 0,25tc – 0,42ec – 0,1cc Vb = –0,25tb – 0,42e b – 0,1cb donde t representa el tiempo a bordo de los vehículos (en minutos), e es el tiempo de acceso (en minutos) y c es el coste de viaje ($). Se conocen además los siguientes datos:

Modo

Variable t

e

c

Coche

25

5

140

Bus

40

8

50



Modelos de elección directa

y también se dispone de información del número de individuos que elige cada alternativa en el sector y en toda el área:

Alternativa

Nº de individuos que eligen la alternativa i Muestra

Población

Coche

283

17.100

Bus

467

68.900

a) Indicar qué corrección sería necesario aplicar al modelo y reescribir su versión final. b) Calcular la variación porcentual de la probabilidad de elección de coche en el caso en que las tarifas del autobús aumenten un 25%. c) Al revés, averiguar qué sucede si los costes del coche disminuyen un 100%. 7.3. Calcular la probabilidad de elección de coche, autobús, taxi compartido y metro, en el caso de un modelo logit jerárquico con la siguiente estructura: Transporte colectivo Coche

Taxi compartido

Bus

Metro

con las siguientes funciones de utilidad que se muestran a continuación: a) Nido superior Vcoche = –0,03tcoche – 0,02ccoche + 1,25 Vtaxcom = –0,03ttaxcom – 0,02ctaxcom – 0,20 Vttecol = 0,60 EMU b) Nido relativo al transporte colectivo Vbus = –0,04tbus – 0,03c bus + 0,5 VM = –0,04tM – 0,03cM

MODELOS

DE



TRANSPORTE

y para los siguientes valores medios de las variables: Modo

7.4.

Tiempo (t)

Coste/Ingreso (c)

Coche

4,5

23,0

Taxi compartido

5,5

15,0

Bus

7,5

5,5

Metro

5,5

3,6

Recordando que el modelo probit binario tiene la expresión:

[

P1  & V1 V2 / s12 s 22 2 rs1 s 2

]

Utilizar esta formulación para escribir la probabilidad de elección de la alternativa 1 para el siguiente modelo binario: Ui = θXi + εi donde los ε distribuyen IID según una Normal estándar, para los siguientes casos: a) Si el valor de θ es fijo e igual a 3. b) Si θ distribuye Normal N(3,1) y es independiente de ε.

8. Especificación y estimación de modelos de elección discreta 8.1.

E

INTRODUCCIÓN

n el capítulo anterior se hizo una introducción general a la modelización de la elección discreta, a las diferentes formas de los modelos y al marco teórico en el que se enmarcan las decisiones individuales. Este capítulo está dedicado fundamentalmente a dos temas: cómo especificar totalmente un modelo desagregado o discreto (MD) y cómo estimar dicho modelo una vez que se ha especificado adecuadamente. La búsqueda de la mejor especificación de un modelo implica seleccionar la estructura del mismo (logit multinomial, logit jerárquico, probit, etc.), las variables explicativas que se van a considerar, la forma en que aparecen en la función de utilidad (lineal, no lineal) y la identificación del conjunto de elecciones del individuo (alternativas disponibles). En términos generales, los objetivos del estudio de especificación incluyen el realismo, la economía, la consistencia teórica y la sensibilidad hacia variables de intervención política. En otras palabras, se trata de encontrar un modelo realista que no necesite un número excesivo de datos o de recursos informáticos, que no produzca resultados patológicos y que sea apropiado para el contexto de decisión para el cual se desee utilizar. A los modelos agregados, como los que se han visto en los Capítulos 5 y 6, a menudo se les critica por ser insensibles a variables de política, ya sea porque a veces no incluyen variables relevantes, o porque importantes componentes del modelo se especifican sin sensibilidad hacia ciertas estrategias de intervención (p. ej., el problema de generación inelástica de viaje). La mayoría de las características de la especificación de un modelo son susceptibles de análisis y experimentación (Leamer, 1978), pero son también estrechamente dependientes del contexto del estudio y de la disponibilidad de datos. La primera parte de este capítulo se dedica a la identificación del conjunto de alternativas disponibles para los individuos, es decir a la determinación del



Especificación y estimación de modelos de elección discreta

conjunto de elección. Este problema es fundamental, ya que la estimación de un MD se lleva a cabo por lo general mediante observaciones de las elecciones realizadas por los individuos entre un conjunto de alternativas. Estas alternativas deben ser las consideradas consciente o inconscientemente por el individuo. La omisión de opciones sin importancia aparente, por intentar reducir el coste, puede provocar la aparición de sesgos. Por ejemplo, en la gran mayoría de estudios de tipo agregado, sólo se consideran elecciones binarias entre vehículo privado y transporte público, y como consecuencia el problema multimodal no se trata con rigor. En el mejor de los casos, las opciones alternativas de transporte público son consideradas en la fase de asignación, utilizando técnicas todo-onada o asignación multirruta de viajes a los arcos de las redes submodales. De igual forma, la inclusión de alternativas que son ignoradas por ciertos grupos de la población (p. ej., caminatas de más de 500 metros, para individuos de renta alta), también podría sesgar la estimación de modelos. El capítulo contempla posteriormente el resto de los elementos de la especificación de modelos, en particular su forma funcional y su estructura. De nuevo los criterios de economía, realismo, consistencia teórica y adecuación al contexto de decisión, juegan un papel importante para complementar la experiencia e intuición del modelizador durante las tareas de especificación. Un elemento adicional, que se ignora a menudo, es la disponibilidad de software especializado. Una de las razones por las cuales se ha popularizado el modelo logit multinomial lineal (MNL), es su sencilla estimación mediante software normalmente disponible. Éste no es el caso de estructuras o formas funcionales más generales, las cuales presentan enormes dificultades de estimación (Daganzo, 1979; Liem y Gaudry, 1987). La disponibilidad progresiva de software para seleccionar y estimar estos modelos solventará este problema. Sin embargo un aspecto sobre el cual se volverá más adelante, es que, a pesar de que se pueden estimar los parámetros de muchos modelos a partir de un conjunto de datos dado, estos modelos (y sus elasticidades implícitas) van a ser diferentes y a menudo no es posible discriminar entre ellos, al menos con datos de sección temporal (cross-section). La especificación final dependerá en gran parte de la experiencia y los conocimientos teóricos del modelizador, así como de factores específicos del contexto de aplicación, tales como: tiempo y recursos disponibles para la modelización (el MNL es considerablemente más sencillo y barato que sus competidores), grado de correlación entre las alternativas y nivel necesario de precisión en la prognosis. Hay que tener en cuenta que la utilización de un modelo inadecuado

MODELOS

DE

TRANSPORTE



(p. ej., utilizar el MNL cuando no se cumplen las hipótesis necesarias para su uso) puede ocasionar graves errores (Williams y Ortúzar, 1982a). El epígrafe 8.4 se concentra en la estimación estadística de los modelos de elección discreta utilizando datos procedentes de muestras aleatorias y basadas en la elección, e incluye métodos para validar los modelos y confrontar sus diferentes estructuras. En el epígrafe 8.5 se discuten los métodos para estimar el MNP así como en el 8.6 se aborda la estimación del modelo logit mixto o de componentes de error. El capítulo concluye con algunas consideraciones relevantes para la especificación de los modelos con datos de preferencias declaradas.

8.2.

DETERMINACIÓN DEL CONJUNTO DE ELECCIONES

Dado un conjunto típico de datos de preferencias reveladas de corte transversal, uno de los primeros problemas que un analista tiene que solucionar es decidir qué alternativas están disponibles para cada individuo de la muestra. Éste es uno de los aspectos más difíciles de resolver, ya que refleja el dilema que el modelizador tiene para llegar a un justo equilibrio entre la relevancia y la complejidad de un modelo, aunque usualmente la selección final depende de la disponibilidad de datos.

8.2.1.

Tamaño del conjunto de elecciones

Es extremadamente difícil determinar el conjunto de elecciones de un individuo a menos que se pregunte directamente; por lo tanto, el problema está estrechamente relacionado con el dilema de si es preferible utilizar datos aportados por los individuos o medidos directamente, según se trató en el Capítulo 3. Aunque el número de alternativas es normalmente pequeño, lo que hace que el problema de modelizar la elección modal sea menos grave, en otras situaciones, como sucede en el caso de la elección de destino, la identificación de las opciones que componen el conjunto de elecciones es un tema crucial. Esto se debe no sólo a que el número total de alternativas es habitualmente muy grande, como se verá a continuación, sino también a que se debe enfrentar el problema adicional de cómo medir/representar la atractividad de cada opción. Algunas formas de tratar con un conjunto elevado de opciones son: 1. Tener en cuenta solamente subconjuntos de las opciones que son efectivamente elegidas en la muestra (en un marco de muestreo como el utilizado por Ben Akiva, 1977).



Especificación y estimación de modelos de elección discreta

2. Utilizar el método “de fuerza bruta”, que supone que todos los individuos tienen todas las alternativas disponibles, dejando que el modelo asigne una probabilidad de elección muy baja o igual a cero a las opciones menos realistas. Ambos enfoques tienen desventajas. Por ejemplo, en el primer caso, se pueden dejar de lado alternativas realistas que no se han elegido debido a la forma en que se tomó la muestra o a la técnica de muestreo utilizada. En el segundo caso, la inclusión de demasiadas alternativas puede afectar a la capacidad discriminatoria del modelo, ya que un modelo que considere opciones no realistas puede ser incapaz de describir adecuadamente las elecciones entre aquellas que son realistas (Ruijgrok, 1979). Otros métodos que se pueden aplicar para resolver este problema son: 1. Agregar las opciones o alternativas, como en el caso de un modelo de elección de destino basado en datos zonales; 2. Suponer continuidad en las alternativas, como muestran Ben Akiva y Watanatada (1980).

8.2.2. Formación del conjunto de elección Otro problema en este tema es que el individuo cuyas decisiones se están modelizando puede elegir perfectamente entre un conjunto relativamente limitado de opciones. Si el analista modelizase elecciones que el individuo ignora en la realidad, resultaría que algunas alternativas recibirían una probabilidad positiva aunque, en la práctica, no tuvieran posibilidad alguna de ser elegidas. Más aún, considérese el caso de modelizar el comportamiento de un conjunto de individuos que difieren mucho en cuanto al conocimiento de sus destinos potenciales. Como consecuencia, los coeficientes del modelo, que intentan describir las relaciones entre las utilidades predichas y las elecciones observadas, pueden estar influidos tanto por variaciones en el conjunto de elecciones entre los individuos (que no están contempladas en su totalidad en el modelo), como por variaciones en las preferencias reales (que sí están contempladas). Debido a que los cambios en la naturaleza de los destinos pueden afectar tanto al conjunto de elecciones como a las preferencias en grados diferentes, esta confusión puede causar estragos en la prognosis o en la posibilidad de transferir el modelo en el tiempo y en el espacio. Para poder tratar este problema es posible: 1. Utilizar reglas de generación deterministas o del conjunto de elecciones heurísticas que permitan excluir ciertas alternativas (p. ej., el autobús no es-

MODELOS

DE

TRANSPORTE



tá disponible si la parada más próxima se encuentra más allá de una distancia determinada) y que puedan validarse empleando datos de la muestra. 2. Obtener información sobre el conjunto de elecciones directamente de la muestra, preguntando simplemente a los entrevistados sobre su percepción de las alternativas disponibles (incluso es mejor preguntar sobre las opciones no disponibles y las razones de ello). 3. Utilizar conjuntos aleatorios de elecciones, en los que las probabilidades de elección sean el resultado de un proceso en dos fases: en primer lugar, un proceso de generación del conjunto de opciones, en el cual se defina una función de distribución de probabilidades sobre todos los conjuntos de elecciones y, en segundo lugar, en un conjunto de elecciones específico, definir una probabilidad de elección para cada alternativa (ver la discusión de este tema en Lerman, 1984 y Richardson, 1982). Tal y como se vio en el Capítulo 7, a menudo las reglas no-compensatorias como satisfacción, lexicografía y eliminación por aspectos, pueden resultar más apropiadas que el comportamiento compensatorio. En efecto, muchos procesos de elección, especialmente si el número de alternativas físicamente disponibles es muy grande, pueden ser visualizados como una mezcla de reglas compensatorias y no-compensatorias. En este contexto, Morikawa (1996) ha desarrollado un modelo híbrido que aplica reglas de decisión compensatorias y no-compensatorias con un número relativamente amplio de alternativas, en un modelo cuyo proceso de decisión se subdivide en una fase en la que se forma el conjunto de elección y en otra en la que se efectúa la elección. La formación del conjunto de elección se modeliza a través de un modelo de restricciones aleatorias que tiene una naturaleza no-compensatoria en las restricciones (es decir, si una restricción no se satisface, la alternativa se excluye del conjunto de elección aunque las demás restricciones se hayan satisfecho), mientras que la fase de elección se describe a través de un modelo Logit multinomial. Este enfoque proporcionó buenos resultados cuando se aplicó a la elección del destino para viajes de vacaciones con hasta 18 alternativas.

8.3.

ESPECIFICACIÓN Y FORMA FUNCIONAL

La búsqueda de la mejor especificación del modelo está relacionada con su forma funcional. Aunque se pueda argumentar que la función lineal (7.3) es probablemente adecuada en muchos contextos, hay otros casos, como el de la



Especificación y estimación de modelos de elección discreta

elección de destino, en los que las funciones no lineales son más apropiadas (Foerster, 1981; Daly, 1982a). Los problemas en este último caso son que, en general, no hay garantía de que las rutinas de estimación de los parámetros vayan a converger a valores únicos, y que no haya software disponible directamente. Otro tópico de especificación relacionado con la forma funcional es la manera en que las variables explicativas deberían entrar en la función de utilidad, incluso si ésta es lineal en los parámetros. En la literatura existente se han propuesto tres métodos para tratar el problema de la forma funcional: 1. La utilización de análisis conjunto en experimentos reales o de laboratorio para determinar la forma más apropiada de la función de utilidad (Lerman y Louviere, 1978). En el apartado 8.5 se trata brevemente este aspecto. 2. La utilización de transformaciones estadísticas, tales como el método de Box-Cox, permitiendo hasta un cierto límite que los datos “decidan” (Gaudry y Wills, 1978). 3. La utilización constructiva de la teoría econométrica para derivar la forma funcional (Train y McFadden, 1978; Jara-Díaz y Farah, 1987); éste es posiblemente el enfoque más atractivo, ya que la forma final puede relacionarse con medidas de evaluación de beneficios del usuario. Como se verá más adelante, es importante destacar que, en general, las formas no lineales normalmente implican compromisos entre variables diferentes de las asociadas a conceptos como el valor del tiempo (Bruzelius, 1979) y, como es fácil imaginar, también las elasticidades del modelo y su poder explicativo pueden variar sensiblemente con la forma funcional utilizada.

8.3.1.

Forma funcional y sus transformaciones

Expresiones lineales en los parámetros de la función de utilidad, como la ecuación (7.3), normalmente contienen una mezcla de variables cuantitativas y cualitativas (para estas últimas, p. ej., sexo, edad o nivel de ingreso, usualmente se utilizan variables dummy) y los problemas son cómo incluir ambas y dónde incluir a las segundas, tal y como se ha discutido anteriormente. En otras palabras, sería más apropiado escribir la ecuación (7.3) del siguiente modo:

V jq  ¤ kj f kj ( xkjq ) k

(8.1)

MODELOS

DE



TRANSPORTE

que si bien aún es lineal en los parámetros, hace referencia explícita a que la forma funcional de las variables x es, hasta cierto punto, arbitraria. La práctica habitual consiste en insertar las variables originales sin elaborar (es decir, insertando el tiempo en lugar de 1/tiempo o del logaritmo del tiempo) y esto no tendría consecuencias, a menos que la respuesta del modelo fuera muy sensible a su forma funcional. Si no se tienen razones teóricas para apostar por una forma funcional determinada, parece interesante dejar que los datos indiquen cuál podría ser una forma adecuada. En la modelización de transportes, se ha adaptado con éxito una clase de transformaciones utilizadas ampliamente en econometría (Gaudry y Wills, 1978; Liem y Gaudry, 1987). A continuación se describen dos ejemplos, siendo el segundo una generalización del primero: 8.3.1.1.

Transformada básica de Box-Cox

Dada una variable positiva x, considérese la siguiente transformación x(τ):

«( x T 1) / T , si T x 0 x (T )  ¬ si T  0 ­ log x ,

(8.2)

que es continua para todos los posibles valores de τ. Aplicando esta transformación es posible reescribir la ecuación (8.1) como: (Tk )

V jq  ¤ Q kj xkjq

(8.3)

k

y es fácil ver que si τ1 = τ2 = … τk = 1, la ecuación (8.3) se reduce a la típica forma lineal (7.3); mientras que si todos los τk = 0 , se obtiene la forma logarítmico-lineal, también ampliamente utilizada. Evidentemente, estas dos formas tradicionales son sólo casos especiales de (8.3). 8.3.1.2.

Transformada de Box-Turkey

La transformación básica (8.2) se define únicamente para x > 0. Una forma más general, para variables que puedan tener valores negativos o nulos, es la siguiente:  ®« ¨( x  ) 1·¹ /  , si  x 0 ( x  )( )  ¬ ª si   0 ­®log( x  ),

(8.4)



Especificación y estimación de modelos de elección discreta

donde μ es sólo una constante de traslación, elegida para asegurar que (x + μ) > 0 en todas las observaciones. Para que el modelo sea consistente con la teoría microeconómica los valores de μ tienen que satisfacer ciertas condiciones. En particular, es instructivo derivar qué restricciones existen en el caso de atributos como el tiempo de viaje (que produce desutilidad) o el número de coches en el hogar (que, en cambio, hace aumentar la probabilidad de elegir el coche) para asegurar que las utilidades marginales sean decrecientes, tal y como requiere la teoría. Queda propuesta pues esta demostración como un pequeño desafío para el lector interesado. Puede demostrarse que si se especifica un MNL con la forma funcional (8.4) y se obliga a que todos los valores de τ sean iguales, sus elasticidades vienen dadas por:

E P ,x  (D ji Pj ) xkiQ k ( xki M )T 1 j

ki

(8.5)

en que δij es igual a 1 si j = i y 0 en otro caso. Aunque de (8.5), es obvio que las elasticidades dependen de los valores de τ y μ, no es tan claro cuán grande puede ser este efecto ya que los valores de θ también varían. Utilizando datos para Sidney en 1971, Hensher y Johnson (1981) obtuvieron diferencias del 25% entre los valores de la elasticidad del tiempo de viaje/demanda de ferrocarril, para la combinación óptima de (τ, μ) y el caso lineal; con la especificación incorrecta (τ = 1) se obtenían valores más altos. En el Capítulo 13 se tratarán las consecuencias de la utilización de modelos Box-Cox en la derivación de valores subjetivos del tiempo (Gaudry et al., 1989).

8.3.2.

Consideraciones teóricas y forma funcional

Aunque se haya dejado claro que en cualquier estudio la escasez de datos y la limitación de recursos a menudo desempeñan un papel vital, es importante considerar la influencia que tiene la teoría en la construcción de una función de demanda. A continuación se mostrará cómo el uso constructivo de la teoría económica ayuda a solucionar el importante problema de cómo incorporar una variable clave como el ingreso en la función de utilidad. Por cuestión de sencillez se aceptará que los parámetros tienen forma lineal y no se entrará en el detalle respecto de la estructura del modelo, pero el análisis se puede generalizar. El enfoque convencional para comprender los papeles del ingreso, tiempo y coste de viaje, en el marco de elección discreta, se basa en el trabajo de Train y McFadden (1978); ellos establecieron los fundamentos microeconómicos de

MODELOS

DE



TRANSPORTE

esta teoría, a partir del caso de individuos que eligen entre el ocio (L) y consumo de bienes (G). El compromiso aparece una vez que se formula la relación entre G y el ingreso (I): ellos suponen que I depende del número de horas trabajadas (W). De esta manera, el aumento de W permite aumentar G disminuyendo L. Este problema se puede expresar formalmente como: MaxU(G, L) Sujeto a:

G ci  wW º » Ai  A W L ti  T ¼

(8.6)

donde U es la función de utilidad individual, w es la tasa salarial real (la cantidad de dinero que se le paga al individuo a la hora), ci y ti son respectivamente el coste y el tiempo gastados en el viaje, A es el conjunto de elección y T es un período de referencia; las incógnitas son G, L y W. Si en la ecuación (8.6), U se expresa de una forma bastante general, como la Cobb-Douglas, el encontrar su máximo respecto a Ai ū A es equivalente a encontrar el máximo de (–ci / w – ti) entre otras posibilidades. Éste es el origen de la variable denominada coste/tasa salarial, ampliamente utilizada en los modelos de elección discreta, la cual ha degenerado en coste/ingreso en ciertas aplicaciones. La posibilidad de variar las horas trabajadas para conseguir el nivel de renta deseado tiene un papel clave en la derivación anterior. Como W se determina de forma endógena y w viene dado de forma exógena, el ingreso pasa a ser endógeno. Esta formulación supone que el coste del viaje es despreciable en relación con el ingreso, es decir, no hay efecto renta. Sin embargo, para muchos individuos (especialmente en los países menos desarrollados) tanto el ingreso como las horas trabajadas son fijos y por tanto sí puede existir efecto renta. En estos casos se puede demostrar que el máximo de U depende del valor de (–ci / g – ti) entre otras posibilidades (Jara-Díaz y Farah, 1987), donde g es una tasa de gasto definida en general por: g = I / (T – W)

(8.7)

La presencia de una variable de ingreso como ésta, que refleja el potencial de compra en la función de utilidad, indica que la utilidad marginal del ingreso varía con éste, es decir, el modelo permite un efecto renta. Además, es interesante mencionar que diversos tests empíricos han demostrado que esta



Especificación y estimación de modelos de elección discreta

nueva especificación supera a la especificación convencional coste/tasa salarial, incluso para individuos sin efecto renta (Jara-Díaz y Ortúzar, 1989).

8.3.3.

No linealidades intrínsecas: la elección de destino

Considérese el modelo gravitacional simplemente acotado (5.14)-(5.16), que se vio en el Capítulo 5 de forma desagregada, suponiendo que cada individuo de la zona i efectúa uno de los viajes Oi originados en dicha zona. En este caso, la probabilidad de que una persona elija viajar a la zona j es simplemente:

Pj 

Tij Oij



B j Fij

¤B

k

f ik

(8.8)

k

Si ahora se define:

Vk  log( Bk f ik )  log Bk log f ik

(8.9)

se puede comprobar que el modelo es equivalente al modelo logit multinomial (7.9). De esta forma, el modelo gravitacional convencional con restricción a orígenes puede representarse por un MNL desagregado sin pérdida de generalidad (Daly, 1982a). Obsérvese que la expresión (8.9) no impone restricciones a la especificación de la función de separación espacial f ij. Como se vio en el Capítulo 5, la función que probablemente más se utiliza en la práctica es la exponencial negativa de cij (coste generalizado de viaje entre las zonas i y j). Cuando esta forma se sustituye en la expresión (8.9) se obtiene:

Vk  log Bk  cij

(8.10)

que es lineal en el parámetro β. El problema de la no linealidad se debe a la presencia de Bk , que puede contener variables de forma diferente, las cuales describen no la calidad sino el número de elecciones elementales dentro de k, siendo típicas de casos tales como la elección de destino, cuando se requiere agregación de alternativas (Daly, 1982a).

8.4.

ESTIMACIÓN ESTADÍSTICA

En este apartado se consideran los métodos para la estimación de modelos discretos (MD), junto con las estadísticas de bondad de ajuste utilizadas durante

MODELOS

DE

TRANSPORTE



esta tarea. Los métodos de estimación de modelos deben adaptarse al marco de muestreo utilizado para generar las observaciones. Esto es necesario para mejorar la eficiencia de la estimación y evitar sesgos.

8.4.1.

Estimación de modelos a partir de muestras aleatorias

Para estimar los coeficientes θk en la expresión (7.3), se utiliza normalmente el método de máxima verosimilitud (ML: Maximum Likelihood). Este método se basa en la idea de que aunque se puede obtener la muestra de varias poblaciones, una muestra concreta tiene una probabilidad más alta de haber sido obtenida de una cierta población que el resto. Los estimadores del método ML son el conjunto de parámetros que generan más frecuentemente la muestra observada. Para ilustrar esta idea, considérese una muestra de n observaciones de una determinada variable Z = {Z1, … Zn}, obtenida de una población caracterizada mediante un parámetro θ (media, varianza, etc.). Al ser Z una variable aleatoria, tiene asociada una función de densidad f(Z/θ) que depende de los valores de θ. Por tanto, siendo los valores de la muestra independientes, se puede escribir la función de densidad conjunta como:

f ( Z1 , Z 2 ,L Z n /  )  f ( Z1 /  ) f ( Z 2 /  )L f ( Z n /  ) La interpretación estadística más corriente de esta función es con Z como variables y θ fijo. Invirtiendo el proceso, la ecuación anterior puede interpretarse como una función de verosimilitud L(θ). Si se maximiza con respecto a θ, el resultado se denomina estimador de máxima verosimilitud porque corresponde al valor del parámetro que tiene la probabilidad mayor de haber generado la muestra observada. Esta idea puede extenderse al caso de varios parámetros (p. ej., en una regresión lineal múltiple puede demostrarse que los coeficientes de mínimos cuadrados son los estimadores de máxima verosimilitud). Supóngase una muestra de Q individuos para los cuales se observa su elección (0 ó 1) y los valores de xjkq para cada alternativa disponible, por ejemplo: el individuo 1 selecciona la alternativa 2 el individuo 2 selecciona la alternativa 3 el individuo 3 selecciona la alternativa 2 el individuo 4 selecciona la alternativa 1, etcétera.



Especificación y estimación de modelos de elección discreta

como las observaciones son independientes, la función de verosimilitud viene dada por el producto de las probabilidades de que cada individuo elija la opción que realmente seleccionó:

L( )  P21 P32 P23 P14 L Definiendo la siguiente variable dummy ficticia:

«1 si q elige A j g jq  ¬ ­0 en otro caso

(8.11)

la expresión anterior puede escribirse de forma más general como: Q

L( )  ”

” P

g jq

jq

(8.12)

q 1 A j A ( q )

Para maximizar esta función se procede como es habitual, tomando derivadas parciales respecto a θ e igualando a cero. Como en otros casos, se maximiza la función l(θ) que es el logaritmo natural de L(θ), más manejable y que conduce al mismo óptimo. La función que se intenta maximizar es, por tanto (Ortúzar, 1982): Q

l ( )  log L( )  ¤

¤

g jq log Pjq

(8.13)

q 1 A j A ( q )

Al maximizar l(θ) se obtiene un conjunto de parámetros estimados θ* que distribuyen asintóticamente N (θ, S2), donde:

s

2



(

E

1 u 2 l Q uQ 2

)

También la función LR = –2l(θ) distribuye asintóticamente χ2 con Q grados de libertad (ver Ben Akiva y Lerman, 1985). Esto indica que incluso aunque θ* pueda estar sesgado en muestras pequeñas, este sesgo es poco relevante para muestras suficientemente grandes (muestras de 500 a 1.000 observaciones son normalmente apropiadas).

MODELOS

DE



TRANSPORTE

Aunque se tiene una expresión explícita para la matriz de covarianza S, la determinación de los parámetros θ* necesita de un proceso iterativo. En el caso de un MNL lineal en los parámetros, la función se comporta bien, de forma que el proceso converge rápidamente y siempre hacia un único valor. Esto explica por qué es tan sencillo disponer de software para estimar este modelo. Desafortunadamente éste no es el caso para otros modelos de elección discreta, cuyo proceso de estimación es mucho más complicado. En lo que resta del capítulo se hace referencia principalmente al modelo MNL. Sustituyendo la expresión (7.9) del MNL en (8.13), puede demostrarse que si el conjunto de variables incluye una constante específica para la opción Aj se obtiene:

¤g q

jq

 ¤ Pjq

(8.14)

q

Esto permite deducir que como las constantes específicas de las alternativas tienden a capturar el efecto de variables no consideradas en el modelo, estas constantes aseguran que dicho modelo reproduce los porcentajes agregados de reparto de cada alternativa en el mercado. Por ello, como indicador de la bondad del ajuste no es adecuado comparar la suma de probabilidades de elegir una opción con el número total de observaciones que la seleccionaron, ya que esta condición se satisface inmediatamente en un modelo MNL que tenga un conjunto completo de constantes. Como tampoco es adecuado comparar las probabilidades del modelo con los valores de g jq (que son 0 ó 1), no se puede definir una medida de bondad del ajuste que esté basada en los residuales estimados, tal como el R2 de regresión lineal. Ejemplo 8.1: sea un caso de elección binaria con una muestra de sólo tres observaciones (como la propuesta por Lerman, 1984). Supóngase que únicamente hay un atributo x, tal que:

P1q 

1 1 exp ¨ª  x2 q x1q ·¹

;

P2 q  1 P1q

y también que se observan los siguientes valores y elecciones:



Especificación y estimación de modelos de elección discreta

Observación (q)

Elección

x1q

x2q

1 2 3

1 1 2

5 1 3

3 2 4

En este caso, para cualquier valor de θ, la función log-verosimilitud para la muestra viene dada por:

l ( )  log( P11 ) log( P12 ) log( P23 ) y reemplazando los valores se obtiene:

l( )  10 log(e5 e3 ) log(e e 2 ) log(e3 e 4 ) La figura 8.1 muestra el resultado de graficar l(θ) para diferentes valores de θ. l(θ) 0,5 1,0 1,5 2,0

θ

θ = 0,756 *

–1,75 –1,80 –1,85 –1,90 –1,95 –2,00

Figura 8.1. Variación de l(θ) respecto a θ.

El óptimo, θ* = 0,756 permite establecer las siguientes probabilidades: Observación (q)

P1q

P2q

1 2 3

0,82 0,32 0,32

0,18 0,68 0,68

MODELOS

DE



TRANSPORTE

Puede observarse a la vista de estos resultados, que el modelo predice incorrectamente la segunda observación bajo un criterio de maximización de la utilidad. Se ha mencionado que los parámetros θ* del modelo ML tienen una distribución normal asintótica con matriz de covarianza S2. En general, las reconocidas propiedades del método ML para funciones de verosimilitud que se comportan bien permiten, al igual que en la regresión múltiple, un cierto número de tests estadísticos de gran importancia. 8.4.1.1.

El test-t de significancia de cualquier componente θk* de θ

La ecuación (8.14) implica que θk* tiene una varianza estimada {skk2 }, donde S2 = {skk2 }, que fue calculada durante la estimación. Si su media θk = θ, entonces:

t

 k* skk

(8.15)

tiene una distribución Normal estándar N(0,1). Por esta razón es posible comprobar si θk* es significativamente diferente de cero (esto no es exactamente un test-t, ya que se está aprovechando la aproximación conseguida al tener una muestra grande y t se comprueba con la distribución Normal). Valores suficientemente grandes de t (mayores que 1,96 para niveles de confianza del 95%) llevan a rechazar la hipótesis nula θk = 0, y por tanto a aceptar que el atributo k-ésimo tiene un efecto significativo. El procedimiento secuencial de selección de variables seguido durante la especificación de los modelos de elección discreta, considera normalmente tests estadísticos formales como el visto anteriormente y otro tipo de comprobaciones más informales, tales como observar el signo del coeficiente estimado y verificar si es consecuente con la teoría o con conceptos a priori. En este sentido debe destacarse que la eliminación de una variable con signo correcto depende crucialmente de su importancia; por ejemplo, nótese que el conjunto de variables explicativas disponibles puede dividirse con beneficio en dos clases: • Variables muy relevantes o de intervención política, que tienen una base teórica sólida y/o que son cruciales para la prognosis; • Otras variables explicativas, que no sean cruciales para la evaluación de actuaciones (p. ej., sexo) o para las cuales no existan razones teóricas que justifiquen o rechacen su inclusión.



Especificación y estimación de modelos de elección discreta

La tabla 8.1 presenta los casos que se pueden dar al considerar las posibles interacciones según la división anterior, así como las soluciones recomendadas por la práctica habitual. Considérese en primer lugar el caso de eliminar una variable del tipo “Otras” con el signo correcto. Su eliminación dependerá del nivel de significación (a veces sólo es significativa a un nivel del 85%), y normalmente se deja fuera si no es significativa a un nivel del 80%. La buena práctica recomienda incluir una variable relevante con signo correcto aun cuando no haya pasado algún test de significación. La razón es que el coeficiente estimado es la mejor aproximación posible a su valor real. La falta de significación puede estar causada por insuficiencia de datos. Las variables del tipo “Otras” con signo incorrecto debieran rechazarse siempre. Sin embargo, como las variables de intervención política deben incluirse casi a cualquier coste, la práctica habitual indica que en el caso de signo incorrecto se haga una reestimación del modelo, fijando sus valores en base a información aceptable proveniente de estudios similares. Esta tarea es fácil si la variable no es significativa, pero puede llegar a ser muy difícil si lo es, ya que el valor fijado podría producir cambios importantes en el resto de los coeficientes del modelo. En lo referente a variables socioeconómicas como el sexo, la edad, la profesión y la ocupación, el modo típico de insertarlas dentro de los modelos de elección discreta es en forma de constantes adicionales, a lo sumo en todas las alternativas menos en una, en base a la experiencia y al sentido común del modelizador. Por ejemplo:

V1q   t1q  c1q  f1q L ¤ slq

(8.16)

l

V2 q   t2 q  c2 q  f 2 q L Tabla 8.1.

Casos de selección de variables Variable Intervención política

{ significante no significante Signo incorrecto { significante no significante

Signo correcto

Otras

Incluir

Incluir

Incluir

Se puede eliminar

Gran problema

Eliminar

Problema

Eliminar

MODELOS

DE



TRANSPORTE

Donde, por ejemplo, t representa el tiempo de viaje, c el coste, f la frecuencia, y las variables dummy slq representan las características socioeconómicas del individuo q. En este caso los datos socioeconómicos sirven para ampliar la explicación de la elección pero no proporcionan ninguna mejora en términos de la utilización del modelo para estimar valores subjetivos o disposición a pagar (esto es, la razón entre tiempo y coste, ver Gaudry et al., 1989). Además, usualmente se ha encontrado que no son demasiadas las variables del tipo “Otras” que proporcionan suficiente explicación como para justificar su inserción en los modelos. Un procedimiento alternativo consiste en parametrizar los coeficientes de cada atributo en el modelo utilizando variables socioeconómicas; en este caso la ecuación (8.16), pasa a ser: ¥ ´ ¥ ´ ¥ ´ Viq  ¦  0 ¤  l slq µ tiq ¦  0 ¤  l slq µ ciq ¦  0 ¤  l slq µ f iq l l l ¶ § ¶ § ¶ §

(i  1, 2)

(8.17)

Ahora las variables dummy slq se refieren a la característica socioeconómica l (p. ej., el sexo) del individuo q. Ésta es una forma, sencilla e interesante, de incorporar las variables socioeconómicas que además permite calcular funciones cuyo valor varía para cada individuo. Este método, de hecho, fue propuesto por Fowkes y Wardman (1988) como una forma de segmentar de acuerdo a los gustos individuales. La ecuación (8.17) permite obtener para cada atributo coeficientes que varían en función de las características del individuo. Es importante resaltar que la misma variable socioeconómica puede aparecer en la expresión de cada coeficiente y que esta formulación no implica que los gustos estén distribuidos de forma aleatoria en la población, sino que al revés, se acepta que los parámetros (α, β y χ) dependen de las características del individuo de modo determinístico. Esta parametrización permite incorporar heterogeneidad de gustos en forma económica, mediante la utilización de programas ampliamente disponibles, en vez de tener que recurrir a funciones más complejas como, por ejemplo, el probit multinomial o los modelos de componentes de error. Ejemplo 8.2: la tabla 8.2 presenta dos modelos. El primero de ellos utiliza el método explicado en (8.16), mientras que el segundo corresponde al método nuevo de la ecuación (8.17). El tamaño de la muestra es de 1.631 observaciones de preferencias declaradas (Rizzi y Ortúzar, 2002), relativas a la elección de



Especificación y estimación de modelos de elección discreta

ruta en presencia de los siguientes atributos: riesgo de accidentes, pago de peaje y tiempo de viaje. Tabla 8.2.

Formas alternativas de incluir las variables socioeconómicas

Variables (test-t)

Modelo 1

Modelo 2

–2,41E + 05 (–5,6)

–2,18E + 05 (–3,4)

Sexo

–0,4233 (–3,3)

1,29E + 05 (2,9)

Edad1 (30-49)

0,4605 (3,5)

–1,76E + 05 (–3,5)

Edad 2 (50-65)

1,02 (5,8)

–3,75E + 05 (–6,0)

Edad3 (> 65)

1,48 (2,8)

–5,49E + 05 (–3,0)

Día/noche

0,2097 (2,5)

–8,45E + 04 (–3,1)

Tiempo de viaje (h)

–3,318 (–13,9)

–3,738 (–14,0)

Peaje (US$)

–0,702 (–9,9)

–0,826 (–10,8)

Ingreso alto



–4,13E –0,4 (3,4)

0,1545

0,1703

Riesgo de muerte

ρ2(c)

Las variables socioeconómicas (SE) consideradas en el caso de la variable riesgo de accidentes fueron el sexo (1 para hombres), la edad (a través de tres variables dummy que adoptan el valor 1 si la edad de la persona está en el intervalo considerado) y una variable que define si el viaje transcurría de día o de noche (con el valor 1 si la persona ha viajado de día). En cambio, en el caso de la tarifa sólo resultó significativa la variable ingreso alto (que adopta el valor 1 si la renta del entrevistado es alta) y en el caso del tiempo no resultó significativa ninguna variable SE. En el primer modelo, estas variables se incluyeron como dummy normales en la función de utilidad de la ruta más segura, mientras que en el segundo

MODELOS

DE



TRANSPORTE

modelo se incluyeron en interacción con los coeficientes tanto del riesgo como de la tarifa. Si se observan los resultados parece obvio que la parametrización más flexible del modelo 2 es superior al modo tradicional de insertar las variables SE. Además es importante destacar que los resultados sugieren que las mujeres valoran más la seguridad que los hombres y lo mismo se detecta al aumentar la edad. De acuerdo al modelo 2, además, el valor de la seguridad debería aumentar si el viaje se realiza por la noche. En fin, es de destacar que la utilidad marginal del ingreso (es decir, el coeficiente del peaje cambiado de signo), disminuye para los usuarios con ingreso alto, en consonancia con la teoría. 8.4.1.2.

Test de razón de verosimilitud

Un número importante de propiedades del modelo puede expresarse como restricciones lineales en un modelo más general. Algunos ejemplos de estas propiedades son: • Atributos genéricos. Como se mencionó en el epígrafe 7.3, hay dos tipos principales de variables explicativas, genéricas y específicas. Las primeras tienen el mismo peso o significado en todas las alternativas, mientras que las últimas tienen un significado específico y diferente en cada una de las opciones y por tanto pueden tomar un valor igual a cero para ciertos elementos del conjunto de elecciones. • Homogeneidad de una muestra. Se puede probar si los coeficientes del modelo son apropiados para dos subpoblaciones (p. ej., los que viven a un lado y a otro de un río). Para realizar esta comprobación se especifica un modelo general con distintos coeficientes para las dos subpoblaciones, y posteriormente se prueba la igualdad de parámetros mediante un conjunto de restricciones lineales. Ejemplo 8.3: sea un modelo con tres alternativas, coche, autobús y ferrocarril y suponiendo que las variables que influyen en la elección sean las siguientes: tiempo de viaje (TT) y coste en efectivo (OPC: out-of-pocket cost) del mismo; en este caso, una forma general del modelo podría ser:

Vcoche  1TTcoche  2 OPCcoche Vbus  3 TTbus  4 OPC bus Vtren  5 TTtren  6 OPC tren



Especificación y estimación de modelos de elección discreta

Puede establecerse la hipótesis de que los costes (no los tiempos) no tienen por qué ser percibidos de forma distinta por los individuos y que deberían especificarse como genéricos. Esto se puede expresar escribiendo esta hipótesis como dos ecuaciones lineales:

2 4  0 2 6  0 En general es posible plantear la conveniencia de usar atributos genéricos mediante restricciones lineales en un modelo más general. Para un uso intenso de este tipo de tests, consultar Dehghani y Talvitie (1980). Debido a las propiedades de la ML, es fácil testear cualquier hipótesis expresada mediante restricciones lineales, utilizando el conocido test de la razón de verosimilitud (LR). Para llevar a cabo este test se ejecuta en primer lugar el programa de estimación para el caso más general, produciendo estimadores θ* y el logaritmo de la verosimilitud l* (θ) en convergencia. Después se ejecuta por segunda vez para obtener estimaciones θr* de θ y el nuevo logaritmo de la verosimilitud l* (θr) para el máximo en el caso restringido. Si el modelo restringido bajo consideración tiene una especificación correcta, el estadístico LR:

2[l ( r ) l ( )] distribuye asintóticamente χ2 con r grados de libertad, donde r es el número de restricciones lineales. El rechazo de la hipótesis nula implica que el modelo restringido es erróneo. Para llevar a cabo el test es necesario que un modelo sea una versión restringida o anidada del otro. Train (1977) ofrece ejemplos del uso de este test para el estudio de no linealidades, no genericidad y no homogeneidad. Horowitz (1982) ha estudiado en detalle la potencia y propiedades de este test y se puede consultar para profundizar en el tema. 8.4.1.3.

Test general de ajuste

Un caso especial de test de razón de verosimilitud es verificar si todos los componentes de θ son iguales a cero. Este modelo se conoce como el modelo equiprobable (EL) y satisface:

Pjq ( A(q ) , ) 

1 Nq

MODELOS

DE



TRANSPORTE

siendo Nq el tamaño del conjunto de elecciones del individuo q. En general este test no es muy útil porque un modelo con constantes específicas reproducirá los datos mejor que una función puramente aleatoria. Por esta razón un test más riguroso es verificar si todas las variables, excepto las constantes específicas, son cero. Este modelo nulo es el modelo de la proporción de mercado (MS), donde todas las variables explicativas son cero, pero existe un conjunto completo de constantes específicas de las alternativas. En este caso todos los individuos tienen el mismo conjunto de elecciones y se obtiene: Pjq (A(q), θ) = MSj donde MSj es la proporción de mercado de la opción Aj. A continuación se desarrolla en primer lugar el test del modelo EL porque es el más simple. Considérese un modelo con k parámetros y, como es usual, con un valor del logaritmo de la verosimilitud en convergencia de l* (θ). Sea l* (θ) el valor del logaritmo de la verosimilitud del modelo EL equiprobable. Bajo la hipótesis nula H0 : θ = 0, se obtiene el estadístico LR:

2[l (0) l ( )] que distribuye χ2 con k grados de libertad. Se puede elegir un nivel de significación (p. ej., el 95%) y comprobar si el estadístico LR es menor o igual que el valor crítico de χ2 (k, 95%), en cuyo caso la hipótesis nula se aceptaría. No obstante se ha demostrado que el test no tiene mucha potencia porque si se rechaza la hipótesis nula (como siempre sucede), únicamente quiere decir que los parámetros θ explican mejor los datos que un modelo sin potencial explicativo. La verdad es que la única ventaja de este test es su bajo coste, ya que el cálculo de l* (θ) no requiere ejecutar el programa una vez más pues en la mayor parte de los algoritmos de búsqueda se utiliza como valor inicial del logaritmo de verosimilitud. Para llevar a cabo el test con el modelo de sólo constantes, se necesita calcular el valor de l* (C); si hay (k – c) parámetros que no son constantes específicas, el valor adecuado de LR se compara con χ2 (k – c, 95%). En general se necesita una ejecución adicional de la rutina de estimación para calcular l* (C), excepto para modelos donde todos los individuos se enfrentan al mismo conjunto de elecciones, en cuyo caso se cumple que:

l (C )  ¤ Q j log( g( j

Qj Q

)

(8.18)



Especificación y estimación de modelos de elección discreta

donde Q j es el número de individuos que eligen la opción Aj. La figura 8.2 muestra la relación intuitiva entre los valores de la función logaritmo de verosimilitud para el conjunto de parámetros que la maximizan l* (θ), para los dos modelos previos, l* (θ) y l* (C) respectivamente y para un modelo completamente saturado (perfecto), obviamente con un valor de l* (*) = 0. l * (0)

l * (C)

l * (θ)

l (*) = 0

Figura 8.2. Relación intuitiva entre los valores de la log-verosimilitud.

8.4.1.4.

El índice ρ2

Aunque en este caso no es posible construir un índice como el R2, siempre es interesante tener un indicador que varíe entre 0 (sin ajuste) y 1 (ajuste perfecto), para poder comparar modelos alternativos. Se definió inicialmente un índice que satisface algunas de las características anteriores, así:

2 1

l * ( ) l * (0)

(8.19)

Su significado está claro en los dos límites (0 y 1), pero no tiene una interpretación intuitiva para valores intermedios. De hecho, valores cercanos a 0,4 pueden constituir ajustes excelentes. Como en principio se puede calcular un índice ρ2 relacionado con cualquier hipótesis nula, es importante elegir una apropiada. Por ejemplo, puede demostrarse que los valores mínimos de ρ2 en la expresión (8.19), para modelos con constantes específicas, varían con la proporción de individuos que eligen cada alternativa. Tomando un caso binario simple, la tabla 8.3 muestra los valores mínimos de ρ2 para diferentes proporciones que eligen la opción 1 (Tardiff, 1976). Se puede observar que ρ2 sólo es adecuado cuando las dos opciones son elegidas en la misma proporción. Estos valores significan, por ejemplo, que un modelo estimado con una muestra 0,9/0,1 produciendo un valor de ρ2 de 0,55, es peor que un modelo que produce un valor de ρ2 de 0,25 para una muestra de 50/50. Afortunadamente existe un ajuste sencillo que permite solventar esta dificultad; consiste en calcular el índice respecto al modelo sólo constantes:

MODELOS

DE



TRANSPORTE

Tabla 8.3. Valor mínimo de ρ2 para distintas frecuencias relativas Proporción de la muestra que elige la primera alternativa

Valor mínimo de ρ2

0,50

0,00

0,60

0,03

0,70

0,12

0,80

0,28

0,90

0,53

0,95

0,71

 2 1

l ( ) l (C )

(8.20)

Este estadístico, que toma valores entre 0 y 1, es comparable para distintas muestras y se relaciona con la distribución χ2. Finalmente, es importante señalar que en el modelo logit anidado, el índice ρ2 tiene la forma:

 2 1

l1 ( ) l2 ( ) L lS ( ) l1 (C ) l2 (C ) L lS (C )

(8.21)

Donde los subíndices 1 a S se refieren a los modelos MNL en cada nido. 8.4.1.5.

Porcentaje correctamente predicho o recuperación de la primera preferencia (FPR)

Es una medida agregada que mide la proporción de individuos que realmente elige la opción con la utilidad más alta modelizada. El FPR es fácil de entender y puede compararse con la posibilidad de recuperación (CR: chance recovery) dada por el modelo equiprobable:

CR 

1 1 ¤ Q q Nq

Si todos los individuos tienen un conjunto de elecciones del mismo tamaño N, entonces CR = 1/N. El FPR puede compararse también con la recuperación



Especificación y estimación de modelos de elección discreta

de la proporción de mercado (MRS) obtenida mediante el mejor modelo nulo (Hauser, 1978):

MSR  ¤ (MS j ) 2 Aj

Las desventajas de este índice se ponen de manifiesto al constatar que aun cuando un FPR del 55% pueda ser bueno en general, ciertamente no lo es en un mercado binario. También un FPR del 90% es normalmente bueno en el caso binario, pero no lo es si una de las opciones tiene una tasa de mercado del 95%. Otro problema asociado al índice, que conviene destacar en el sentido de que es un indicador ambiguo de la fiabilidad del modelo, es que un valor demasiado alto del FPR debería llevar al rechazo del modelo, lo mismo que un valor demasiado bajo. Para comprender este hecho, es necesario definir el valor esperado de FPR para un modelo específico como:

ER  ¤ Pq q

(8.22)

donde Pq representa la (máxima) probabilidad asociada con la mejor opción del individuo q. Como el FPR es un suceso aleatorio binomial independiente para el individuo q, que ocurre con una probabilidad 1/Nq en el caso CR y Pq en el caso ER, sus varianzas vienen dadas respectivamente por:

Var(CR ) 

1 1 (1 ) Nq Nq

(8.23)

y:

Var(ER )  Pq (1 Pq )

(8.24)

De esta forma, un valor calculado de FPR para un modelo concreto puede comparase con CR y ER. Si las tres medidas están relativamente próximas (comparando sus varianzas estimadas), el modelo es razonable pero poco informativo. Si FPR y ER son similares y más grandes que CR, el modelo es razonable e informativo. Finalmente si FPR y ER no son cercanos, el modelo no explica la variación en los datos y debería rechazarse aun si FPR fuera más grande que ER (Gunn y Bates, 1982).

MODELOS

8.4.1.6.

DE



TRANSPORTE

Muestras de validación

Como ya se ha mencionado en el Capítulo 5, el funcionamiento de cualquier modelo debe juzgarse utilizando datos distintos a los empleados para su especificación, idealmente, datos tomados en otro momento temporal (quizás tras la introducción de una actuación, para poder analizar las propiedades de respuesta del modelo). Esto es general para cualquier modelo. Se definirá como muestra de validación a una submuestra de los datos o, preferiblemente, a otra muestra no utilizada durante la estimación. A continuación se describe brevemente un procedimiento para estimar el mínimo tamaño de la muestra de validación (en teoría para ser tomada de la muestra total disponible para el estudio), con la condición de que permita detectar diferencias entre el funcionamiento de dos o más modelos cuando exista una verdadera diferencia entre los mismos. El método, que está basado en el concepto del FPR, fue desarrollado por Hugh Gunn y aplicado por primera vez por Ortúzar (1983). Modelo 2

Modelo 1

No FPR

FPR

No FPR

n11

n12

FPR

n21

n22

Dada la tabla anterior donde nij representa el número de individuos asignados a la celda (i,j). Para todos los individuos en una muestra de validación, se calculan las probabilidades de elección y las FPR en ambos modelos a examinar y con estos valores se rellenan adecuadamente las celdas de la tabla (es decir, asignando el valor a la celda (1,1) si no constituye el FPR en ambos modelos, y así sucesivamente). Interesa comprobar la hipótesis nula de que la probabilidad de asignar individuos a las celdas (1,2) y (2,1) sean iguales, porque este caso indicaría que los dos modelos son equivalentes. Bajo esta hipótesis nula, el siguiente estadístico M distribuye χ2 con un grado de libertad (Foester, 1979):

M

n12 n21 n12 n21

(8.25)



Especificación y estimación de modelos de elección discreta

De esta forma se puede realizar un simple test de la equivalencia de los dos modelos según los FPR calculando M y comparando el resultado con una χ2 (1, 95%); si M es menor que el valor crítico adecuado χ2 (3,84 para el nivel usual de confianza del 95%), no se puede rechazar la hipótesis nula y se concluye que los modelos son equivalentes. A partir de este procedimiento se puede seleccionar el nivel de confianza que parezca adecuado para afirmar que los dos modelos bajo comparación difieran en relación al número esperado de FPR. Esto permite controlar el número de veces que se señalaría incorrectamente que existe una diferencia entre modelos similares. Como es usual, la elección de un tamaño concreto de la muestra es asegurar el correspondiente control sobre la proporción de veces que se cometerá el otro tipo de error, es decir, llegar a la conclusión de que no hay diferencia entre modelos realmente diferentes. Para calcular la probabilidad de un error del segundo tipo es necesario decidir cuál es la mínima diferencia que se estaría dispuesto a detectar. Con ella se puede calcular el tamaño muestral para reducir la probabilidad de errores del segundo tipo hasta un nivel aceptable, para modelos que se diferencien exactamente en esta cantidad mínima o más. Ejemplo 8.4: considérese el caso de dos modelos de forma que, en promedio, el modelo 2 produce 10 FPR extra por cada 100 individuos modelizados que el modelo 1. Nótese que no importa si esto se debe a que el modelo 1 tiene 20% de FPR y el modelo 2, 30%, o a que el primero tenga 80% y el segundo 90%. En otras palabras, ambos modelos pueden ser inadecuados. En este sencillo escenario, n21 es igual a cero y por tanto M es simplemente n12. Si se asegura un nivel de confianza del 95%, de que cualquier diferencia que se establezca no puede haber surgido al azar de modelos equivalentes, se compara el valor de n12 con 3,84. Para cualquier tamaño de muestra n, la probabilidad de que r individuos sean asignados a la celda (1,2) es simplemente la probabilidad binomial:

¥n´ r (n r ) ¦ µ p (1 p ) §r ¶ donde p indica la probabilidad de que un individuo elegido al azar sea asignado a la celda (1,2), es decir, es la mínima diferencia que se desea detectar. Dado n y tomando p = 0,05 como de costumbre, se pueden calcular las probabilidades de que 0, 1, 2 y 3 individuos sean asignados, y sumarlas para obte-

MODELOS

DE



TRANSPORTE

ner la probabilidad total de aceptación de la hipótesis nula (cometer un error del segundo tipo). La tabla 8.4 da las probabilidades resultantes para diferentes tamaños de muestra. Está claro que el tamaño de la muestra de validación requerido debe ser relativamente grande, ya que un conjunto típico de datos de estimación tiene sólo unos pocos cientos de observaciones. También se debe recordar que la tabla 8.4 se refiere al caso simple en que un modelo sea mejor o igual al otro en cada observación. No obstante, el método puede extenderse fácilmente a aquellos casos en los que las celdas (1,2) y (2,1) tengan probabilidad no nula. Tabla 8.4.

Probabilidad de error del segundo tipo para una muestra de dimensión dada y modelos tal y como fueron definidos

Tamaño de la muestra

Mínima diferencia al 5% de prob. (error II)

50

0,75

100

0,26

150

0,05

200

0,01

250

0,00

Una característica especialmente útil de las muestras de validación es que si su tamaño es adecuado, el problema de jerarquizar modelos no anidados se resuelve fácilmente, ya que los tests de la razón de verosimilitud se pueden aplicar a estas muestras, independientemente de diferencias en los parámetros estructurales del modelo. Esto es así porque la condición de que un modelo sea una generalización paramétrica del otro, únicamente se necesita para test que empleen los mismos datos utilizados durante la estimación (Gunn y Bates, 1982; Ortúzar 1983). Ejemplo 8.5: supóngase que existe interés por una alternativa que actualmente presenta una baja cuota de mercado y se dispone de dos especificaciones (modelos A y B) con seis alternativas de elección por modelo. Ambos modelos tienen valores de FPR parecidos pero uno de ellos predice mal la alternativa que más interesa y sensiblemente mejor las otras, mientras que el segundo proporciona previsiones razonables para todas las alternativas. En este caso se puede utilizar una muestra de validación y estimar, para cada individuo de ella, las probabilidades de elección para cada alternativa con



Especificación y estimación de modelos de elección discreta

los dos modelos; la alternativa realmente elegida es, como de costumbre, un dato observado. Para estudiar la consistencia de las previsiones con los datos, es necesario contrastarlas con las proporciones calculadas para la muestra. La tabla 8.5 presenta los valores de Nij y Oij (donde i indica una banda de probabilidad y j una alternativa), Nij es el número de observaciones para las que el modelo asignó una probabilidad de elegir la alternativa Aj que recae en la banda i, y Oij es el número observado de elecciones de la alternativa Aj a las que el modelo asignó una probabilidad en esa banda. La tabla 8.6 se construye sobre la base de la anterior y presenta los valores de Eij y Oij, donde Eij es:

Eij  N ij pi que corresponde al valor esperado del número de individuos que eligen la alternativa Aj con probabilidad en la banda i, asociada a la probabilidad media Tabla 8.5.

Elecciones modelizadas según banda de probabilidad

Banda probabilidad predicha (i) Alternativa (j)

0-0,1

0,1-0,2

0,2-0,3



0,9-1,0

N1j

O1j

N2j

O2j

N3j

O3j





N10j O10j

1

0

0

8

0

11

0





2

40

0

0

0

0

0





0

0

3

94

0

0

0

0

0





0

0

Modelo A 0

0













































6

55

6

11

3

58

14





0

0

24





Total

6

6

0

Modelo B 1

9

0

5

0

0

0

2

36

0

4

0

0

0















0 …



0

0

0

















































6

43

3

44

7

18

8

0

0

Total

6

11

13





15

MODELOS

DE



TRANSPORTE

p̅ i. En el caso expuesto en la tabla, se tiene que E36 = 58 × 0,25 = 14,5, ya que 0,25 es el valor medio de probabilidad de la banda 3 (p. ej., entre 0,2 y 0,3). Para comparar los valores de la tabla 8.6 se puede aplicar un test χ2 definido de la siguiente manera (Gunn y Bates, 1982): 2 χ cell ¤

(Oij Eij ) 2

con ij-1 grados de libertad

Eij

ij

En principio se puede aplicar dicho test a cada celda de la matriz si Eij > 5, ya que en otro caso el test no es válido. Así, a menudo es necesario agregar celdas ya que generalmente los tamaños de las muestras de validación son limitados; desafortunadamente no existen métodos claros para realizar tal agregación. Los lectores pueden comprobar qué estrategias diferentes de agregación conducen a resultados distintos. Tabla 8.6.

Proporciones esperadas por banda de probabilidad

Banda probabilidad predicha (i) Alternativa (j)

0-0,1

0,1-0,2

0,2-0,3



0,9-1,0

E1j

O1j

E2j

O2j

E3j

O3j





0

0

1,2

0

2,75

0





E10j O10j

Modelo A 1

0

0

2

2

0

0

0

0

0





0

0

3

4,7

0

0

0

0

0





0

0













































6

2,75

6

1,65

3

14,5

14





0

0

Total

9,45

6

4,05

6

29

24





0

0

0,45

0

5

0

0

0

0

0

0

0

0

0

Modelo B 1 2

1,8

0

4

0

0

0

3

4,05

0

1,65

0

0,5

0

















































6

2,15

3

6,6

7

4,5

8

0

0

Total

9,5

6

11,7

11

7,5

13

15,2

15







Especificación y estimación de modelos de elección discreta

Un caso menos informativo, que sin embargo generalmente se puede llevar a cabo, consiste en contrastar los totales esperados y observados para cada columna de la tabla 8.6, es decir respectivamente Ei = Ʃj Eij y Oi = Ʃj Oij, utilizando el siguiente índice: m

2  FPR ¤ i 1

(Oi Ei ) 2 Ei

(8.26)

donde m es el número de columnas con Ei > 5. En este caso el número apropia2 se puede comparar con el valor crítico do de grados de libertad es m-l, y χFPR 2 2 2 χ0,95;m–1. Si resulta que χFPR < χ0,95;m–1 se acepta la hipótesis nula de que el modelo es consistente con los datos. Si se aceptan dos o más modelos de acuerdo con el anterior test, entonces se puede discriminar entre ellos utilizando el test directo de la razón de verosimilitud (Gunn y Bates, 1982; Ortúzar, 1983): O LA ” i pi i (modelo A)  LB ” i piOi (modelo B)

(8.27)

Aplicando este test a los datos de la tabla 8.6 se obtiene:

LA (0, 05)6 x (0,15)6 x (0, 25) 24 x L x (0, 95)0   0, 0455 LB (0, 05)6 x (0,15)11 x (0, 25)13 x L x (0, 95)15 y por tanto se puede decir que los datos son aproximadamente 22 veces (es decir 1/0,0455) más probables bajo el modelo B que bajo el modelo A. Ello significa que debería preferirse el modelo B aunque ambos modelos proporcionan previsiones consistentes con los datos.

8.4.2. Estimación de modelos con muestras basadas en la elección Como se mencionó en el Capítulo 3, la estimación de un modelo a partir de una muestra basada en la elección puede ser de gran interés ya que los costes de toma de datos son considerablemente más bajos que para muestras puramente aleatorias o estratificadas. El problema de encontrar un procedimiento de estimación manejable que posea propiedades estadísticas deseables no es sencillo y el estado del arte lo constituyen los excelentes trabajos de Coslett (1981) y Manski y McFadden (1981).

MODELOS

DE

TRANSPORTE



Se ha encontrado que, en general, los estimadores de máxima verosimilitud referidos al muestreo basado en la elección son poco prácticos a causa de sus dificultades de cálculo, excepto en circunstancias muy especiales. Un método tratable se puede derivar si se supone que el analista conoce la fracción de la población encuestada que elige cada alternativa. El enfoque se basa en el estimador de máxima verosimilitud habitual de la muestra aleatoria y consiste en ponderar la contribución de cada observación al logaritmo de la verosimilitud por la razón Qi/Si , donde el numerador es la fracción de población que elige la opción Ai y el denominador la fracción análoga para la muestra basada en la elección. Manski y Lerman (1977) demostraron que el estimador ML no ponderado de las muestras aleatorias, es inconsistente cuando se aplica a muestras basadas en la elección, y en la mayor parte de los modelos esta inconsistencia afecta a todas las estimaciones de los parámetros. Sin embargo, como se vio en el apartado 7.3.2, para simples modelos MNL con un conjunto completo de constantes específicas en las alternativas, esta inconsistencia únicamente se refiere a las estimaciones de estas variables dummy si todos los individuos tienen el mismo conjunto de opciones.

8.4.3.

Inclusión de variables latentes

Para incorporar factores latentes cualitativos en los modelos de demanda de viajes, Morikawa y Sasaki (1998) proponen un método que combina un modelo de ecuaciones estructurales lineales y un modelo de elección discreta. El modelo de ecuaciones estructurales lineales describe el proceso por el cual los atributos latentes generan indicadores psicométricos subjetivos relativos a varios aspectos de los atributos de viaje además de la relación entre los atributos latentes y las variables objetivas observables. Por su parte, el modelo de elección discreta expresa las elecciones observadas explicables a través de las variables observables y los atributos latentes. Un método práctico para la calibración de los parámetros desconocidos incluidos en este sistema, consiste en utilizar una estimación de máxima verosimilitud en dos fases secuenciales. En la primera, a través de un programa tipo LISREL se estima el modelo de ecuaciones estructurales para calcular los valores de ajuste de las variables latentes; en la segunda fase, se estima un modelo de elección discreta que incluye las variables explicativas latentes calculadas. Morikawa y Sasaki aplican este método a un conjunto de datos que incluye seis



Especificación y estimación de modelos de elección discreta

indicadores subjetivos de los atributos de viaje, de los cuales, la comodidad y la fiabilidad se identifican como atributos latentes. Los valores predichos de las variables latentes pueden ser calculados a partir de variables objetivas. Los valores ajustados para los dos atributos latentes tuvieron un excepcional poder explicativo en el modelo de elección del modo de transporte.

8.4.4.

Comparación de modelos no anidados

El test de la razón de verosimilitud descrito anteriormente requiere que el modelo sea probado con respecto de una generalización paramétrica del mismo, es decir, es necesario que el modelo sea anidado. No pueden ser comparados con este test modelos cuyas funciones de utilidad presenten una forma funcional significativamente diferente, ni modelos que estén basados en paradigmas de comportamiento distintos. Existen varias situaciones en las que sería útil testear un determinado modelo con respecto a otro que no constituya una generalización paramétrica. El siguiente ejemplo, propuesto por Horowitz (1982) es muy ilustrativo. Ejemplo 8.6: considérese un modelo con una función de utilidad especificada así:

V  1 Z1  2 Z 2 y otro con una función de utilidad dada por:

W  3 Z 3 Z 4 Supóngase que se desea comprobar cuál de los dos modelos explica mejor un determinado conjunto de datos. Claramente, no existe ningún valor de θ3 que, para todos los valores de θ1, θ2, y de los atributos Z, haga que V y W coincidan. Si ambos modelos pertenecen a la misma familia, puede construirse una función de utilidad híbrida X que, en este hipotético caso, contuviese a V y a W como casos especiales:

X  1 Z1  2 Z 2 3 Z 3 Z 4 y utilizando tests de la razón de verosimilitud, ambos modelos pueden compararse frente al híbrido. El primero se correspondería con la hipótesis de que θ3 = 0 y el segundo con las hipótesis θ1 = θ2 = 0.

MODELOS

DE



TRANSPORTE

Otros tests, incluyendo casos en los que los dos modelos competitivos no per tenezcan a la misma familia general, se describen más detalladamente en el excelente trabajo de Horowitz (1982). De todas formas, es importante recordar que si se dispusiera de una muestra de validación, el problema podría ser resuelto fácilmente, tal como se trata en Gunn y Bates (1982).

8.5. 8.5.1.

MÉTODOS DE ESTIMACIÓN DEL MNP Integración numérica

La probabilidad de elección de un modelo general de utilidad aleatoria puede expresarse así:

Pi ( ,Z)  °

ui

u1  d

°

ui

u2  d

d

ui

d

u J  d

L° L°

f (u) d u J L d u1

(8.28)

donde f(u) es la función de distribución conjunta de las utilidades de las alternativas. Ahora, recordar que para el modelo MNP se tiene: 1

« 1 º f (u)  MVN(V , 3)  ¨ª(2P) J 3 ·¹ 2 exp ¬ (u V )3 1 (u V )T » ­ 2 ¼

(8.29)

Como se sabe, para poder realizar una integración numérica, la región de integración tiene que ser dividida en una serie de elementos diferenciales; para cada uno de ellos, el área bajo la curva se aproxima al área del rectángulo medio equivalente (dado el elemento diferencial y su altura) y, finalmente, el valor de la integral total es igual a la suma de todas estas áreas. Aunque la dificultad del problema crece geométricamente con la dimensión de la integral, afortunadamente en la mayor parte de los casos ésta dimensión se puede reducir para MNP cuando: 1. Se efectúa un cambio de variable y se expresan todos los elementos de la integral como la diferencia entre la utilidad de la alternativa considerada y la utilidad de las otras alternativas. Así, se consigue un vector û de sólo J-1 componentes dado por: û k = u k – ui û J–1 = u J – ui

(se asume que se está calculando Pi)



Especificación y estimación de modelos de elección discreta

Entonces la probabilidad de elegir la alternativa Ai viene dada por: Pi (û, Σ̂) = Prob{ûk < 0, Ak ū A} y la integral se reduce a:

°

0

û 1  d



0

û J 1

1

« º ¨( 2 P) J 1 3̂ · 2 exp ¬ 1 ( û - V̂ )3̂ 1 ( û V̂ )T » ª ¹  d ­ 2 ¼

donde V̂ y Σ̂ representan la media y la matriz de covarianza de las nuevas variables. 2. Se realiza una transformación a través de la descomposición de Cholesky, que permite separar las integrales y, en particular la primera, que corresponde a Ai, resulta ser igual a uno (Daganzo, 1979). Este proceso es bastante complejo pero, en términos prácticos, permite reducir en una unidad la dimensión de la integración múltiple. La integración numérica es el método más exacto pero puede ser solamente aplicado a un coste razonable para un máximo de cuatro alternativas; adicionalmente presenta algunos problemas de aproximación (ordenadores) en el caso en que una o más probabilidades de elección estén próximas a cero. Por estas razones, sólo se utiliza como un estándar de comparación para otros métodos.

8.5.2. Aproximación de Clark Para explicar este método se va a considerar un caso trinomial. Sean U1, U2 y U3 ~ MVN con medias V1, V2 y V3, varianzas σ1, σ2 y σ32 y coeficientes de correlación ρ12, ρ13 y ρ23. Sea además una variable Ũ12 = max(U1, U2). Clark (1961) ha demostrado que los momentos alrededor de cero de Ũ12 vienen dados por:

v1  V1 –  ( ) V2 –  (  ) a –  ( ) v2  (V12  12 ) –  ( ) (V22  22 ) –  (  ) (V1 V2 ) – a –  ( ) donde Φ(x) es la distribución normal estándar acumulada, es decir: x

x

d

d

1

 ( x)  °  ( x)dx  ° (2P) 2 e

x2 2

dx

MODELOS

DE



TRANSPORTE

Clark (1961) también demostró que el coeficiente de correlación entre esta nueva variable y U3 viene dado por:

  ( )  2  23 (  )  (U 3 ,U%12 )  1 13 (v 2 v12 )1/ 2 donde

a  Var (U1 U 2 ) y  

v1 v2 a

Utilizando todas estas ecuaciones, Clark (1961) demuestra por fin que la siguiente aproximación es, en general, excelente:

U%12  max (U1 ,U 2 ) ~ N (v1 , v2 v12 )

(8.30)

Estas ecuaciones pueden ser utilizadas recursivamente para obtener una distribución aproximada del máximo de J variables y, después de J-1 iteraciones, se puede conseguir una expresión aproximada para la media y la variancia del 2 máximo, Vmax y σmax . Por tanto, si Ui es la utilidad de la alternativa en examen, resulta que en la última iteración se obtiene que:

V i  E ¨ª max U1 ,L ,U i 1 ,U i 1 ,L ,U J ·¹

 2i  Var ¨ª max U1 ,L ,U i 1 ,U i 1 ,L,U J ·¹  i ,i  Corr ¨ªU i , max U1 ,L ,U i 1 ,U i 1 ,L ,U J ·¹ Con estas ecuaciones se puede calcular la probabilidad de que la alternativa Ai sea efectivamente la que tenga una utilidad mayor:

[

Pi  Prob U i r max U j j xi

]

Pi  Prob [max U1 ,L ,U i 1 ,U i 1 ,L ,U J U i b 0] · ¨ (Vi V i ) ¸ © Pi  & 1 ¸ © 2 2 2 ©ª ( i  i 2 i  i i , i ) ¸¹

(8.31)



Especificación y estimación de modelos de elección discreta

El único error en esta aproximación se encuentra en la ecuación (8.30), ya que el máximo de dos variables normales no es otra variable normal. Para más de cuatro alternativas, el método funciona razonablemente bien y está implementado en un paquete de software llamado CHOMP (Daganzo y Schoenfeld, 1978). Desgraciadamente, la aproximación de Clark no es satisfactoria cuando las variables tienen media parecida y variancias muy diferentes, lo cual es muy usual en la práctica. Por este motivo el método gozó de un éxito bastante efímero y fue prácticamente abandonado a principios de los 80 (Horowitz, 1991; Horowitz et al., 1982).

8.5.3.

Máxima verosimilitud simulada

Originalmente, Lerman y Manski (1981) propusieron evaluar la probabilidad de elección Pi (V, Σ) a través de la generación de un número de realizaciones U, de un MNV (V, Σ) , anotando como éxito cuando Ui presentaba el valor más alto. Para un número de realizaciones suficientemente grande, la proporción de éxitos se aproxima a la probabilidad de elección. Así, el método era teóricamente simple, pero desgraciadamente tenía varios problemas en la práctica: 1. Si el número de éxitos es igual a cero, algo que puede suceder (en ciertas circunstancias) la log-verosimilitud tiende a infinito y el método colapsa. Para resolver este problema Lerman y Manski (1981) sugirieron reemplazar el número de éxitos sobre el total de realizaciones, como el estimador de la probabilidad de elección, por la cantidad (Ni + 1) / (N + J), en que Ni es el número de éxitos, N es el tamaño muestral (número de realizaciones) y J el número de alternativas. Sin embargo, esto introduce sesgos (ya que el estimador correcto de Pi es Ni / N ) que si bien son pequeños en problemas grandes pueden ser considerables en problemas más prácticos. 2. El error relativo asociado con el método de simulación es inversamente proporcional a la raíz cuadrada del número de éxitos. Esto implica que se deben efectuar muchas realizaciones y el procedimiento puede ser muy caro en problemas de tamaño real; de hecho, a fines de los 70 se comprobó empíricamente que el método era dos o tres órdenes de magnitud más caro que el método de Clark. Sin embargo, en los últimos años este enfoque ha vuelto a tener gran aceptación en la práctica, debido a una serie de avances en la simulación de procesos

MODELOS

DE



TRANSPORTE

multivariados en modelización de elecciones discretas (ver Borsch-Supan y Haji-Vassiliou, 1993). También existe un enfoque alternativo (McFadden, 1989; Pakes y Pollard, 1989) en el que se evita evaluar la integral múltiple a través del reemplazo de la probabilidad de elección en la ecuación de momentos por un simulador insesgado. Este Método de Momentos Simulados puede considerarse un precursor del modelo Logit Mixto o de Componentes de Error, que es probablemente el enfoque más atractivo hoy día en el área, y cuya estimación revisaremos en la sección siguiente. Utilizando avances en técnicas de integración basadas en la simulación de Monte Carlo desarrolladas por varios autores, Borsch-Supan y Hajivassiliou (1993) proponen el simulador GHK que tiene la propiedad esencial de producir probabilidades simuladas insesgadas estrictamente entre cero y uno, y que además son funciones continuas y diferenciables en términos de los parámetros del modelo. Además, el esfuerzo computacional aumenta sólo linealmente con la dimensión de la integral y es independiente de las probabilidades verdaderas. El simulador se basa en disminuir recursivamente la dimensión del problema y para ello requiere generar repeticiones de una distribución Normal truncada unidimensional. Para desarrollar el enfoque se toma como base el modelo probit reducido en una dimensión tras aplicar la transformación consistente en restar la utilidad de la opción elegida en cada observación de las restantes utilidades (esto es, U1 – Uc en que c es la opción elegida); como se sabe, la utilidad transformada también distribuye Normal. En términos matemáticos, la transformación consiste simplemente en premultiplicar el vector de utilidades por una matriz A que es igual a menos la matriz identidad e incorporar una columna de unos en la posición correspondiente a la opción elegida. Al vector resultante se le elimina la fila que corresponde a la alternativa elegida ya que sólo contiene ceros. De este modo se tiene que la utilidad representativa transformada viene dada por V* = AV, el término de error distribuye Normal con media cero y la matriz de covarianza M = AƩA'. M se puede descomponer mediante la factorización de Choleski en una matriz triangular inferior L y una superior L', tal que el producto LL' = M. El simulador GHK fue desarrollado para simular la probabilidad de que una variable aleatoria Normal multivariada se encuentre entre los límites a y b: a ≤ AU ≤ b u ~ N(θX,Σ) sujeto a



Especificación y estimación de modelos de elección discreta

En lugar de simular para esas variables, se hace para:

e ~ N(0, I ) sujeto a a* y a A X b Le b b* y b A X y se puede ver que gracias a la estructura triangular de L, las restricciones son recursivas: e1 ~ N(0,I) sujeto a a1*, ≤ l11e1 ≤ b1*

š

a1* / l11 b e1 b b1* / l11

e2 ~ N(0,I) sujeto a a2* ≤ l21e1 + l22e2 ≤ b2*

š (a2* l21e1 ) / l22 b e2 b (b2* l21e1 ) b l22 etcétera. De esta forma, los valores de ei pueden ser generados secuencialmente con un simulador truncado univariado. Finalmente, el vector aleatorio que se desea obtener u*, se define como:

u *   X A 1Le Este vector tiene una matriz de covarianza A-1LL'A-1' = A-1AΣA'A-1' = Σ y está sujeto, por construcción, a la condición a ≤ Au* ≤ b. Borsch-Supan y Hajivassiliou (1993) demuestran que a pesar de que la generación de repeticiones de u* es sesgada, la contribución de cada observación a la función de verosimilitud (es decir, la probabilidad de que Au esté entre a y b) es simulada correctamente por la probabilidad de que a* ≤ Le ≤ b*. De hecho, es posible hacer uso de un truco llamado “antítesis” que permite reducir la varianza de la probabilidad de elección eventualmente calculada. En efecto, si se considera que Piq puede aproximarse como el promedio de las probabilidades correspondientes a dos conjuntos de repeticiones de números aleatorios (Piq0 y Piq1 ), entonces es fácil ver que la varianza (Var) de Piq está dada por 0,25 Var(P0iq) + 0,25 Var(P1iq) + 0,5 Cov(P0iq, P1iq). Así, si ambos conjuntos son independientes la covarianza es cero, pero si están negativamente correlacionados ésta será menor que cero; el ideal es, entonces, generar una serie de números aleatorios y, posteriormente, como antítesis una segunda serie igual a la primera con signo contrario. Esta técnica no sólo permite ahorrar en la generación de números aleatorios sino que también calcula probabilidades de elección con una varianza menor.

MODELOS

DE



TRANSPORTE

En el caso del MNP, en el que interesa evaluar la probabilidad de que la utilidad de la alternativa elegida sea mayor que la de las restantes opciones en el conjunto de elecciones disponibles para cada individuo, el límite a* vale cero y el límite b* es infinito. La función de verosimilitud es, como de costumbre, el producto de las probabilidades de cada evento por separado. Se han escrito programas experimentales para estimar modelos probit mediante el simulador GHK en GAUSS (Aptech Systems, 1994), que han sido validados mediante ejercicios de simulación (ver p. ej., Munizaga et al., 1997). Cabe destacar que (al igual que para el modelo Logit Jerárquico), el problema de optimización a resolver en este caso no es necesariamente convexo, por lo que la convergencia al óptimo global no está asegurada. Dentro de las rutinas que ofrece GAUSS, el método de Newton-Raphson resultó ser el más robusto en términos de convergencia (aunque es algo lento) y el más rápido, aunque no siempre converge, resultó ser el algoritmo de Berndt-Hall-Hall-Hausman (Berndt et al., 1974). Otro aspecto práctico de interés es que resulta conveniente considerar primero un modelo en el que sólo se estiman los parámetros de las variables explicativas (incluso partiendo de los valores provenientes de la estimación de un MNL) y luego se reestima el modelo liberando uno a uno los parámetros relativos a la matriz de covarianza. Esto no es una estimación secuencial, ya que en la última iteración se estima el modelo completo; es sólo una estrategia para obtener el mejor punto de partida en un problema de optimización sumamente complejo en general.

8.6.

ESTIMACIÓN DEL MODELO LOGIT MIXTO DE COMPONENTES DE ERROR

El modelo logit mixto o de componentes de error (EC), ya introducido en el epígrafe 7.5.2 considera que los parámetros de gustos de los usuarios θq varían en la población con una función de densidad f(θ / τ*), donde τ* representa la media y la desviación estándar de los gustos de la población. Dado que los términos de error distribuyen IID Gumbel, las probabilidades de elección de este modelo se obtienen integrando las probabilidades de elección MNL (para un valor dado de los parámetros θ), ponderadas por la función de densidad de θ. Por tanto, si se denota la probabilidad MNL por Sjqt (θ), la probabilidad de elección EC de la alternativa Aj para el individuo q en la situación t, viene dada por:

Pjqt (T * )  ° S jqt (Q ) f (Q / T * )dQ

(8.32)



Especificación y estimación de modelos de elección discreta

Es importante destacar que en esta formulación hay dos tipos de parámetros. De una parte el vector de coeficientes θq que representa los gustos individuales, y de la otra los parámetros τ* asociados a la distribución de estos gustos en la población (es decir, la media y la covarianza de θ en la población). El objetivo es, por tanto, estimar estos últimos. La estimación mediante máxima verosimilitud requiere, como en el caso del MNL, el conocimiento de la alternativa elegida (c) por una muestra de individuos. Si θ fuera conocido, la probabilidad de una secuencia de elecciones por parte de un individuo dado q sería:

Lq ( )  ” t Scqt ( ) Sin embargo, como no se conoce θq, se tiene que:

Pq ( * )  ° S q ( ) f ( /  * )d

(8.33)

y la función de log-verosimilitud de τ para la muestra viene dada por:

l ( * )  ¤ ln Pq ( * ) q

(8.34)

Puesto que la integral (8.33) no puede resolverse analíticamente, no es posible determinar su máximo exacto; como en el caso del MNP, la probabilidad tiene que ser aproximada mediante simulación, maximizado la log-verosimilitud simulada. El procedimiento es el siguiente: • Dada una serie de valores iniciales de τ*, los valores de θq se obtienen de la función de densidad f(θ / τ*). • Utilizando estos valores, se puede calcular L q(θ) como el producto de probabilidades MNL. • Este proceso se repite para varios valores de θq y el valor medio se toma como la probabilidad de elección simulada aproximada:

SPq ( * ) 

1 R ¤ Lq ( r / t ) R r 1

donde R es el número de repeticiones y θ r/t es la r-ésima extracción de f. Bajo condiciones de regularidad este estimador es consistente y asintóticamente Normal; además, cuando el número de repeticiones crece más rápidamente que la raíz cuadrada del número de observaciones, el estimador es asintótica-

MODELOS

DE

TRANSPORTE



mente equivalente al estimador de máxima verosimilitud (Hajivassiliou y Ruud, 1994). Otras propiedades útiles del estimador es ser dos veces diferenciable (lo cual ayuda en la búsqueda numérica del óptimo) y estrictamente positivo, por lo que la función de log-verosimilitud siempre está definida. La función de log-verosimilitud simulada es finalmente SLL(τ*) = Ʃqln SPq(τ*) y los parámetros estimados son los que la maximizan. Train (1998) presenta un excelente ejemplo de utilización de este modelo y ofrece un programa experimental de estimación escrito en GAUSS que puede ser descargado gratis desde su página web. Train señala que se pueden estimar modelos con funciones normales y lognormales para los elementos θq; en particular la función lognormal puede resultar útil cuando los coeficientes a estimar tienen un signo predefinido, aunque se ha demostrado que la estimación se torna más compleja en este caso. Cuando en el cálculo de las probabilidades se utilizan números pseudoaleatorios estándares, Train (1998) recomienda utilizar 1.000 repeticiones. Recientemente, sin embargo, se ha observado que las secuencias de números pseudo-aleatorias (que deberían reproducir extracciones independientes de una distribución uniforme en un intervalo unitario) no se distribuyen uniformemente en el intervalo unitario; por tanto varios investigadores han experimentado con reemplazarlas por secuencias construidas desde la teoría de los números, que se distribuyan más uniformemente. Estas secuencias de baja dispersión producen aproximaciones mucho más precisas en la integración a través del método de Monte Carlo que las secuencias estándares pseudo-aleatorias. En particular, utilizando las secuencias de Halton (Press et al., 1992), Bhat (2001) y Train (1999), reportan que con sólo 125 extracciones es posible conseguir la misma precisión que se obtiene con 2.000 extracciones de las secuencias estándar. Esto permite estimar modelos EC en un tiempo igual al 10% del tiempo requerido con el método estándar (obviamente esto también se aplica a la estimación del MNP). Las nuevas versiones de los famosos paquetes ALOGIT y LIMDEP incluyen módulos para la estimación de modelos EC mucho más rápidos que los códigos experimentales disponibles y así logran que el modelo EC sea un instrumento decididamente utilizable en la práctica.

8.7.

MODELIZACIÓN CON DATOS DE PREFERENCIAS DECLARADAS

En el Capítulo 3 se vieron con cierto detalle los procesos de diseño experimental y toma de datos PD. En el apartado 8.3 se ha señalado que los experimentos PD pueden ser instrumentales en ayudar a decidir cuál es la forma funcional más



Especificación y estimación de modelos de elección discreta

adecuada de un modelo en una situación concreta. En este epígrafe, primeramente se realizará una breve síntesis de cómo es posible utilizar el enfoque de PD para identificar la forma funcional y, posteriormente, se procederá a señalar los cambios que han de introducirse en la metodología general de modelización de elecciones discretas al utilizar datos de preferencias declaradas.

8.7.1.

Identificación de la forma funcional

La literatura sobre estimación de modelos de demanda de viajes está fuertemente orientada hacia el problema de estimar el conjunto de parámetros de un modelo dada una cierta especificación funcional; sólo ocasionalmente se estudian estructuras de modelo alternativas. Las formas funcionales favorecidas son aquellas que pueden deducirse a partir de primeros principios (económicos) y que también satisfacen la condición de ser estimables con facilidad. Por esta razón la vasta mayoría de los estudios ha considerado funciones de utilidad lineales (en los parámetros). Una notable excepción a esta regla es el uso progresivo de transformaciones en la búsqueda de la forma funcional más adecuada, pero como se trató en el apartado 8.3. en estos casos el problema computacional asociado a la estimación del modelo se incrementa enormemente. De hecho, sólo se han desarrollado métodos de estimación para el modelo MNL más simple en este caso. Por el contrario, la literatura sobre procedimientos de medición en psicología que utilizan datos de laboratorio o de entrevistas, ha estado durante largo tiempo profundamente interesada en la forma funcional (Louviere, 1988a). En estos estudios se pide a los individuos que realicen juicios sobre alternativas hipotéticas. Por ejemplo, en un contexto de elección de modo se puede pedir que seleccionen la alternativa preferida entre un conjunto hipotético de opciones, que jerarquicen las alternativas o que asocien un nivel de utilidad a cada una de ellas. Debido a que se puede solicitar que cada individuo realice un número amplio de juicios en una única entrevista, el diseñador del experimento puede investigar, por ejemplo, los efectos en la respuesta debidos a cambios en una variable mientras se mantienen constante las restantes. Esto permite un análisis mucho más detallado de la forma funcional, ya que el analista casi puede trazar la forma de la respuesta ante cada variable. Un descubrimiento muy interesante de estos estudios es que, para cualquier decisión dada, las formas funcionales tienden a ser bastante estables en la población, aun cuando los valores de sus parámetros puedan variar ampliamente (Meyer et al., 1978).

MODELOS

DE



TRANSPORTE

Supóngase que el comportamiento de viaje está influido por un conjunto de factores independientes que pueden ser de naturaleza cuantitativa o cualitativa. Siguiendo la notación de Lerman y Louviere (1978), se denota al conjunto de J factores cuantitativos para la opción Ai como S i = {Sji}, y al conjunto de L factores cualitativos como Qi = {Q ji}. El número total de factores es K = J + L, y el vector completo de atributos X i = {X ki} es simplemente Si y Qi Supóngase también que cada factor tiene asociado un cierto valor (que puede obtenerse por algún procedimiento de medición) y que la utilidad de este valor es percibida por el individuo como uki = f ki(X ki), donde f es una función de percepción. Considérese ahora un contexto experimental en el que se observan las respuestas a la combinación de (S1i,…,SJi; Q1i,…,QLi) en una escala psicométrica. Si se supone que esta medida de la respuesta está relacionada con la utilidad Ui de la opción Ai mediante alguna regla de combinación algebraica, se puede escribir:

U i  g i (u1i ,L , uKi )

(8.35)

Finalmente si se postula que el vector de respuestas Ui = {Ui} está relacionado con el comportamiento observado (no experimental) B mediante otra función algebraica, se puede escribir: B = h(Ui)

(8.36)

B  h [ g ; f (S,Q) =]

(8.37)

y sustituyendo se obtiene:

Como ésta es una formulación demasiado general para propósitos de modelización, en aplicaciones prácticas se deben realizar hipótesis sobre las funciones f, g y h, y deducir sus consecuencias. El elemento crítico de este enfoque para desarrollar una forma funcional adecuada es la especificación de la ecuación (8.35). Se pueden probar formas alternativas, tales como las formas lineales o multiplicativas, y seleccionar alguna mediante análisis de varianza. Sin embargo, para su aplicación exitosa se deben satisfacer dos condiciones: en primer lugar, el patrón de significación estadística de las respuestas de utilidad a varias combinaciones de las variables independientes, debe ser de una naturaleza determinada, con objeto



Especificación y estimación de modelos de elección discreta

de permitir la diagnosis o comprobación de la forma del modelo. En segundo lugar, debe existir la correspondiente evidencia gráfica que apoye la diagnosis o la comprobación. Ejemplo 8.7: considérese un modelo de localización residencial, en el cual se supone que los individuos comparan de forma independiente el coste total del viaje (incluyendo tiempos de viaje) con el precio de la vivienda, es decir, se supone que combinan los efectos de ambas variables linealmente. Esta hipótesis se puede comprobar directamente mediante análisis de varianza. Suprimiendo el índice i correspondiente a cada opción por mayor simplicidad, se puede escribir:

U mn  U m1 U n2  mn donde Ukl son los valores de utilidad asignados al nivel l del factor k en un diseño factorial, Umn indica la utilidad total asignada por los individuos a la combinación de niveles de ambos factores y εmn es un término aleatorio con media igual a cero. Una comprobación de la independencia de los dos efectos es el test de significación del efecto de interacción U m1 U n2. Como señalaron Lerman y Louviere (1978), en un análisis de varianza éste es un test global para todas las interacciones posibles entre ambas variables. De esta forma si el efecto de interacción no es significativo no puede rechazarse la hipótesis nula de que la forma lineal es apropiada. Por otro lado, si la interacción es significativa, implica que una simple combinación lineal no es apropiada. Este test debe acompañarse de un gráfico de la interacción. Si la hipótesis lineal (sin interacción) es correcta, los datos aparecerán como una serie de líneas paralelas al representarse contra los valores de utilidad. Puede demostrarse que esto es siempre cierto independientemente de la forma supuesta para las relaciones marginales (8.35). También puede demostrarse que esto se cumple para cualquier modelo multilineal de utilidad y para cualquier forma menos restrictiva que la simple suma o multiplicación.

8.7.2. Datos PD y modelización de elecciones discretas Hay dos características particulares de los datos PD que conducen a métodos de análisis diferentes de los que se utilizan con otras fuentes de datos desagregados. La primera es el hecho de que cada encuestado puede contribuir con más de una observación, y la segunda tiene que ver con las diferentes formas

MODELOS

DE



TRANSPORTE

en que se pueden expresar las preferencias. En el Capítulo 3 se mencionó que hay tres tipos principales de respuestas PD: escalamientos, jerarquizaciones y elecciones. En el primer caso, se pide a los encuestados que puntúen cada opción utilizando un número entre 1 y 5 ó 10. El resultado de este ejercicio puede interpretarse como una medida de la preferencia del individuo hacia cada alternativa. Por ello, se pueden efectuar operaciones algebraicas normales, como extraer un ratio o restar una de otra. Sin embargo, actualmente se considera que este tipo de experimentos PD son débiles, ya que no existe evidencia que apoye el que las preferencias individuales puedan ser trasladadas a escalas cardinales de este tipo. Tareas más simples y más fiables son pedir a los individuos que jerarquicen las alternativas según orden de preferencia o que realicen elecciones entre alternativas hipotéticas. En el caso de los experimentos de jerarquización, el individuo ordena un conjunto de N alternativas en orden de preferencia. Si ri indica la alternativa colocada en la posición i, esta respuesta implica que:

U (r1 ) r U (r2 ) r L r U (rN )

(8.38)

En los ejercicios de elección, sólo se pide únicamente al individuo que seleccione la opción preferida entre las alternativas (dos o más) del conjunto de opciones. La respuesta corresponde al método habitual PR de elección discreta, excepto en el hecho de que tanto las alternativas como las elecciones, son hipotéticas. Este tipo de ejercicio puede ampliarse permitiendo que los encuestados expresen su grado de confianza en la elección señalada. Con este fin se presenta al encuestado una escala semántica, típicamente de cinco puntos (1: definitivamente prefiero la primera opción; 2: probablemente prefiero la primera opción; 3: indiferente; 4: probablemente prefiero la segunda opción; 5: definitivamente prefiero la segunda opción). Este ejercicio también se denomina a veces escalamiento (rating) en la literatura especializada, aunque realmente es una generalización del experimento de elección (ver Ortúzar y Garrido, 1994b; Pearmain et al., 1991). Esta generalización tiene ventajas y desventajas; por un lado permite aplicar a los datos un rango más amplio de técnicas de modelización. Por otro lado, sin embargo, puede debilitar la especificidad de la elección y de la respuesta, aumentando la diferencia entre experimento y comportamiento. Teniendo en cuenta las ventajas que ofrecen las especiales características de los datos PD, existen cuatro amplios grupos de técnicas para el análisis:

 1. 2. 3. 4.

Especificación y estimación de modelos de elección discreta

Métodos gráficos o intuitivos. Ajuste de mínimos cuadrados, incluyendo regresión lineal. Escalamiento no métrico. Análisis logit y probit.

Estos métodos se pueden utilizar para llevar a cabo diferentes niveles de análisis en los experimentos PD. En general todos ellos intentan establecer ponderaciones asignadas a cada uno de los atributos en una función de utilidad (indirecta) estimada para cada alternativa. Estas ponderaciones o pesos se denominan a veces “pesos de preferencias”, “componentes de la utilidad” o simplemente “coeficientes” asociados a cada atributo. Una vez que estas “componentes de utilidad” han sido estimadas, se pueden emplear con distintos propósitos: a) Determinar la importancia relativa de los atributos incluidos en el experimento. b) Estimar el ratio en el que un atributo es contrastado con otro (un ejemplo típico es la estimación de los “valores del tiempo” si el tiempo y los atributos de coste se han incluido en el experimento). También se puede estimar el valor de otros atributos cualitativos tales como la regularidad, niveles de seguridad, etcétera. c) Especificación de funciones de utilidad para modelos de prognosis, incluyendo aspectos sobre la estructura del modelo. La naturaleza de los datos PD y los objetivos del análisis son factores determinantes en la elección de las técnicas de estimación de modelos. 8.7.2.1.

Métodos intuitivos

Los métodos intuitivos o gráficos utilizan un enfoque sencillo basado en que en la mayor parte de los diseños cada nivel de los atributos aparece el mismo número de veces. Por tanto es posible obtener alguna indicación de la utilidad relativa de cada par atributo-nivel, calculando la media de la ordenación, escalamiento o puntuación de elección en cada opción en la que fue incluido y comparándola con medias similares para los otros niveles y atributos. El dibujo de estas medias en un gráfico a menudo ofrece indicaciones muy útiles sobre la importancia relativa de los distintos atributos incluidos en el experimento, pero como no se hace uso de ninguna teoría estadística no se dispone de una indicación sobre la significación estadística de los resultados.

MODELOS

DE



TRANSPORTE

Ejemplo 8.8: considérese un ejercicio PD en el que se comparan tres modos alternativos de transporte, un autobús tradicional diésel (DB), un minibús moderno (MB) y un tren ligero eléctrico (LRT). Los atributos incluidos en los experimentos PD son: el tiempo de viaje en vehículo IVT, la frecuencia, la tarifa y por supuesto, el tipo de vehículo. La siguiente tabla muestra los diferentes niveles especificados para cada atributo: Nivel 1

Tiempo de viaje (min)

Nivel 2

Nivel 3

25

15

35

1,30

1,00

1,50

Frecuencia (min)

5

10

20

Tipo de vehículo

DB

LRT

MB

Tarifa (£)

Se utiliza un diseño factorial fraccional y se pide a los encuestados que puntúen las alternativas (con el valor 10 como el mejor servicio). Los resultados son los siguientes:

Tiempo de viaje

Tarifa

Frecuencia

Tipo de vehículo

Puntuación

25

1,30

5

DB

8

25

1,00

10

MB

9

25

1,50

20

LRT

4

15

1,30

10

LRT

10

15

1,00

20

DB

7

15

1,50

5

MB

8

35

1,30

20

MB

4

35

1,00

5

LRT

4

35

1,50

10

DB

1

Con esto es posible calcular un valor “intuitivo” para cada atributo, calculando la puntuación media para ese nivel y atributo y comparándola con la diferencia de los valores. Por ejemplo, para el caso de tiempo de viaje se puede construir la siguiente tabla:



Especificación y estimación de modelos de elección discreta

Nivel tiempo de viaje

Valor (min)

Diferencia de valores

Puntuación media

Diferencias puntuación

Puntuación por minuto

1

25



21/3





2

15

–10 (2 – 1)

25/3

4/3 (2 – 1)

–4/30

3

35

+20 (3 – 2)

9/3

–16/3 (3 – 2)

–16/60

y en el caso de las tarifas: Nivel tarifa

Valor (£)

Diferencia de valores

Puntuación media

Diferencias puntuación

Puntuación por £

1

1,3



22/3





2

1

–0,3 (2 – 1)

20/3

–2/3

2,22

3

1,5

0,5 (3 – 2)

13/3

–7/3

–14/3

A partir de estos valores se puede estimar el valor subjetivo del tiempo de viaje (SVT) como sigue: SVT = (–16/60)/(–14/3) = 0,0571, que es la relación de puntuaciones por minuto entre puntuaciones por £. El lector puede calcular los valores subjetivos de la frecuencia y del tipo de vehículo de la misma forma. Este ejemplo tan sencillo ofrece dos reflexiones interesantes: los valores del tiempo, o de otros atributos, dependen de la ‘diferencia’ considerada; por ejemplo, desplazarse de 15 a 25 minutos no produce el mismo SVT que desplazarse de 25 a 35 minutos. La segunda reflexión es que se han estimado los valores de los coeficientes utilizando las puntuaciones producidas por un único encuestado; como cada entrevista genera varias observaciones, en muchos casos se pueden estimar modelos basados en los individuos en lugar de basados en una muestra de ellos. Este método “intuitivo” raramente se utiliza en la práctica excepto para estimar rápidamente indicadores como el valor del tiempo y tener una validación inicial in situ de un experimento. Sin embargo, este ejemplo ha servido para ilustrar algunas de las ideas que subyacen en el análisis de datos PD. 8.7.2.2.

Modelos de elección discreta con datos de escalamiento

El profesional que realiza un análisis con datos de escalamiento trata de encontrar una relación cuantitativa entre el conjunto de atributos y las respuestas expresadas en una escala. Para ello necesita asociar un valor numérico Rm a

MODELOS

DE



TRANSPORTE

cada punto m (m = 1,…, M) de la escala y a continuación formular un modelo lineal, tal como: θ0 + θ1 X1 + θ2 X2 + … + θK Xk = rj

(8.39)

donde θ0 es una constante, X k es normalmente la diferencia entre los atributos k de las dos opciones en competencia para la situación considerada, θk es el coeficiente de X k y rj representa la respuesta del individuo j, en la escala numérica Rm. Cuando se completa el cuestionario, el analista obtiene los valores deseados de la variable dependiente Rm, y conociendo los valores de los atributos X k puede realizar un análisis de regresión múltiple para estimar los valores de θk. Para ello se pueden utilizar los métodos de mínimos cuadrados ordinarios o ponderados y mínimos cuadrados generalizados. Una de las ventajas de utilizar estas técnicas es la posibilidad de obtener indicadores de la bondad del ajuste y medidas del grado de significación de los parámetros del modelo. El principal problema de esta metodología es que hay innumerables escalas numéricas que pueden asociarse a la escala de respuestas. Puede ocurrir que los resultados del análisis (coeficientes estimados, sus ratios y la bondad del ajuste) dependan de la definición de Rm, lo que da a entender la importancia de elegir correctamente la escala. Este tema será discutido con mayor detalle cuando se considere el análisis generalizado de los datos de elección. 8.7.2.3.

Modelos de elección discreta con datos de jerarquización

Los datos de jerarquización u ordenación son más sencillos y fiables que los correspondientes a escalamiento. En este análisis los individuos deben decir si prefieren la alternativa A a la C y la C a la B, con mayor confianza y consistencia que la que puedan tener al asignar puntuaciones a cada alternativa. Existen varias formas de explotar los datos de ordenación. El análisis monotónico de la varianza o MONANOVA (Kruskal, 1965) ha sido utilizado durante muchos años como un método para escalamiento noparamétrico. MONANOVA es una técnica de descomposición desarrollada específicamente para analizar el orden de jerarquización de los datos. El método estima iterativamente partes de utilidad, obteniendo de esta forma los “valores de utilidad” de cada alternativa. La primera de las estimaciones de las partes de utilidad se realiza utilizando el método simple antes analizado. Estas utilidades



Especificación y estimación de modelos de elección discreta

permiten la modelización de una jerarquía de alternativas. MONANOVA utiliza una medida de “esfuerzo” para indicar la magnitud en la que la ordenación modelizada difiere de la ordenación realmente efectuada por cada individuo. Luego intenta mejorar las estimaciones de las “utilidades parciales” para reducir el indicador de esfuerzo (o de maldad de ajuste). Al igual que el método intuitivo, MONANOVA es capaz de generar un modelo para cada individuo, pero a pesar de sus capacidades carece de un fundamento estadístico robusto y no ofrece indicadores de bondad de ajuste global y medidas de significancia. También restringe el tipo de función de utilidad que puede especificarse, y es menos apropiado para el desarrollo de modelos de prognosis. Una forma más interesante de analizar los datos de jerarquización es transformarlos en elecciones implícitas. En el caso anterior, la ordenación ACB podría convertirse en las elecciones A mejor que C, C mejor que B y A también mejor que B. Los datos así transformados pueden analizarse utilizando software de modelización de elecciones discretas logit o probit. Para el modelo logit multinomial este análisis puede llevarse a cabo a partir del siguiente teorema (Luce y Suppes, 1965):

Prob(r1 , r2 , r3 ,L)  Prob(r1 / C)Prob(r2 , r3 ,L) donde Prob(r1,r 2 ,r3,…) es la probabilidad de observar que la jerarquización indique que r1 es preferible a r2 y así sucesivamente, y Prob(r1 / C) es la probabilidad de que r1 sea elegido del conjunto de elecciones C = {r1,r2 ,r3,…}. Si el teorema se aplica sucesivamente, se consigue una expresión para la probabilidad de obtener una jerarquización en términos de N – 1 probabilidades de elección:

Prob(r1 , r2 , r3 ,L) = Prob(r1 / C)Prob(r2 / C-[r1 ])L donde, por ejemplo, C – {r1} indica el conjunto de elección excluyendo la alternativa r1. Utilizando esta teoría, Chapman y Staelin (1982) propusieron que una jerarquización de elecciones (8.38) puede “explotarse” a N – 1 elecciones estadísticamente independientes como:

(U1 r U n , n  1, 2,L , N )(U 2 r U n , n  2, 3,L , N )L (U N 1 r U N )

(8.40)

y estos datos pueden estimarse simplemente mediante una rutina de logit multinomial. Sin embargo, se debe poner especial atención con los siguientes problemas potenciales:

MODELOS

DE

TRANSPORTE



1. Como la jerarquización considera opciones hipotéticas, es probable que la información contenga algún error o sesgo. Esto puede ser especialmente grave para el caso de las alternativas menos atractivas, las cuales son tratadas usualmente con menos cuidado por los encuestados, y son agrupadas al final de la ordenación. Este tipo de comportamiento no es consistente con el axioma de la independencia de las alternativas irrelevantes del modelo logit, por lo que debe comprobarse estadísticamente. 2. Las jerarquizaciones deben construirse en orden decreciente de preferencia (de la mejor a la peor alternativa) por cada encuestado. No hacerlo así produce datos contaminados que pueden invalidar los resultados de la modelización. Ya que jerarquizar un conjunto de N alternativas es una tarea complicada en cuanto a que requiere ((N2 + N) / 2) – 1 comparaciones, usualmente se pide a los entrevistados que dividan el conjunto (normalmente de 9 a 12 alternativas) de la siguiente forma: primeramente en tres grupos (es decir, las alternativas mejores, intermedias y peores), a continuación ordenar las opciones dentro de cada grupo y finalmente intercambiar la última alternativa del primer grupo con la primera del segundo grupo, si fuera apropiado. Se ha encontrado que la utilización de este algoritmo en aplicaciones prácticas facilita de modo considerable la tarea del entrevistado (Permain et al., 1991). Algunos problemas de este enfoque han sido identificados por Ben Akiva et al. (1992). Ellos encontraron que los datos de respuesta a diferente profundidad del ranking (no expandiendo la totalidad de la ordenación o jerarquización) no eran igualmente fiables, ya que producían estimaciones de la utilidad significativamente diferentes. Sin embargo, este resultado puede depender del esmero con que se haya diseñado y llevado a cabo el experimento de PD; en efecto, Ortúzar y Palma (1992), encontraron que si se consideraba el conjunto completo de alternativas jerarquizadas, se conseguían consistentemente mejores resultados. Para tratar este problema de forma más profesional, Bradley y Daly (1994), propusieron separar los datos en N-1 grupos diferentes (n), cada uno de los cuales corresponde a un nivel de profundidad de la jerarquización (es decir, el primero contiene las preferencias individuales cuando están disponibles todas las alternativas, y así sucesivamente); una vez que los grupos están identificados, se debe efectuar una estimación conjunta considerando un factor de escala diferente para cada grupo (es decir, consistente con diferentes varianzas de los términos de error de sus utilidades). Para ello un grupo ha de definirse



Especificación y estimación de modelos de elección discreta

como de referencia y los factores de escala (μn) asociados a los otros grupos representan la relación entre la varianza del término de error correspondiente al grupo de referencia y la asociada al grupo considerado (véase la discusión del subapartado 8.7.2.7). De este modo, si la varianza del error asociada al grupo n es la misma que la del correspondiente grupo de referencia, entonces el factor de escala del grupo n será igual a uno. Bradley y Daly (1994), definieron el grupo uno arbitrariamente como grupo de referencia y obtuvieron las importantes conclusiones siguientes: 1. La magnitud de los factores de escala disminuye con la profundidad de la jerarquización (es decir, la varianza del error es mayor en el caso de las alternativas menos preferidas). 2. El modelo con diferentes factores de escala es superior al modelo logit simple; este resultado se confirmó con el test de razón de verosimilitud. 3. Los valores del test-t de las variables explicativas resultaron inferiores, en cerca de un tercio, respecto a los correspondientes valores obtenidos con el modelo logit simple (véase la discusión del subapartado 8.7.2.6). 4. Los valores subjetivos de varios atributos en su diseño experimental cambiaron hasta un 50% cuando se consideraban los factores de escala. Ortúzar y Rodríguez (2002) probaron este enfoque encontrando que, en su caso, los resultados cambiaban significativamente con el nivel de profundidad que se elegía como referencia; sin embargo, en todos los casos considerados el modelo con factores de escala fue estadísticamente superior que el modelo logit simple. Ellos consideraron un experimento PD de jerarquización diseñado para estudiar la disponibilidad a pagar por reducir la contaminación atmosférica en un contexto de localización residencial. Los atributos seleccionados fueron el tiempo de viaje al trabajo, el tiempo de viaje al estudio, el número de días de alerta ambiental en el área y el valor del alquiler del hogar. Dos resultados importantes de este estudio son: si se elige como referencia el cuarto nivel de profundidad (en vez de, p. ej., el primero), no sólo cambian los valores de los test-t (los valores de los atributos y de la log-verosimilitud en convergencia permanecieron constantes), sino también el número de factores de escala significativamente diferentes. De hecho, finalmente llegaron a la conclusión de que el modelo preferido sólo tenía dos factores de escala: las primeras tres opciones se tomaban como referencia, el segundo conjunto de cuatro alternativas presentó un alto factor de escala y las últimas tres alternativas un factor menor (es decir, próximo a uno). Esto es consistente con la forma

MODELOS

DE

TRANSPORTE



en que las alternativas fueron jerarquizadas por los individuos y sugiere que eran mucho más conscientes de las alternativas extremas que de las alternativas intermedias. 8.7.2.4.

Modelización con datos de elección PD

La utilización de datos sobre elecciones simples en PD, permite utilizar el rango completo de herramientas de análisis disponibles para la modelización de elecciones discretas en PR. Esto incluye el logit jerárquico, ya que no existe restricción a sólo dos opciones, ni se requiere que se cumpla la propiedad IIA para explotar los datos en forma completa. Una diferencia interesante entre los datos de elección de PR y PD, es que estos últimos, por diseño, carecen de algunas fuentes de error. En particular, no hay error de medición ya que todos los valores de los atributos se presentan a los encuestados (aunque puede haber algunos problemas de percepción). No obstante, ya se han discutido otras características de las encuestas PD que debilitan el valor de los datos en términos de comportamiento: falta de realismo en el contexto de decisión, artificialidad de las alternativas y la diferencia entre puntuar, jerarquizar o elegir una alternativa determinada. Dejando aparte el error de especificación, que todavía es claramente aplicable, hay otra fuente potencial de graves errores relacionada con la respuesta en sí misma. Aunque los resultados prácticos son generalmente positivos, en el sentido de sugerir que la mayor parte de los encuestados entiende lo que se espera de ellos, no existe garantía de que sean capaces de completar un experimento PD con precisión absoluta. Un estudio de Bates (1988a) discute los siguientes tipos de error potencial, aplicables a todas las clases de datos PD: 1. Fatiga del encuestado, que obviamente aumenta con la complejidad del diseño experimental (ver la discusión en el Capítulo 3); 2. Sesgo de política, que puede ocurrir si el encuestado está interesado en influir en el resultado del análisis; 3. Sesgo de auto-selectividad, cuando inadvertidamente o a propósito los encuestados eligen de modo que su comportamiento existente parezca más racional. Como consecuencia de lo antedicho, puede existir error de medida en la variable dependiente, es decir, en lugar de obtener una verdadera estimación de la utilidad U, se está obteniendo una pseudo-utilidad Ü que puede enlazarse con la formulación general (7.2) mediante:



Especificación y estimación de modelos de elección discreta

U i  Vi i  U&&i  i

(8.41)

Suponiendo que τi es homocedástico (aunque es posible que su varianza varíe entre experimentos debido a fatiga o aprendizaje), la estimación de los parámetros de V no presenta graves problemas, ya que la expresión (8.41) puede escribirse como:

U&&i  Vi ( i  i )

(8.42)

y puede utilizarse la metodología habitual de estimación. El problema surge cuando se desean realizar prognosis, ya que en ese caso interesa efectuar estimaciones de U, y lo que se obtiene al aplicar este modelo son estimaciones de Ü siempre que se aplique la misma distribución de errores que en el año de diseño. En otras palabras: … estamos realizando estimaciones de las preferencias relativas tal y como se expresan en un experimento de Preferencias Declaradas en vez de lo que ocurriría en el mercado (Bates, 1988a).

La única forma de solventar este problema es tomando en cuenta el error entre εi y τi mediante la utilización de datos de PD y PR para estimar los modelos; este problema es similar al de utilizar datos agregados en la estimación de modelos, problema que se tratará en el Capítulo 9. Bates (1988a) indica que tener una idea de la magnitud de τi es de crucial importancia para el uso de datos PD en la prognosis. Únicamente si es insignificante en relación con εi podrían utilizarse para la prognosis los modelos estimados directamente de datos PD. Esto sugiere tener especial cuidado en el diseño de experimentos PD a fin de reducir la fatiga del encuestado, mejorar el realismo, prevenir los sesgos de respuestas políticas y minimizar el sesgo de autoselectividad. No obstante el problema continúa siendo serio normalmente, por lo que la práctica corriente recomienda la estimación mixta con datos PR siempre que sea posible (Bradley y Daly, 1997). 8.7.2.5.

Estimación de modelos con datos de elección generalizada

En el caso de encuestas de elección generalizada o extendida, se permite al encuestado expresar el grado de confianza en sus elecciones. Si se utiliza la modelización logit convencional, se pueden estimar dos modelos, uno incluyendo sólo las respuestas “definitivamente elijo la opción A” y otro inclu-

MODELOS

DE

TRANSPORTE



yendo también las respuestas “probablemente elegiría la opción A”, y comparar los resultados e indicadores de bondad de ajuste y significación de los parámetros. Alternativamente, se puede investigar en más profundidad cuál es la mejor transformación de la escala semántica a una escala numérica, en el sentido de producir los mejores modelos posibles. Muchos profesionales han usado la siguiente escala simétrica: R1 = 2,197, R2 = 0,847, R3 = 0,000, R4 = –0,847, R5 = –2,197, que corresponde a la transformación Berkson-Theil de las siguientes probabilidades de elección: 0,1; 0,3; 0,5; 0,7; 0,9 (ver, p. ej., la revisión de Bates y Roberts, 1983) y se ha transformado en casi la práctica estándar en el área de transporte. Sin embargo, ésta no es necesariamente la escala más “apropiada” para un estudio concreto, y es importante investigar si la selección de escala tiene un efecto significativo en los resultados del análisis. Garrido (1992) demostró que dependiendo de los valores de los atributos de cada opción y de las características socioeconómicas de los individuos, es posible generar grandes diferencias en los ratios de coeficientes (tales como el valor subjetivo del tiempo), utilizando escalas diferentes. Ejemplo 8.9: un grupo de empleados y estudiantes participan en un experimento PD comparando dos opciones en el siguiente contexto: viaje por la mañana de casa al trabajo (unos 10 km), con elección entre autobús y metro ligero (opción que todavía no existe en la actualidad). Para mayor simplicidad, el diseño experimental consideraba solamente cuatro atributos: • • • •

Coste de viaje (variando en tres niveles). Tiempo de viaje (variando en dos niveles). Distancia andando (variando en tres niveles). Tiempo de espera, estimado como la mitad de la frecuencia de transporte público (variando en dos niveles).

De esta forma se tenía un diseño factorial 32 × 22 y al estudiarse únicamente los efectos principales, sólo se necesitaban nueve opciones (Master Plan 3, columnas 1, 2, 7, 8; ver Kocur et al., 1982). La siguiente tabla muestra las diferencias de atributos (en vez de sus valores absolutos) entre las dos opciones. El diseño (en cuanto a las opciones presentadas), se basó en combinaciones de estas diferencias. Esto supone implícitamente que el modelo resultante será genérico (es decir, el mismo coeficiente del tiempo en vehículo para cada modo), pero reduce el tamaño del diseño.



Especificación y estimación de modelos de elección discreta

Nivel de diferencia de atributos

Atributos del autobús menos atributos del LRT

Bajo

Medio

Alto

Coste de viaje ($)

–10

60

80

Tiempo en vehículo (min)

15

25

na

Distancia andando (manzanas)

–7

–3

0

Frecuencia (min)

–3

2

na

Considérense ahora las cuatro escalas de probabilidad definidas en la siguiente tabla: Escala 1

Escala 2

Escala 3

Escala 4

R1

0,100

0,010

0,300

0,200

R2

0,300

0,400

0,450

0,400

R3

0,500

0,500

0,500

0,500

R4

0,700

0,600

0,850

0,880

R5

0,900

0,990

0,950

0,970

La siguiente tabla presenta los SVT (ratios de los coeficientes de las variables de tiempo y coste) derivados de los modelos estimados después de aplicar la transformación de Berkson-Theil a las cuatro escalas de probabilidad: Valor del tiempo

Escala 1

Escala 2

Escala 3

Escala 4

4,01

1,73

3,98

4,11

Tiempo de espera

20,68

18,67

23,89

23,24

Tiempo andando

23,68

21,63

24,91

24,74

0,48

0,44

0,46

0,45

Tiempo en vehículo

R

2

Como puede verse, la selección de la escala influye en los resultados de la modelización. Los valores del SVT no sólo difieren sino que corresponden a modelos con diferente ajuste a los datos. Además, las diferencias no parecen depender de si la escala es simétrica o no. Aunque se puede esperar que una escala simétrica (como las escalas 1 y 2 del ejemplo) produzca resultados más razonables, los modelos ajustados y los valores estimados del SVT rechazan este concepto.

MODELOS

DE



TRANSPORTE

Una forma de evitar el problema anterior, es considerar un enfoque en el que el analista no deba especificar una escala numérica a priori para estimar el modelo. McKelvey y Zavoina (1975) desarrollaron un enfoque con estas características, denominado “probit ordinal”. Su base teórica se resume a continuación. Sea Yj una variable que representa el grado de preferencia de una opción sobre otra para un individuo j( j = 1,…,n) en una situación presentada en un experimento de escalamiento (si A y B son un par de opciones comparadas, Yj representaría cuánto más es A preferible a B o viceversa). Supóngase también que esta variable satisface el siguiente modelo lineal: Yj = X jθ + εj

(8.43)

donde X j es el vector K-dimensional de las variables independientes (atributos de los individuos y de las alternativas) para el individuo j; θ es un vector K-dimensional de coeficientes del modelo y εj es un término de error con distribución normal de media cero y matriz de covarianza σ2I, donde I representa la matriz unidad. Sin embargo, no es posible medir el valor real de Yj con las técnicas de medición disponibles. Sólo es posible observar una versión ordinal de esta variable, Zj, que no satisface el modelo lineal (8.43). Supóngase que la variable Zj tiene M categorías de respuesta, R1, R2,…, R M, y que éstas están relacionadas con la variable no observable Yj como se explica a continuación. En primer lugar, supóngase que μ0, μ1,…,μM son M + 1 números reales que cumplen: μ0 = – ∞ μM = + ∞ Además, estos números deben satisfacer también la siguiente condición: μ 0 = μ1 ≤ … ≤ μM–1 ≤ μM de forma que: Zj ū Rm › μm–1 < Yj ≤ μm para 1 ≤ j ≤ n

(8.44)

Como Zj es ordinal puede representarse por un conjunto de variables dummy:

«1 si Z j  Rm para 1 b j b n, 1 b m b M Z jm  ¬ ­0 en otro caso



Especificación y estimación de modelos de elección discreta

Por otra parte, las expresiones (8.43) y (8.44) permiten escribir la función de probabilidad de la variable dependiente observada Zj directamente:

para 1 b m b M y 1 b j b n K

 m 1  Y j   m š  m 1  ¤ k X kj  j   m

(8.45)

k 0

K

š

 m 1 ¤ k X kj k 0



K

 k X kj  j m ¤ k 0    

donde X0j toma el valor de 1 (es decir, θ0 es una constante específica). Ahora, como εj tiene una distribución normal, se puede escribir: K ¥ 

 k X kj ¤ m ¦ k 0 Pr ( Z jm  1)  Pr ( Z j  Rm )   ¦  ¦¦ §

K ¥ ´   k X kj

¤ m

1 ¦ µ k 0 µ  ¦  ¦¦ µµ § ¶

´ µ µ µµ ¶

(8.46)

donde ϕ(·) es la función normal estándar acumulada. Cualquier transformación lineal de la variable no observable Yj, aplicada a la serie de μm conduce exactamente al mismo modelo (8.46). Sin pérdida de generalidad, se puede asumir que μ1 = 0 y que σ = 1 para identificar los coeficientes finales del modelo: K K ¥ ´ ¥ ´ Pr( Z jm  1)   ¦  m ¤ k X kj µ  ¦  m 1 ¤ k X kj µ k 0 k 0 § ¶ § ¶

(8.47)

El problema del calibrado consiste en la estimación de los M + K – 1 coeficientes μ2,…,μM–1, θ0,…,θK. Información adicional sobre el modelo, el proceso de calibrado y algunas estadísticas asociadas a su desarrollo se puede encontrar en McKelvey y Zavoina (1975), Terza (1985) y Johnson (1990), mientras que Hensher (1991) y Ortúzar y Garrido (1994a) presentan aplicaciones del probit ordinal en el campo de los transportes. Si no se dispone de una rutina de estimación del probit ordinal, se puede estimar la escala de respuesta durante el proceso de ajuste del modelo, considerando cada valor de la escala como una variable adicional. En este caso se utiliza un método de búsqueda, empezando con la escala simétrica 1 del ejemplo 8.9. El procedimiento consiste simplemente en variar sucesivamente cada punto de la

MODELOS

DE



TRANSPORTE

escala (es decir Ri) en una pequeña cantidad, y estimar un modelo de regresión lineal con los nuevos valores. Este proceso continúa hasta que se maximice R2 y se fije el valor de Ri. El procedimiento se repite para cada punto de la escala (salvo para R3 que siempre se mantiene en 0,5) en una rutina iterativa, hasta que se encuentre el mejor ajuste en cada caso (aquel con el valor más alto de R2). Finalmente se repite el proceso para comprobar las diferencias. Ortúzar y Garrido (1994a) señalaron que esta búsqueda nunca lleva más de dos iteraciones antes de converger, pero no pudieron probar la existencia de una solución global óptima. Ejemplo 8.10: la siguiente tabla muestra la escala simétrica original y las escalas obtenidas después de aplicar la anterior “metodología de regresión lineal de la escala óptima” para dos muestras del experimento de escalamiento del ejemplo 8.9. Escala

Inicial

Estudiantes

Personal

R1 R2 R3 R4 R5

0,1 0,3 0,5 0,7 0,9

0,284 0,286 0,500 0,714 0,900

0,228 0,278 0,500 0,722 0,842

El resultado sugiere la posibilidad de probar si el número original de puntos de la escala semántica es adecuado. Si se utilizara un único valor para los dos primeros puntos de la escala en los modelos de escala óptima (que parecen muy cercanos) sería interesante examinar las consecuencias que tiene esta aparente pérdida de información. En la parte positiva, una escala de cuatro puntos tiene un parámetro menos que estimar. La tabla siguiente muestra los valores óptimos de la nueva escala obtenida cuando R1 y R2 son reemplazados por un solo punto R1'. En esta escala, al igual que en la anterior, el valor de probabilidad de R3 fue fijado en 0,5, ya que corresponde al punto de indiferencia entre ambos modos. Escala

Estudiantes

Personal

R1' R3 R4 R5

0,277 0,500 0,716 0,899

0,121 0,500 0,776 0,922



Especificación y estimación de modelos de elección discreta

Como puede verse, los valores de escala en ambas muestras están más alejados que en la tabla anterior, lo que indica que no es necesario ningún otro punto de fusión. Todos los valores parecen razonables en términos relativos, es decir, se corresponden con valores crecientes de probabilidad desde R1' hasta R5. 8.7.2.6.

Interacciones e independencias en la modelización de PD

A continuación se consideran dos problemas importantes. El primero se refiere a una ventaja potencial, aunque raramente consumada, del enfoque de PD, tal es la posibilidad de estimar modelos con funciones de utilidad no-lineales. La razón para no hacer esto en la práctica ha sido, como es usual, la falta de conveniencia. Los experimentos de PD que permiten la incorporación de interacciones y no sólo efectos principales, son más complejos de diseñar y analizar, y requieren información que es más difícil de recolectar. El segundo problema tiene que ver con una de las fuentes de atracción más importantes del enfoque (la generación de múltiples respuestas por entrevistado), y se refiere al hecho de que en casi todas las aplicaciones prácticas hasta la fecha se han considerado las respuestas de un individuo en particular como independientes entre sí, además de independientes de las del resto de los individuos en la muestra. Aunque este problema ha recibido mayor atención últimamente, no es bien conocido fuera del ámbito de la investigación correspondiente al estado del arte y sólo recientemente ha sido resuelto de forma satisfactoria. Interacciones y efectos principales En modelos de elección discreta, gran cantidad de formas potenciales de la función de utilidad pueden transformarse (en última instancia usando aproximaciones de series) en formas aditivas lineales en los coeficientes del tipo:

V  1 X 1  2 X 2 3 X 12  4 X 1 X 2  5 X 1 X 23  6 X 1 X 2 X 3 donde los Xi son atributos y los θi coeficientes a estimar. Esta función contiene términos lineales (θ1 X1 y θ2 X2), no-lineales (θ3X 12), interacciones con efectos lineales (θ4 X1 X2 y θ6 X1 X2 X3) e interacciones generales (θ5X1 X 23). Los efectos principales pueden ser definidos como la respuesta de pasar al siguiente nivel de la variable cuando el resto de los atributos permanece constante (ceteris paribus); normalmente se postula que éstos son los principales determinantes de cambios en la elección. De hecho, de acuerdo a Louviere (1988):

MODELOS

DE

TRANSPORTE



• Los efectos principales explican el 80% o más de la varianza de los datos. • Las interacciones de a pares raramente explican más del 2 o el 3% de la varianza. • Las interacciones entre tres términos explican proporciones aún menores de la varianza, normalmente del orden del 0,5 al 1% y raramente más del 2 ó 3%. • Los efectos de orden superior explican una proporción minúscula de la varianza. Por lo tanto, en la práctica normalmente sólo se consideran los efectos principales. Además, existe consenso en que tanto las interacciones entre más de dos variables, como las que incorporan efectos no-lineales, debieran ser insignificantes. Así, las interacciones de pares de variables están en una especie de limbo y requieren mayor atención. Es importante destacar que si las interacciones son efectivamente insignificantes, un modelo que incluya sólo efectos principales permitirá obtener mediciones precisas de las preferencias individuales. Sin embargo, si son significativas y no se incluyen, se tenderá a atribuir erróneamente sus efectos a las variables simples (Kocur et al., 1982). Por otro lado, y como veremos más adelante, puede suceder que al incluirlas, sus efectos dominen a los de ciertas variables individuales hasta el punto de que éstas deban salir de la regresión (p. ej., por resultar con un coeficiente no significativo o con signo contrario al de la intuición). Como se señaló anteriormente, el coste de permitir interacciones en un diseño experimental es precisamente su complejidad (requiere que los entrevistados evalúen mayor cantidad de situaciones hipotéticas) y, de hecho, si el número de atributos y sus niveles no se mantienen bajo un cierto máximo, el diseño puede volverse impracticable. Como se podrá observar, la mejor solución en este caso consiste en usar diseños de bloques donde sólo se presenta una fracción del total de situaciones hipotéticas a distintas submuestras de la población de interés. Se supone que al considerar el total de las respuestas se obtendrán modelos de preferencias consistentes. Para asegurar que las respuestas sean compatibles, cada submuestra debe tener un tamaño tal que permita asegurar la representatividad de sus características socioeconómicas; así, se ha sugerido un mínimo de 30 miembros por grupo en la literatura (Kocur et al., 1982) pero, como se verá, este tamaño parece demasiado bajo en la práctica.



Especificación y estimación de modelos de elección discreta

Ejemplo 8.11: se ha diseñado un experimento PD de escalamiento utilizando una escala semántica de cinco puntos para la elección entre viajar en coche solo y compartir coche (car-pool) por parte de estudiantes de un campus universitario (Ortúzar et al., 2000c). Tras una extensiva fase de piloteo, se seleccionaron los siguientes atributos: • Tiempo de viaje diario: éste era siempre mayor para car-pool, ya que el alumno que dispusiera de coche en ese día debía recoger a cada miembro del grupo por la mañana y llevarlo de regreso a su casa por la tarde. • Coste de viaje semanal: asociado al consumo de combustible y estimado en base a información sobre distancias de viaje y tipo de coche (en algunos casos este valor incluía un coste de estacionamiento); el valor para car-pool era siempre menor ya que los conductores no necesitan usar su coche cada día de la semana en este caso. • Tiempo de espera: asociado a compartir el viaje con un grupo en el caso del car-pool; la espera se debe a que el sistema propuesto consideraba que el grupo completo llegaba y se iba del Campus a la misma hora, y no todas las horas de salida coinciden; se debe notar que este tiempo puede usarse en otras actividades, porque tanto su duración como el día en que sucede, se conocen de antemano dados los horarios fijos de la universidad. Los niveles de los atributos fueron definidos en base a la diferencia entre viajar en coche y car-pool, usando valores que coincidieran con la experiencia de los encuestados. Se definieron dos niveles para el tiempo de viaje (10 y 20 min. más que en el caso del car-pool), cuatro niveles para el coste de viaje (tres cuartos y la mitad del coste del coche en el caso del car-pool, y 40 y 25% más que ese coste si se incluía un cobro de estacionamiento) y tres niveles para el tiempo de espera. En este último caso los niveles se determinaron en base a la posibilidad de que los horarios de los miembros del grupo no coincidieran, y se consideraron tiempos de espera de cero, 30 min (un miembro necesitaba hacer una pequeña diligencia) y 90 min (un módulo de clase completo). Aunque estos atributos y niveles permiten cubrir las diversas situaciones hipotéticas que podrían surgir en un sistema de car-pool, tienen la potencial desventaja de que las variables con más niveles podrían ser percibidas como más importantes por los encuestados (Wittink et al., 1982). Por otro lado, tres atributos parecen ser un mínimo obvio para estudiar si existen efectos de interacción. Con todo lo anterior se requerirían 16 situaciones hipotéticas para estimar solamente efectos principales y 24 si también se deseara estimar todas las inter-

MODELOS

DE



TRANSPORTE

acciones de a pares (Kocur el al., 1982). Dados estos números, se debería usar un diseño de bloques en ambos casos; de hecho se probó si se podían usar 16 opciones directamente, encontrándose que esto confundía/aburría a los encuestados produciendo demasiadas inconsistencias. Esto ratifica lo expuesto por Carson et al. (1994), quienes encontraron que debido a la fatiga los entrevistados tendían a simplificar su forma de elegir concentrándose en un número menor de atributos o simplemente contestando al azar. Para la modelización se comenzó por hacer un estudio de los signos esperados para los términos de interacción (dadas las especiales características de las opciones en competencia), concluyéndose que su definición más adecuada era la siguiente: • T*C: interacción entre los ratios de tiempo y coste de viaje; su coeficiente debería ser mayor que cero:

T*C =

Tiempo de viajecoche Costecp Tiempo de viajecp Costecochhe

• W*T: interacción entre las variables tiempo de espera para car-pool y el ratio de los tiempos de viaje para ambos modos; su coeficiente debería tener signo negativo:

W*T = Tiempo de espera cp

Tiempo de viajecp Tiempo de viajecocche

• W*C: interacción entre tiempo de espera en car-pool y el ratio del coste de viaje para ambos modos; su coeficiente debiera ser negativo:

W*C = Tiempo de espera cp

Costecp Costecoche

La tabla 8.7 presenta dos modelos probit ordinal obtenidos bajo la hipótesis tradicional de que las observaciones correspondientes a cada individuo eran independientes. Como se puede ver, en el primero (denominado mejor modelo) las únicas variables no significativas al 95% de confianza son Sexo (variable muda que vale uno para hombres) y Tiempo de espera; si la última se eliminase, porque su efecto es considerado en condiciones de fuerte interacción, el modelo mejoraría (modelo preferido). La variable Inercia vale uno si



Especificación y estimación de modelos de elección discreta

el entrevistado era usuario de car-pool en la realidad y g es la tasa de gasto (razón entre el ingreso y el tiempo libre de cada individuo, ver, p. ej., Jara-Díaz y Ortúzar, 1989). Tabla 8.7.

Modelo probit ordinal considerando interacciones

Atributos (test-t)

Mejor modelo

Modelo preferido

Ctte. específica coche

1,65418 (9,89)

1,68808 (10,17)

Tiempo de viaje (min)

–0,00311 (–4,57)

–0,00343 (–5,30)

Tiempo de espera (min)

–0,00363 (–1,53)



Coste/g (min)

–0,06729 (–7,54)

–0,06930 (–7,83)

0,11021 (1,92)

0,11372 (1,98)

–0,40907 (–6,57)

–0,41113 (–6,61)

Sexo Inercia car-pool T*C

0,70067 (9,67)

0,73763 (10,73)

W*T

–0,00629 (–2,11)

–0,01038 (–8,04)

W*C

–0,00124 (–3,32)

–0,00157 (–4,92)

0,543

0,541

1.640

1.640

R

2

Tamaño muestra

A fin de verificar la importancia relativa de las interacciones en la función de utilidad, se calculó el producto del valor promedio de cada variable normalizada por su coeficiente, encontrándose que las interacciones eran sin ninguna duda importantes, especialmente T*C. Este procedimiento fue confirmado con el cálculo de elasticidades de la probabilidad de escoger coche frente a varios cambios en el valor de los atributos (Ortúzar et al., 2000c). El problema de observaciones repetidas Una característica importante de los datos de PD es que se obtienen múltiples respuestas por individuo. El problema es que el estado actual de la práctica supone que éstas son independientes, apareciendo el concepto de pseudoindividuos. Claramente esta hipótesis no puede ser válida, pero no se sabe bien cómo afecta a los modelos estimados. Durante muchos años se creyó/esperó que el problema estuviera limitado a obtener valores sesgados hacia arriba de las razones-t asociadas a los parámetros estimados. De esta forma, la solución había consistido en proponer la aplicación de factores de corrección, tales

MODELOS

DE



TRANSPORTE

como el inverso de la raíz cuarta del número de observaciones por individuo (esto es, el número 1/1,73 para el diseño clásico con nueve situaciones hipotéticas), a las razones-t resultantes; esto tiene el mismo efecto que incrementar el valor crítico de significancia estadística al 95% de confianza, de 1,96 a 3,39 (Gálvez, 1989). En los últimos años se han propuesto, y probado parcialmente, enfoques más interesantes. Por ejemplo, Cirillo et al. (2000) proponen usar técnicas de remuestreo, como Bootstrap y Jackknife (Shao y Tu, 1995), que pueden ser apropiadas cuando no es posible obtener analíticamente un estimador insesgado de un estadígrafo y su varianza. Cirillo et al. (2000) encontraron que los parámetros estimados usando Jackknife no cambiaban mucho y que aun cuando los test-t disminuían, de acuerdo a lo esperado, no lo hacían tanto como sugiere el factor de corrección simple anterior. Los resultados Bootstrap eran similares pero tenían más ruido, particularmente en el caso de estrategias de remuestreo bajas. Ortúzar et al. (2000c) probaron las técnicas de Bootstrap y Jackknife (con todas sus variaciones en el remuestreo) con cuatro muestras diferentes. El descubrimiento quizás más interesante fue que, por ambos métodos y en todos los casos considerados, los valores de los parámetros eran prácticamente idénticos a los estimados con el enfoque tradicional. Sin embargo, sus errores estándares variaron de modo inconsistente; en efecto, en tres casos crecieron correctamente, pero en el otro caso decrecieron. Ellos estudiaron a fondo las muestras para descartar la existencia de valores atípicos u observaciones especiales (outliers) o de peculiaridades en los valores estimados originalmente. Por estos motivos, Ortúzar et al. (2000c) se vieron forzados a concluir que la aplicación de estas técnicas para solucionar el problema de las observaciones repetidas necesitaba aún ulteriores estudios. Outwerslot y Rietveld (1996) e independientemente Abdel-Aty et al. (1997), sugirieron descomponer el error total ε de un modelo de utilidad aleatoria en dos partes mutuamente excluyentes: un efecto individual específico, que distribuye de forma independiente entre individuos (ηit) y un efecto observaciónespecífico (μit) que distribuye independiente entre individuos y observaciones. Con esto, la formulación del término de error viene dada por: εit = ηit + μit conduciendo a una integral múltiple difícil de evaluar. Si hay N individuos y T observaciones por persona, se debe evaluar N veces una integral T-variada.



Especificación y estimación de modelos de elección discreta

Para evitar este problema, los autores usan un método de mínima distancia propuesto por Chamberlain (1984) que considera dividir la muestra en T submuestras independientes seleccionadas al azar, ninguna de las cuales contiene más de una observación por persona. Los coeficientes de los modelos estimados para cada submuestra son utilizados posteriormente en un algoritmo bastante complejo para obtener los valores finales de los parámetros y sus varianzas. Contrariamente a lo esperado, Outwerslot y Rietveld (1996) encontraron que los parámetros de su modelo probit cambiaban (aunque menos de 27%) si bien las razones t se mantenían prácticamente invariantes. Yen et al. (1998) desarrollaron un método para tratar el problema utilizando una versión dinámica generalizada del modelo probit ordinal, que permite incorporar una medida de la correlación entre las respuestas de un individuo en particular. Desafortunadamente ellos no estaban interesados en efectuar comparaciones, por lo que no se sabe si existen diferencias entre sus estimaciones y los resultados de una aplicación estándar del probit ordinal. Más recientemente se ha propuesto que, en este caso, la estimación puede ser tratada como un modelo logit mixto, como el propuesto en (8.32). Ejemplo 8.12: utilizando cuatro muestras diferentes Ortúzar et al. (2000c) examinaron el comportamiento del enfoque de Outwerslot y Rietveld (1996). La aplicación del método de mínima distancia puede dividirse en dos partes; la primera consiste en estimar una matriz de parámetros de gustos parciales θt, correspondiente a las T submuestras donde cada individuo está representado por una sola observación; esto requiere corregir los datos para garantizarlo (recordar que algunas observaciones son normalmente eliminadas en las pruebas de consistencia). Un problema importante es que el proceso puede generar muestras que no tengan suficientes observaciones para estimar un modelo en algunos casos. La segunda parte consiste en estimar los parámetros de mínima distancia (MD) en base a los valores anteriores; el proceso completo, que es bastante complejo, fue implementado en Gauss. También se estimaron modelos para la base de datos corregida usando el enfoque tradicional, a fin de tener valores similares para efectuar la comparación. Se encontró que en el enfoque MD la mayoría de los parámetros decrecía (a veces de forma considerable), pero que también en algunos casos crecían. Respecto a las razones-t, se observó que en general decrecían de acuerdo a lo esperado, pero no siempre, particularmente en el caso de las constantes específicas. En la tabla 8.8 se resumen estos resultados.

MODELOS

DE



TRANSPORTE

Ortúzar et al. (2000c) también probaron la hipótesis nula de que la correlación entre pseudo-individuos no afectaba a la estimación del modelo utilizando un test χ2 ad hoc (Chamberlain, 1984). En particular, los resultados mostraron que el test no podía rechazarse al 95% de confianza en el caso de dos muestras de elección modal interurbana, pero era claramente rechazado en el caso de las dos restantes. Tabla 8.8.

Comparación entre los resultados de la estimación con mínima distancia y el método tradicional

Coeficiente (test-t)

Método tradicional

Método mínima distancia

Elección modo interurbano (a) Con acceso al coche Constante del tren

1,5468

(4,75)

1,5357

(6,81)

Tarifa

–0,0020

(–18,04)

–0,0017

(–9,57)

Tiempo de viaje

–0,0235

(–4,00)

–0,0171

(–3,62)

Tiempo de espera

–0,0256

(–2,83)

–0,0284

(–3,50)

(b) Sin acceso al coche Constante del tren

1,6547

(6,58)

1,5028

(9,87)

Tarifa

–0,0018

(–22,47)

–0,0017

(–11,73)

Tiempo de viaje

–0,0146

(–3,24)

–0,0132

(–3,92)

Tiempo de espera

–0,0255

(–3,76)

–0,0216

(–3,75)

Elección modo urbano Constante del Metro ligero

0,5922

(2,30)

0,4843

(3,15)

Coste de viaje

–0,0214

(–9,98)

–0,0107

(–5,94)

Tiempo de viaje

–0,0506

(–4,14)

–0,0233

(–2,56)

Tiempo de espera

–0,0765

(–2,85)

–0,0321

(–2,43)

Tiempo a pie

–0,3445

(–14,26)

–0,1983

(–10,44)

Elección ruta interurbana Constante de camino secundario

–0,2348

(–1,51)

–0,3689

(–2,91)

Peaje

–0,0016

(–13,45)

–0,0012

(–8,81)

Tiempo de viaje

–0,0621

(–5,64)

–0,0337

(–4,27)

Distancia

–0,0366

(–5,32)

–0,0495

(–8,41)

 8.7.2.7.

Especificación y estimación de modelos de elección discreta

Estimación de modelos con datos conjuntos PD y PR

Considérese el modelo MNL (7.9) y la relación inversa que tiene su parámetro β con la desviación típica σ de los residuales Gumbel ε. Esta relación explica por qué no es correcto postular la misma distribución de errores para la estimación y la prognosis, como se ha mencionado anteriormente. Las dos utilidades en la ecuación (8.41) debieran proporcionar valores diferentes de β. Esto produce diferencias de “escala” en los parámetros y si inadecuadamente se supone el cumplimiento de esta igualdad se puede terminar estimando pseudo-utilidades, en vez de las utilidades “verdaderas”. Para evitar este problema hay que ajustar los datos PD al comportamiento real, explotar las ventajas que tienen los datos PR en este sentido y estimar los parámetros θ conjuntamente. En econometría, la estimación de modelos con datos provenientes de fuentes diferentes se denomina “estimación mixta”. Estos datos se dividen frecuentemente en dos conjuntos: datos primarios y secundarios. Los datos primarios dan información directa sobre los principales parámetros de la modelización. Los datos secundarios ofrecen información adicional (indirecta) sobre los parámetros. Por ejemplo, en la modelización de elecciones discretas, los datos primarios pueden ser la información que se obtiene de una encuesta a nivel desagregado, y los secundarios, los datos provenientes de una encuesta agregada. En nuestro caso, los datos PR constituyen el conjunto primario, ya que reflejan el comportamiento real de los individuos y los datos PD constituyen el conjunto secundario. Se utilizará el marco desarrollado por Ben Akiva y Morikawa (1990). Este marco postula que la diferencia entre los errores de los datos PD y PR puede representarse como una función de las varianzas de cada tipo de error ε y η, como sigue:

 2   2 2

(8.48)

donde μ es un coeficiente de escala desconocido. Esta formulación conduce a las siguientes funciones de utilidad, para una cierta alternativa Ai:

U iPR   XiPR  YiPR  i

U iPD   ( XiPD  ZiPD i )

(8.49)

donde α, ϕ y θ son parámetros a estimar. X PR y X PD son los atributos (de las alternativas y los individuos) para los niveles PR y PD respectivamente. YPR y Z PD son atributos que sólo pertenecen a uno de los conjuntos, PR o PD (notar que el vector X está presente en ambos tipos de datos).

MODELOS

DE



TRANSPORTE

La consideración de las funciones de utilidad (8.49) permite homogeneizar el tipo de error ya que la multiplicación de los parámetros PD por μ hace que su error estocástico asociado tenga la misma varianza que el correspondiente error PR. Se espera, en condiciones normales, que los datos PD tengan más sesgos que los datos PR. Por ello μ debería tomar valores entre cero y uno. Si no sucede así, se puede suponer que los datos PR tienen más problemas, comprobándose este hecho reestimando un modelo con la estructura inversa. Luego, suponiendo que ambos errores estadísticos tienen una distribución Gumbel con media cero pero varianza diferente, las probabilidades de elección se obtendrían de la siguiente expresión (Morikawa et al., 1992):

Pi

PR



Pi PD 

e(

¤ e

¤

 XiPR  YiPR )

e( j

 XiPR  Y PR j )

 ( XiPD  ZiPD )

j

e

(8.50)

 ( XiPD  ZiPD )

de estas expresiones es posible obtener la siguiente función de verosimilitud conjunta: N PD ¥ N PR gin ´ gin ´ ¥ L(, M, , )  ¦¦ ” ”  PiqPR µµ * ¦¦ ” ”  PiqPD µµ § n 1 Ai A ( n ) ¶ § n 1 Ai A ( n ) ¶

(8.51)

que debe maximizarse para obtener los parámetros estimados. NPR y NPD son el número de observaciones en PR y PD, respectivamente, y gin vale uno si el individuo n elige Ai y cero en otro caso. La expresión (8.51) es una función no lineal, ya que μ multiplica no sólo a los atributos, sino también a los parámetros PD. El procedimiento de estimación es simplemente un problema de investigación operativa. Un método para resolver este problema es la aplicación de software especialmente diseñado para tratar funciones de verosimilitud no lineales. Sin embargo, este tipo de paquetes de cálculo es normalmente escaso; por ende, sería muy útil encontrar una técnica que permitiera estimar estos modelos mediante los programas de análisis de elecciones discretas más fácilmente disponibles. Se pueden mencionar al menos dos métodos apropiados para realizar esta tarea: la estimación simultánea (Bradley y Daly, 1997) y la estimación secuencial (Ben Akiva y Morikawa, 1990).



Especificación y estimación de modelos de elección discreta

Método de estimación secuencial. Este método tiene la ventaja de permitir el uso de software habitual de estimación logit y probit. El algoritmo es el siguiente: Paso 1: estimar el modelo PD según la ecuación (8.49) para obtener los estimadores μθ y μϕ. Definir una nueva variable de la siguiente forma: Vˆ iPR = μθXiPR

(8.52)

Paso 2: estimar el siguiente modelo PR incluyendo la nueva variable, con objeto de calcular los parámetros λ y α: UiPR = λVˆ iPR + αYiPR + ūi

(8.53)

donde λ = 1/μ. Paso 3: multiplicar X PD y Z PD por μ para obtener un conjunto de datos PD modificado. Juntar los datos PR con los PD modificados y estimar el modelo mixto conjuntamente. Método de estimación simultáneo. Este método, desarrollado por Bradley y Daly (1997), consiste en construir un árbol artificial que tiene dos veces tantas alternativas como existen en la realidad. La mitad de éstas se denominan alternativas PR y la otra mitad alternativas PD. Las funciones de utilidad son UPR y UPD [ver la expresión (8.49)]. Como se indica en la figura 8.3, las alternativas PR se colocan directamente bajo la raíz del árbol, mientras que las alternativas PD se sitúan cada una en un nido con una única alternativa. Para una observación PR, las alternativas PD no están disponibles y la elección se modeliza como en un modelo logit estándar. Para una observación PD, Raíz

PR1

PR2 PR3

Alternativas Dummy

PD1

PD2 PD3

Figura 8.3. Estructura de árbol artificial para estimación conjunta PD y PR.

MODELOS

DE



TRANSPORTE

las alternativas PR no están disponibles y la elección se modeliza mediante una estructura logit anidada (en árbol). Para las observaciones PD, la utilidad media de cada una de las alternativas ficticias compuestas se calcula de forma habitual (Daly, 1987):

V COMP   log ¤ eV

PD

(8.54)

donde la suma se lleva a cabo para todas las alternativas en el nido correspondiente a la alternativa compuesta, y la expresión: VPD = UPD = –η = θX PD + ϕZ PD

(8.55)

es simplemente la parte medible de la utilidad PD. Como cada nido contiene únicamente una sola alternativa en esta especificación: VCOMP = μVPD = μθX PD + μϕZ PD

(8.56)

Y se obtiene exactamente la forma requerida mientras el valor de μ esté restringido a ser el mismo para cada una de las alternativas ficticias. Como las alternativas ficticias compuestas están colocadas justo debajo de la raíz del árbol al igual que las alternativas PR, un procedimiento de estimación estándar asegurará que μ se estima para obtener varianza uniforme a este nivel. Esta construcción artificial no requiere la hipótesis usual de consistencia del modelo logit jerárquico, que μ no exceda la unidad, ya que no se modeliza a los individuos de forma que éstos puedan elegir entre todo el conjunto de alternativas. Sin embargo, como se mencionó anteriormente, el valor de μ puede tomarse como una indicación de la precisión de cada conjunto de datos. Es interesante citar que existe una tercera alternativa para tratar la estimación con datos mixtos PR/PD, que es algo más compleja que las tratadas líneas atrás pero que ofrece la ventaja de ser ligeramente más general. Para mayor información revisar (Swait y Louviere, 1993; Swait et al., 1994). Para concluir este análisis, es importante mencionar que Ben Akiva y Morikawa (1997), a partir de varios casos estudiados, han demostrado la evidencia empírica de dependencia entre estados y correlación serial entre datos PR y PD. También encontraron que los métodos PD pueden proporcionar estimaciones sesgadas de los parámetros si los datos PD contienen información implícita de preferencias reveladas: el sesgo encontrado en ese caso de estudio fue bastante preocupante ya que el atributo clave (aumento del número de vagones de tren



Especificación y estimación de modelos de elección discreta

con elevado estándar) obtuvo un coeficiente con signo equivocado. Para corregir este sesgo se recomendaron dos métodos. El primero consiste en introducir variables dummy de inercia que representen las elecciones reales en el modelo PD. Tales dummy absorben los factores no-observados ligados a las preferencias de ciertas alternativas respecto a otras, y por lo tanto el término de error restante estará menos correlacionado con las variables explicativas y las estimaciones de los coeficientes no resultarán sesgadas. El segundo consiste en considerar la correlación serial entre los términos de error de los modelos PR y PD. El incluir las dummy de inercia al mismo tiempo es un método efectivo para lidiar con la dependencia de estado. El método de Ben Akiva y Morikawa (1997) considera también la correlación serial inherente a las respuestas repetidas en datos PD, problema que fue discutido en el epígrafe 8.7.2.6. Ejemplo 8.13: considérese nuevamente el experimento descrito en el ejemplo 8.9. Además de los datos PD, se recogió también información sobre las elecciones efectuadas por los participantes, sus características socioeconómicas y el nivel de servicio de las alternativas PR de su conjunto de elecciones. Se estimaron modelos mixtos con los dos métodos antes descritos. Su especificación final consideró las variables Coste del viaje, Tiempo a bordo y Tiempo de espera como atributos comunes a ambos conjuntos de datos (es decir, el vector X definido más arriba). Las variables Tiempo andando, Edad y una constante específica del LRT fueron consideradas como atributos exclusivos PD, mientras que una constante específica del autobús se consideró como atributo exclusivo PR (éstos son los dos vectores Y y Z definidos anteriormente). La tabla 8.9 muestra los parámetros obtenidos para cada modelo puro, esto es, tomando los conjuntos de datos PR y PD separadamente. Dicha tabla presenta también los valores subjetivos (SV) del tiempo, calculados de la forma habitual (Gaudry et al., 1989). Se puede observar que todos los parámetros tienen signo correcto y que la mayor parte de ellos son estadísticamente significativos (se muestran los estadísticos t entre paréntesis) al 95% de confianza. Aunque todos los parámetros PD tienen los test-t más elevados que los correspondientes parámetros PR, esto no implica necesariamente que sean más significativos realmente, ya que el tamaño de la muestra es diferente (1.589 observaciones PD frente a 201 observaciones PR); recuérdese también que el valor de t en los datos PD constituye sólo un umbral de la significación, pero no es su valor exacto. El modelo PR no tiene parámetro de tiempo andando, ya que el conjunto de datos

MODELOS

DE



TRANSPORTE

Tabla 8.9.

Parámetros de los modelos puros Modelo PD

Modelo PR

Coste de viaje (US$)

Atributos

–0,8840 (–7,7)

–1,1900 (–3,8)

Tiempo de viaje en vehículo (min)

–0,0621 (–6,2)

–0,0879 (–3,2)

Tiempo andando (min)

–0,1583 (–12,6)

no disponible

Edad

–0,0434 (–5,4)



Tiempo de espera (min)

–0,0926 (–2,0)

–0,1260 (–2,4)

Constante PT

–0,5410 (–1,7)

1,1100 (2,8)

VS del tiempo de viaje (US$/h)

4,21 (4,9)

4,43 (2,4)

VS del tiempo andando (US$/h)

10,74 (6,6)

no disponible

VS del tiempo de espera (US$/h)

6,29 (1,9)

6,35 (2,0)

ρˉ 2

0,17

0,12

Tamaño de la muestra

1.589

201

PR no contenía este atributo. El parámetro de la edad terminó siendo poco significativo. En cuanto a la bondad de ajuste general, se puede observar que el coeficiente ρ2 de ambos modelos es relativamente alto. El valor del tiempo de viaje es similar (y significativo) en los dos modelos. El valor del tiempo de espera presenta, por el contrario, grandes diferencias. La tabla 8.10 presenta los parámetros obtenidos para los modelos mixtos utilizando los dos enfoques presentados anteriormente. De nuevo, todos los parámetros tienen el signo correcto y la mayoría son significativamente distintos de cero al 95% de confianza. Se puede observar que el coeficiente de escala μ estimado es menor que uno (como se esperaba) y altamente significativo, confirmando la hipótesis de que los datos PD tienen menos precisión que los datos PR. Notar, además, que el ratio entre los parámetros comunes PD y PR de la tabla 8.9 (el vector X) fluctúa entre 0,6 y 0,74, lo que es consistente con el valor de μ obtenido con ambos enfoques (Ortúzar y Garrido, 1993). Existe una gran similitud en los valores de cada parámetro en la tabla 8.10. Esto confirma empíricamente que ambas metodologías de estimación conjunta producen estimadores consistentes. Sin embargo, el método secuencial obtiene parámetros con estadísticos t más altos. Esto puede ser debido al hecho de que el método de estimación simultánea utiliza el mismo tamaño de muestra para



Tabla 8.10.

Especificación y estimación de modelos de elección discreta

Parámetros de los modelos mixtos Método secuencial

Método simultáneo

Coste de viaje (US$)

Atributos

–1,2580 (–8,4)

–1,2580 (–4,3)

Tiempo de viaje en vehículo (min)

–0,0912 (–7,8)

–0,0921 (–4,2)

Tiempo andando (min)

–0,2286 (–12,9)

0,2261 (–3,8)

Tiempo de espera (min)

–0,1353 (–3,1)

–0,1423 (–3,0)

Edad

–0,0596 (–6,9)

–0,0627 (–3,3)

Constante LRT

–0,4377 (–1,6)

–0,7377 (–1,6)



1,143 (3,3)

0,686 (4,9)

0,694 (4,0)

Constante autobús μ VS del tiempo de viaje (US$/hr)

4,35 (5,7)

4,39 (3,0)

VS del tiempo andando (US$/hr)

10,98 (7,0)

10,78 (2,8)

VS del tiempo de espera (US$/hr)

6,45 (2,9)

6,79 (2,5)

0,175

0,165

1.790

1.790

ρˉ

2

Tamaño de la muestra

estimar (conjuntamente) más parámetros. La bondad de ajuste general es también más alta en el método secuencial, lo que resulta algo sorprendente. Todos los valores subjetivos del tiempo en ambas tablas son significativamente diferentes de cero con un nivel de confianza del 95%. Además son muy similares entre ellos (incluyendo los valores correspondientes en los modelos puros de PD y PR, lo que no es muy corriente). De hecho se han observado grandes diferencias en estudios previos; por ejemplo, Bradley y Daly (1997) obtuvieron diferencias entre los valores VS del modelo PD y los valores VS del modelo mixto, y entre los valores VS del modelo PR y los valores VS del modelo mixto, de hasta 48,6 y 57,8% respectivamente. El análisis de preferencias declaradas ha alcanzado una cierta madurez, pero es todavía un área en constante desarrollo. Actualmente los académicos y profesionales consideran este análisis una metodología necesaria para ampliar el conjunto de herramientas del analista de comportamientos de viaje. Se señala al lector interesado la existencia de varias publicaciones dedicadas a estos temas (Bates, 1988b; Louviere, 1992; Hensher, 1994b; Ortúzar, 2000; Pearmain et al., 1991) así como de un excelente libro (Louviere et al., 2000). Para obtener información adicional deben consultarse estos trabajos, ya que el

MODELOS

DE



TRANSPORTE

problema más preocupante del éxito de este tipo de técnicas es el número cada vez mayor de aplicaciones mal diseñadas, que pueden arruinar la reputación de incluso las mejores metodologías.

EJERCICIOS 8.1. Considérese el siguiente modelo de elección modal:

V1 = Q1t1 + Q3c1 + Q4 Nc + Q7 V2 = Q1t2 + Q2 e2 + Q5c2 + Q8 V3 = Q1t3 + Q2 e3 + Q6 c3 donde tk es el tiempo de viaje en vehículo, e k es el tiempo de acceso, c k es el coste dividido por el ingreso y Nc es el número de coches del hogar. a) Indicar qué variables son genéricas, cuáles son específicas y cuál es el significado real de θ7 y θ8. b) Discutir las implicaciones de haber obtenido los siguientes valores durante la estimación del modelo: θ1 = –0,115

θ2 = –0,207

θ3 = –0,301

θ4 = 1,730

θ5 = 0,476

θ6 = –0,301

θ7 = –1,250

θ8 = 2,513

8.2. Durante los trabajos de especificación se ha obtenido el conjunto de modelos de reparto modal para coche (1), autobús (2) y metro (3) mostrado en la tabla siguiente. Las unidades de tiempo y de coste/renta están en minutos. El sexo es una variable ficticia que toma el valor de 1 para hombres y 0 para mujeres. EMU es la máxima utilidad esperada del nido de transporte público (autobús-metro). a) Indicar el modelo preferible, justificándolo detalladamente. b) La muestra utilizada para la estimación comprendía 1.000 individuos que tenían disponibles todas las alternativas. Si 250 eligen coche, 600 eligen autobús y el resto metro, calcular l*(0), el valor del logaritmo de la verosimilitud para el modelo equiprobable, y l* (C), el logaritmo de la verosimilitud sólo para las constantes modelizadas.



Especificación y estimación de modelos de elección discreta

Coeficiente (test-t)

Variable (opción introducida)

MNL-1

MNL-2

HL-1

HL-2

Tiempo de coche (1)

–0,112 (–6,10)



–0,114 (–6,00)



Tiempo de transporte público (2, 3)

0,006 (1,25)



–0,001 (–0,94)





–0,071 (–3,34)



–0,083 (–3,60)

Coste/renta (1-3)

–0,031 (–2,56)

–0,040 (–3,52)

–0,035 (–2,83)

–0,033 (–3,10)

Nº de coches (1)

1,671 (4,21)

1,823 (4,80)

1,764 (4,12)

1,965 (5,14)

Sexo (2,3)

–0,752 (–1,87)

–0,776 (–1,98)

0,739 (–2,01)

–0,701 (–1,83)





0,875 (5,12)

0,800 (13,4)

0,412

0,284

0,376

0,315

Tiempo de viaje (1-3)

EMU ρ2

8.3. Se debía estimar un modelo logit multinomial (MNL) y un modelo probit independiente (PI) con el mismo conjunto de datos. Imagínese (ya que no es posible estimar σ en la práctica) que se obtienen los valores señalados en la siguiente tabla: Parámetros

MNL

PI

θ1

1,285

1,698

θ2

–0,026

–0,034

θ3

–0,123

–0,162

σ2

No aplicable

2,870

Indicar si estos resultados son consistentes. Si su respuesta es afirmativa, explicar cuál es la causa de las diferencias. Si es negativa, justificarlo. 8.4. Al llevar a cabo una encuesta PD se ha solicitado a tres individuos que ordenen tres opciones cuyos atributos son los siguientes:

MODELOS

DE



TRANSPORTE

Opción

Tiempo de viaje (min)

Tarifa ($)

1. Tren de alta velocidad

30

10

2. Tren expreso

40

8

3. Autobús de lujo

60

5

Después de realizar la encuesta, se han obtenido los siguientes resultados: Individuo

Ordenación

1

1, 2, 3

2

2, 3, 1

3

2, 1, 3

Se desea estimar un modelo MNL con una función de utilidad lineal, dada por:

Vi = Q1ti + Q2 ci Si se conoce que θ1 = –0,03, encontrar una estimación de máxima verosimilitud de θ2. Discuta el resultado.

9. Agregación de modelos y transferibilidad 9.1.

L

INTRODUCCIÓN

a planificación y evaluación de proyectos de transporte requiere modelos que sean capaces de realizar previsiones así como sus correspondientes análisis de sensibilidad con respecto a cambios en los valores de las variables clave bajo control del analista. Las previsiones en sí normalmente se realizan a nivel agregado, es decir, representando el comportamiento de una población completa o un segmento del mercado. En muchos de los estudios prácticos realizados hasta finales de los 90, los modelos utilizados han sido los clásicos agregados de cuatro etapas a pesar de las numerosas (a veces justificadas) críticas acerca de su inflexibilidad, inexactitud y coste. Una razón importante para seguir utilizándolos, aparte de su familiaridad (han sido la práctica aceptada durante muchos años), es que ofrecen una herramienta para el proceso de modelización completo, desde la recogida de datos hasta el cálculo de las previsiones de flujos en los arcos de una determinada red. Esto no siempre ha sido así en el caso de los modelos desagregados quizás porque no es fácil disponer de los datos necesarios para hacer previsiones agregadas con ellos (véase la discusión en Daly y Ortúzar, 1990). Dentro de una interpretación econométrica de los modelos de demanda, la agregación respecto de los factores no observables (atributos o características personales) proporciona como resultado un modelo de decisión probabilística y la agregación sobre la distribución de los factores observables da como resultado las relaciones convencionales a nivel macro o agregadas (Williams y Ortúzar, 1982b). Dicho así, la dificultad del problema de agregación depende de cómo se describen los componentes del sistema dentro del marco de referencia teórico utilizado por el modelizador; es este marco el que va a determinar el grado de variabilidad que debe ser tenido en cuenta en una relación causal. Por



Agregación de modelos y transferibilidad

ejemplo, si el marco utilizado por el analista es el proporcionado por el enfoque de maximización de la entropía, como se trató en el Capítulo 5, la explicación de la dispersión estadística dentro de una serie de datos dada, va a ser muy diferente a la proporcionada por otro modelizador que utilice un enfoque de utilidad aleatoria, incluso si ambos llegasen a funciones modales similares; este tema de la equifinalidad se discute en Williams (1981). En el caso de los modelos desagregados de utilidad aleatoria el problema de la agregación es cómo obtener a partir de los datos a nivel individual, medidas agregadas como son el reparto de mercado de los diferentes modos, los flujos en los arcos, etc. Esto se puede conseguir de una o de dos formas, situando el proceso de la agrupación de datos individuales antes o después de la estimación del modelo, tal y como se muestra en la figura 9.1. Datos relativos a los individuos

Estimación de micro-modelos probabilísticos

Producción de variables relativas a grupos

Agregación de micro-relaciones

Agregación de macro-relaciones

Métodos alternativos Producción de previsiones agregadas

Figura 9.1. Estrategias alternativas de agregación.

En el primer caso se tienen variaciones del enfoque agregado clásico, que se pueden criticar fácilmente por ser ineficientes en el uso de los datos, ya que no tienen en cuenta su total variabilidad y por el riesgo de distorsión estadística como la falacia ecológica discutida en la sección 7.1. El segundo enfoque responde a la mayoría de estas críticas; la cuestión pendiente es cómo llevar a cabo exactamente la operación de agregación de las micro-relaciones. Daly y Ortúzar (1990) han estudiado con bastante profundidad el problema de la agregación de datos exógenos y concluyen que en el caso de los modelos

MODELOS

DE



TRANSPORTE

que representan el comportamiento de más de un individuo (tal y como es la situación del modelo agregado clásico) es inevitable algún tipo de agregación de datos exógenos y, por tanto, la pregunta es ¿hasta qué grado se desea más exactitud? (es decir, zonas más pequeñas). Sin embargo, cuando el modelo representa el comportamiento de un solo individuo es posible obtener datos exógenos para cada viajero y usarlos de forma separada, así que la cuestión en definitiva es si es preferible utilizar datos menos exactos por razones de coste u otras razones; sus resultados apoyan la idea de que el equilibrio entre coste y exactitud depende fuertemente del contexto. Por ejemplo, está claro que para la modelización de la elección de modo y para realizar previsiones a corto plazo es deseable utilizar datos muy desagregados; sin embargo, como se sabe, el tema se complica para otros contextos y prognosis a más largo plazo. En los dos apartados siguientes se estudian con más detalle los sesgos de la agregación y los métodos adecuados para realizar prognosis.

9.2.

SESGOS DE AGREGACIÓN Y PROGNOSIS

Sea el modelo logit multinominal (MNL) (7.9) que se derivó en el epígrafe 7.3 y la relación inversa (7.10) que su parámetro β tiene con la desviación estándar σ de los residuos ε. Si también se considera la forma lineal típica (7.3) para las utilidades medibles V, es fácil ver que no se puede estimar β separadamente del parámetro θ; de hecho el proceso de calibración producirá estimaciones ϕ = βθ

(9.1)

que corresponden a las utilidades marginales θ deflectadas por σ. Interesa examinar el efecto de la manera en que se calculan, miden o codifican los atributos x (o por lo menos algunos de ellos) sobre las funciones de demanda estimadas. Como es usual, se va a suponer que el modelo MNL (7.9) está correctamente especificado (es decir, no hay variaciones de gustos o problemas de correlación). Supóngase ahora que se va a sustituir uno de los atributos, por ejemplo, x1, por una estimación agregada z1, donde: xli = zli + τ1

(9.2)

y los τ i están distribuidos Gumbel (0, σ τ); entonces sustituyendo (7.3) y (9.2) en (7.2) se llega a:



Agregación de modelos y transferibilidad

U i  1 z1i ¤  k xki  i k

(9.3)

donde el término de error δi tiene una varianza (θ12 σ2τ + σ2). En este caso las estimaciones del coeficiente no serán

k 

K k 

(9.4)

como antes, donde K   6 , sino

k 

K k (12 2  2 )

(9.5)

Es decir, ψk ≤ ϕk , k. Normalmente, esto se conoce como sesgo de agregación, por ello se recomienda que se evite, siempre que sea posible, el uso de variables medias zonales para la estimación de modelos de demanda desagregados (véase, p. ej., Horowitz, 1981a). El análisis anterior puede extenderse para examinar las consecuencias de estos sesgos en las predicciones, como se puede observar en el siguiente ejemplo tomado de Gunn (1985a). Ejemplo 9.1: sea un escenario de elección modelizado para un MNL como el (7.9) y supóngase que el atributo x1j se duplica, ceteris paribus, para cada alternativa (incluyendo la distribución de los residuales estocásticos). Está claro que ni θ ni σ estarían afectados si el modelo fuera re-estimado con un nuevo banco de datos conteniendo un conjunto consistente de elección; es decir, los valores ϕ del contexto original realizarían predicciones de forma satisfactoria en el nuevo contexto. Considérese ahora lo que sucedería si después de duplicar x1j, cada uno de estos valores fuera reemplazado por su estimación agregada z1j (p. ej., la media zonal). Se obtendría la ecuación (9.3) de nuevo, pero la varianza de δi ahora sería (θ12 4σ2τ + σ2); en otras palabras, si el modelo fuera re-estimado con los nuevos datos proporcionaría coeficientes con un valor esperado dado por

 k' 

K k 2 1

( 4 2  2 )

(9.6)

en que ψk > ψk' y el ψ produciría predicciones más grandes que las que serían normales bajo estas condiciones. Alternativamente, las políticas de reducción de

MODELOS

DE



TRANSPORTE

atributos implicarían subpronósticos del modelo calibrado con datos agregados (véase Ortúzar e Ivelic, 1987).

9.3.

MÉTODOS DE AGREGACIÓN

Mientras un modelo desagregado permite estimar las probabilidades de elección individual, usualmente se está más interesado en la prognosis del comportamiento de viajes agregados. Si el modelo de elección fuera lineal, el proceso de agregación sería trivial, ya que solamente habría que sustituir la media de las variables explicativas para el grupo dentro de la ecuación del modelo desagregado; como ejemplo, véase la agregación de modelos de viajes basados en el hogar en el Capítulo 4. Sin embargo, si el modelo no fuera lineal, este método, denominado agregación intuitiva, normalmente produciría sesgos tal y como se muestra en la figura 9.2. La probabilidad agregada correcta para un grupo de dos individuos A y B es (PA + PB)/2; el método intuitivo proporciona la probabilidad PC = P[(VA + VB)/2]. Como puede verse, si el modelo fuera lineal los dos valores coincidirían. Los modelos de elección discreta como los que se han tratado pueden representarse de forma general así:

Pjq  f j (x q ) Pq

1 B

Sesgo

C A VA

VA + VB 2

VB

Vq

Figura 9.2. Sesgo del método de agregación intuitivo.



Agregación de modelos y transferibilidad

donde Pjq es la probabilidad de que el individuo q elija la alternativa Aj, xq es el conjunto de variables que influyen en su decisión, y f j es la función de elección para Aj (p. ej., el MNL). Para una población de individuos Q la proporción agregada que elige Aj, según el modelo, es el valor esperado (o enumeración) de las probabilidades de cada individuo:

PjQ 

1 ¤ f j  xq Q q

(9.7)

Desafortunadamente este método requiere una gran cantidad de datos y mucho trabajo computacional. Sin embargo, si se acepta que la muestra utilizada para estimar el modelo es representativa de la población, se puede utilizar la ecuación (9.7) y hablar de enumeración muestral. Éste es un método práctico para conjuntos de elección de tamaño moderado y es excelente para modelos de elección modal en prognosis a corto plazo. En cambio, el método no es tan útil a largo plazo porque no permite enfrentar contextos globales que sean muy diferentes del contexto del año base (supone que la distribución de los atributos no va a diferenciarse del de la muestra en el futuro); también es incapaz de producir los flujos agregados entre zonas necesarios para la estimación de la demanda a nivel de arcos. Para tratar estos problemas puede utilizarse el enfoque de enumeración de la muestra artificial (véase Daly y Gunn, 1986). Una muestra artificial es aquella en la que las características personales de los miembros de los hogares entrevistados, que se considera son representativas de la población del área de estudio, se asocian con las características de localización de un cierto número de lugares que también se consideran típicos del área. Por lo tanto, las distribuciones marginales de ambas características (personales y de localización) son, por construcción, típicas del área de estudio: la aproximación que se propone es que la distribución conjunta de estas características puede ser representada por el producto de las dos distribuciones marginales. Dados una red, un sistema de zonificación y una serie de datos de planificación adecuados, la distribución marginal de las localizaciones puede ser la de lugares reales en el área de estudio (aquí son necesarios detalles de su accesibilidad a los destinos disponibles); en el caso de muestras grandes y si los lugares se distribuyen por todo el área del estudio, se puede tener suficiente confianza de su representatividad a nivel global (véase Gunn, 1985b).

MODELOS

DE

TRANSPORTE



Por lo que se refiere a las características personales y para conseguir un cierto realismo es necesario seguir los siguientes pasos: 1. Miembros de hogares reales se extraen aleatoriamente de un conjunto de datos representativo a nivel nacional (p. ej., del censo). 2. De cada zona del área de estudio se deben determinar diferentes factores de expansión para cada uno de estos hogares, de tal forma que la muestra expandida corresponda lo más posible a los totales agregados conocidos o previstos (es decir, de variables como el número de trabajadores, el número de individuos por estrato de sexo o edad, etcétera). 3. Los factores de expansión, o más comúnmente el número de hogares en cada grupo, se eligen de forma tal que la distribución total de los hogares en términos de una estratificación dada (p. ej., el tamaño, el número de trabajadores y la edad de la cabeza familiar), no sea demasiado diferente de la media nacional global (es necesario precisar que cuando se clasifican los datos de esta forma, existen varios estratos que no son factibles, p. ej., hogares con un solo componente y más de un trabajador). Para obtener este resultado puede ser apropiado minimizar una función objetivo como la siguiente:

¨ · S ( N i )  ¤Wk © ¤ ( X ik N i Yk ) 2 ¸ ¤ ( N i Ri ) 2 k ª i ¹ i

(9.8)

donde Ni es el número de hogares por estrato i; W k es un peso elegido para aumentar o disminuir la importancia del ajuste a la variable k ésima (p. ej., el número de trabajadores, número de hombres comprendidos entre 18 y 65 años, etc.); Xik es el valor medio de la variable k por estrato de hogares i; Y k es el valor medio (observado) de la variable k para cada zona del área de estudio y Ri es el número de hogares en el estrato i en la muestra para el año base. Tal y como se discute en Gunn (1985b), se pueden añadir otras restricciones en el proceso. La muestra artificial replica la población de cada zona en el área de estudio; por lo tanto las previsiones agregadas pueden obtenerse fácilmente aplicando a estos datos el método de enumeración. Otro procedimiento práctico, conocido con el nombre de enfoque de clasificación, consiste en aplicar la ecuación (9.7) para un número finito de clases relativamente homogéneas, de la siguiente manera:



Agregación de modelos y transferibilidad

PjQ  ¤ f j  X c c

Qc Q

(9.9)

donde Xc es la media del vector del conjunto de variables del subgrupo c y Qc/Q es la proporción de individuos en el subgrupo. La exactitud del método depende del número de clases c y de los criterios para su selección (en el límite cuando la cantidad de subgrupos es c = 1 este método coincide con el método intuitivo, y cuando c = Q es el método de enumeración). Existen buenos métodos para definir dichas clases (McFadden y Reid, 1975) y el enfoque se recomienda para casos en los que el método de enumeración muestral no sea apropiado (Koppelman, 1976). Un procedimiento obvio para definir las clases consiste en utilizar como variable para realizar la segmentación del mercado aquella que presente una varianza mayor, o también aquellas variables que limitan de alguna forma el conjunto de elección disponible de cada individuo. Por lo tanto, en el caso de elección de modo las variables adecuadas pueden ser el número de coches por hogar y la renta familiar.

9.4. 9.4.1.

ACTUALIZACIÓN O TRANSFERIBILIDAD DE MODELOS Introducción

Durante los años 80 se produjo abundante investigación científica que ofrecía evidencia empírica acerca de la estabilidad (o en la mayoría de los casos, la falta de ella) de los parámetros de los modelos desagregados de demanda de viaje a través del espacio, de las culturas y del tiempo (véase, p. ej., Gunn et al., 1985; Koppelman y Wilmott, 1982; Koppelman et al., 1985a, b). Las razones fueron sencillas: en primer lugar, la evidencia de valores estables de los parámetros estimados podría proporcionar una indicación directa de la validez del modelo; en segundo lugar, un modelo que no sea estable en el tiempo probablemente producirá previsiones erróneas; y finalmente, y no menos importante, los modelos transferibles deberían permitir un análisis más fiable de los planes y políticas del transporte. Sabiendo que es irreal esperar que un modelo operacional en las ciencias sociales esté perfectamente especificado, es bastante obvio que cualquier modelo estimado, en principio, depende del contexto. Por esta razón, no es muy útil buscar la estabilidad perfecta del modelo ni considerar su transferibilidad en términos de igualdad de los valores de sus parámetros en diferentes con-

MODELOS

DE



TRANSPORTE

textos (aunque muchos estudios al principio tenían este punto de vista; véase Galbraith y Hensher, 1982; Ortúzar, 1986). Un punto de vista moderno y más apropiado, considera la transferibilidad del modelo como una aproximación práctica al problema de estimar un modelo para un área de estudio con pocos recursos o con una muestra disponible muy pequeña. En este sentido la transferibilidad de los modelos se basa en la idea de que los parámetros estimados de un estudio anterior pueden dar información útil para la estimación del mismo modelo en un área nueva, incluso cuando se espera que los verdaderos valores de sus parámetros no vayan a ser los mismos. Entonces, dado que no se puede esperar que los modelos transferibles sean perfectamente aplicables en un nuevo contexto, requieren procedimientos para modificar sus parámetros con el fin de que representen con más exactitud el comportamiento dentro del contexto de la aplicación. Según la información disponible en la nueva situación, pueden aplicarse diferentes procedimientos para realizar la actualización (véase Ben Akiva y Bolduc, 1987).

9.4.2. Métodos para evaluar la transferibilidad de modelos Si se define la transferibilidad en función de la utilidad de un modelo transferido, infor mación o teoría en un nuevo contexto, se puede intentar calcularla comparando los parámetros del modelo y, más interesante, su rendimiento en los dos contextos (antiguo y nuevo). Para ello se supone que los parámetros se estiman independientemente en ambos contextos y que es recomendable medir los errores implicados en el uso del primer modelo en el segundo contexto. Los tests y mediciones que se presentan a continuación han sido utilizados en múltiples casos prácticos (Galbraith y Hensher, 1982; Koppelman y Wilmott, 1982; Ortúzar et al., 1986). 9.4.2.1.

Test de igualdad de parámetros

Para evaluar la diferencia absoluta entre los coeficientes de un determinado modelo estimado en dos contextos diferentes, pueden utilizarse los estadísticos-t* (9.10); por lo tanto, si esta expresión es correcta, la hipótesis nula de que esta diferencia es 0 no puede ser rechazada a un nivel del 95%:

t* 

i  j ¨ / t 2  / t 2 · j j ª i i ¹

 1, 96

(9.10)



Agregación de modelos y transferibilidad

donde θ representa los coeficientes, t sus test-t, i representa el contexto original y j el contexto nuevo. Galbraith y Hensher (1982) recomiendan la aplicación de este ensayo solamente para parámetros con un error estándar bajo (test-t alto); de otra forma el estadístico-t* puede rechazar la hipótesis alternativa (es decir, que los parámetros son diferentes) incluso si los parámetros muestran diferencias substanciales. 9.4.2.2.

Medidas desagregadas de transferibilidad

Éstas se basan en la capacidad de un modelo transferido para describir las elecciones individuales observadas en el nuevo contexto y en medidas de la log-verosimilitud como las expuestas en la figura 8.2. Además, se necesita definir l*j (θi) como el logaritmo de la verosimilitud que los datos observados en el contexto de la aplicación j fueron generados por el modelo transferido estimado en el contexto i; observar que se tienen que denotar las medidas anteriores como l*j (θj), l*j (C) y l*j (0), respectivamente. La figura 9.3 muestra la relación esperada entre estos valores. l*j (0)

l*j (C)

l*j (θi)

l*j (θj)

l (*) = 0

Figura 9.3. Relación esperada entre los valores de la log-verosimilitud.

Una medida natural de la transferibilidad de un modelo estimado en el contexto i para su aplicación en el contexto j viene dada por la diferencia en la log-verosimilitud (es decir, la razón de verosimilitud) entre este modelo y otro originariamente estimado en el contexto j: –{l*j (θi) – l*j (θj)}. Esta medida se ha utilizado para construir dos índices específicos de transferibilidad: 1. El test estadístico de transferibilidad (TTS), definido por Atherton y Ben Akiva (1976) como dos veces la diferencia en la log-verosimilitud identificada anteriormente:

TTS  2[l *j ( i ) l *j ( j )]

(9.11)

Este estadístico distribuye χ2 con grados de libertad igual al número de parámetros del modelo, todo ello bajo la suposición de que el vector de parámetros del modelo transferido es fijo. El test no es simétrico; por lo tanto es posible y razonable aceptar la transferibilidad en un sentido, entre un par de contextos, pero rechazarla en el otro sentido.

MODELOS

DE



TRANSPORTE

2. El índice de transferencia (TI), que describe el grado en el que la log-verosimilitud del modelo transferido supera un modelo nulo o de referencia (p. ej., el modelo de reparto de mercado), relativo a la mejora proporcionada por un modelo desarrollado en el nuevo contexto. Queda definido por Koppelman y Wilmott (1982) así:

TI j  i 

l *j  i l *j  C l *j  j l *j  C

(9.12)

El TI tiene un límite superior de uno (lo que se obtiene cuando el modelo transferido es tan exacto como el modelo local), pero no tiene un límite inferior; los valores negativos solamente implican que el modelo transferido es peor que el modelo local de referencia. Las dos medidas descritas anteriormente están interrelacionadas por su dependencia de la diferencia en la log-verosimilitud entre los modelos transferido y local. Sin embargo, ofrecen diferentes perspectivas sobre la transferibilidad de un modelo: el TI proporciona una medida relativa y el TTS un test estadístico (Koppelman y Wilmott, 1982).

9.4.3.

Actualización con datos desagregados

La presentación más general del modelo MNL (7.9) con unas funciones de utilidad lineales V dadas por (7.3), considera no solamente la inclusión explícita de la relación (7.10), tal y como se aprecia en el epígrafe 9.2, sino también la inclusión explícita de un conjunto de parámetros de localización wi como en:

Piq 

exp ¨ª( wi Q X iq ) / s ·¹

¤

exp ¨ª( w j Q X jq ) / s ·¹ j

(9.13)

donde los parámetros de localización representan la forma de la distribución de errores para cada alternativa, el parámetro de escala σ es la desviación estándar de la distribución del término de error, y los parámetros θ las ponderaciones de los atributos empleadas por el individuo al evaluar las alternativas. En su análisis de mala especificación de modelos, Tardiff (1979) muestra que la omisión de variables explicativas debería tener los efectos siguientes:



Agregación de modelos y transferibilidad

• mover el valor medio de la distribución del error, representado en el modelo por wi e incrementar su varianza reflejada por σ; • sesgar los estimadores de los parámetros asociados con las variables incluidas. Cuando se comparan modelos que están especificados de forma incompleta en diferentes contextos, se espera que las diferencias entre los valores medios de la distribución del error sean relativamente grandes, que sean más pequeñas las diferencias en la desviación estándar del error y aún más pequeñas las diferencias en los estimadores de los parámetros. Por lo tanto, los esfuerzos para mejorar la transferibilidad del modelo hasta un ámbito de aplicación específico deberían primero enfatizarse en el ajuste de las constantes, en segundo lugar en la escala de los parámetros y finalmente en los valores relativos de los parámetros; esto ha sido confirmado por varios estudios prácticos utilizando datos agregados y desagregados (Gur, 1982; Dehghani y Talvitie, 1983; Koppelman et al., 1985b; Gunn y Pol, 1986). Por supuesto, los parámetros en la ecuación (9.13) no son totalmente identificables y por lo tanto, no pueden estimarse todos; tal y como se ha visto, en el caso de las constantes específicas de las alternativas, una de ellas se debe fijar arbitrariamente igual a cero (y sin ninguna pérdida de generalidad). Tampoco es posible estimar σ, sino solamente las relaciones w / σ y θ / σ; definiendo estas relaciones por μ = w / σ y ϕ = θ/σ se obtiene la versión más conocida del MNL como:

Piq 

exp ¨ªM i FϕX Xiqiq ·¹

¤

A j A( q )

exp ¨ªM j FϕX X jqjq ·¹

(9.14)

donde uno de los μi está restringido a cero. 9.4.3.1. Actualización de las constantes Los estimadores de los parámetros para un modelo de elección se obtienen maximizando una expresión de la log-verosimilitud como (8.13), en la que, incluidas en la función de probabilidad Piq, se encuentran expresiones de la utilidad representativa de cada alternativa formuladas como: Viq = μi + ϕXiq

(9.15)

MODELOS

DE



TRANSPORTE

Si se representa por ϕT al conjunto de parámetros estimados en un contexto determinado que van a ser transferidos a un contexto de aplicación nuevo, la parte transferida de la función de utilidad puede definirse (Koppelman et al., 1985b) como: (9.16) ZAiq = ϕT X Aiq donde X Aiq es un vector de atributos de la alternativa Ai para el individuo q en el contexto de aplicación (A). La actualización de las constantes específicas de las alternativas se consigue mediante la modificación de la función de utilidad en la ecuación (9.15) para el contexto de aplicación, así: (9.17) V Aiq = μAi + ZAiq V Aiq es la utilidad representativa de la alternativa Ai en el contexto de aplicación y μ Ai es la constante específica actualizada de dicha alternativa. Para estimar el valor actualizado de las constantes es necesario maximizar la función de la log-verosimilitud: l(μ A) =

¤ ¤ q

g jq log Pjq (ZAq, μA)

A j A ( q )

(9.18)

donde, como antes, g jq se define por: g jq = 9.4.3.2.

1

si Aj fue elegida por q

0

en otro caso

Actualización de constantes y escala

La metodología descrita anteriormente puede extenderse fácilmente al ajuste de la escala de los parámetros transferidos, lo mismo que en el caso de las constantes. El coeficiente ZiqA en la ecuación (9.17) se restringió a uno en la aproximación anterior; y por tanto para actualizar la escala de parámetros se relaja esa restricción, proporcionando así la siguiente utilidad representativa (Koppelman et al., 1985b): (9.19) V Aiq = μAi + λ AZAiq Donde λ A es el parámetro de escalamiento para el contexto de aplicación relativo a la estimación o contexto original. En este caso para maximizar la



Agregación de modelos y transferibilidad

función de log-verosimilitud debe procederse como en (9.18) pero incluyendo el parámetro extra (λ A). Resaltar que este ajuste de escala de las variables explicatorias no afecta a su importancia relativa. Aplicaciones prácticas de este método pueden encontrarse en Gunn et al. (1985) y una discusión sobre refinamientos adicionales de este problema puede encontrarse en Ben Akiva y Bolduc (1987).

9.4.4.

Actualización con datos agregados

Considérese el mismo problema anterior con la excepción de que no se dispone de datos desagregados en el contexto de aplicación; sin embargo, supóngase que se poseen datos sobre el reparto de mercado observado P*jq y también valores – medios para las variables explicativas Xjz para ciertos grupos z (p. ej., residentes en una zona dada) en ambos contextos. Supóngase una agregación intuitiva en el contexto original, donde la utilidad medida de la alternativa Aj para un grupo z viene dada por: (9.20) – – Vjz = μ j + ϕX jz para actualizar tanto las constantes de las alternativas como la escala, se requiere, en primer lugar, el cálculo de la parte no constante de la utilidad para el contexto de aplicación, así: (9.21) – – Z Ajz = ϕT X Ajz a continuación se debe formular una expresión para la utilidad representativa del grupo z en el contexto de aplicación, como por ejemplo: (9.22) – – V Ajz = μAj + τ A Z Ajz donde μ A y τ A son elegidos para maximizar la siguiente función de log-verosimilitud (Koppelman et al., 1985a):

l   A ,  A  ¤ Wz ¤ Pjz* log Pjz  Z Ajz ,  A ,  A z

j

(9.23)

en la que la ponderación Wz, normalmente el número de observaciones, indica la importancia relativa del grupo dentro del conjunto de datos. Otros métodos (más inciertos) para actualizar solamente las constantes han sido propuestos por Dehghani y Talvitie (1983) y Gur (1982).

MODELOS

DE



TRANSPORTE

La cuestión de la agregación dentro de la presentación anterior no es trivial, ya que se sabe que el método intuitivo puede introducir sesgos severos. En este sentido es interesante mencionar que la metodología que se acaba de tratar es completamente consistente con el enfoque agregado implícito en la mayoría de los estudios de transporte agregados (recuérdese la figura 9.1 y la discusión en el Capítulo 5). En este caso, los parámetros del modelo desagregado han sido utilizados tradicionalmente como coeficientes fijos de funciones de costes generalizados, y después los parámetros de escala y sesgos se han ajustado utilizando datos agregados (Williams y Ortúzar, 1982b). También es de interés destacar que se ha utilizado en la práctica una versión más elaborada de este enfoque; por ejemplo, en el caso del Estudio Estratégico de Transporte del Gran Santiago (ESTRAUS, 1989), los parámetros de elección de modo desagregados primero fueron estimados con una mezcla de datos de 1983 a 1986 (Ortúzar e Ivelic, 1988); éstos se utilizaron para construir funciones de costes generalizados cuyos parámetros de escala y sesgos fueron, después, calibrados con los datos de red y encuestas de 1977. Finalmente, los modelos resultantes de distribución agregada y partición modal fueron validados utilizando conteos de tráfico y otros datos agregados para 1986. Una alternativa interesante, si estuviera disponible, es la utilización de muestras sintéticas diseñadas a propósito en un enfoque de enumeración (Gunn et al., 1982). Una ventaja importante de este método, tal y como se ha tratado en la sección 9.3, es que no es necesario realizar grandes ajustes a los modelos desagregados si la muestra artificial proporciona información insesgada al sistema de modelos.

EJERCICIOS 9.1. Un grupo de 800 hogares con diferentes niveles de ingreso y diferentes localizaciones en un área urbana, se enfrenta a la elección entre dos servicios de transporte A y B para viajar al centro de la ciudad. El primero, orientado hacia el segmento de población con mayores ingresos, tiene un coste de Ca y el segundo un coste de Cb. Se han estimado las siguientes utilidades para cada alternativa:

U a  0, 30Ca 3, 23I U b  0, 30Cb



Agregación de modelos y transferibilidad

donde I representa los ingresos por hogar (1.000 $/semana). Estimar el número de hogares que elegirían el servicio A utilizando la siguiente información: Renta familiar (1.000 $ / semana)

Número de hogares

Ca ($)

Cb ($)

Entre 1 y 2

450

150

120

Entre 2 y 3

250

175

145

Entre 3 y 4

100

160

130

9.2. Considérese el corredor urbano que se muestra en la siguiente figura y cuyas características son las que se citan a continuación: 6 km

5 km

4 km

2 km

4 km Centro

Zona 1

• El metro y la autopista van en paralelo; hay estaciones de metro en cada zona. • Los hogares en el corredor tienen diferentes niveles de ingreso, distinto nivel de propiedad de coches y diferente acceso al metro, tal como se ve en la tabla 9.1. Tabla 9.1. CO

Distribución de hogares con viajes entre la zona 1 y el centro Acceso

Ingreso 5.000

10.000

15.000

Total

1,0

U(DA) U(CA) Total

0 0 0

0 50 50

350 150 500

350 200 550

0,5

U(DA) U(CA) Total

150 200 350

100 0 100

0 0 0

250 200 450

Total

U(DA) U(CA) Total

150 200 350

100 50 150

350 150 500

600 400 1.000

MODELOS

DE



TRANSPORTE

Se está interesado en los viajes entre la zona 1 y el centro de la ciudad. Se ha estimado en su día un modelo logit binario con las utilidades representativas siguientes: Vc = –2,0 + 9·10 –5 I + 2,84CO – 0,03tc – 0,68ec / d – 50,0cc / I Vu = –0,03tu – 0,68eu / d – 50,0cu / I donde t es el tiempo de viaje en vehículo (min), e es el tiempo de acceso (min), c es el coste ($), d es la distancia (km), I son los ingresos ($/mes) y CO es el número de coches dividido por el número de permisos de conducir en el hogar. Los viajes en el metro se dividen según el acceso en U (DA), metro con acceso directo (es decir, caminando), y U (CA) metro con acceso en coche. Los niveles de servicio para individuos que viajan entre la zona 1 y el centro se resumen en la tabla 9.2. Tabla 9.2.

Niveles de servicio tc

ec

cc

tu

eu

cu

d

U(DA)

11,3

5

122,5

14

8

50

14,5

U(CA)

14,2

5

131,1

22

15

75

16,3

Utilizando el método apropiado encuentre la probabilidad agregada (es decir, para toda la población) de elegir el metro. 9.3. Considere un modelo logit binario para coche y autobús con las siguientes funciones de utilidad representativas Vc = 1,35 – 0,03tc – 0,15cc Vb = –0,03tb – 0,15cb donde t es la duración del viaje (min) y c es el coste del viaje dividido por el ingreso. Supóngase que los datos de la tabla 9.3 se conocen para los individuos de la zona A que viajan al trabajo a la zona C: 1. Calcular la proporción agregada que elige coche utilizando el método de agregación intuitivo y el de enumeración muestral. Computar el error de agregación para el método intuitivo en este caso.



Agregación de modelos y transferibilidad

2. Obtener la proporción agregada que utiliza coche mediante el método de clasificación (utilice los ingresos como variable de estratificación). Representar los resultados en un gráfico conjuntamente con los resultados del método de agregación intuitivo y discutir dicho gráfico. 3. Comparar todos sus resultados y discutirlos críticamente. Tabla 9.3.

Datos individuales

Individuos

Elección

Ingreso

tc (min)

tb (min)

cc (min)

c b (min)

1

Coche

Alto

47,5

83,2

14,8

7,0

2

Coche

Alto

30,2

45,0

10,4

5,0

3

Coche

Alto

22,2

30,4

12,6

4,0

4

Bus

Alto

45,0

50,6

8,2

5,0

5

Bus

Bajo

15,3

20,5

50,0

17,0

6

Coche

Bajo

34,8

50,2

55,0

35,0

7

Bus

Bajo

65,5

100,5

200,3

53,5

8

Bus

Bajo

12,0

14,0

44,6

17,0

9.4. Se está interesado en transferir el modelo del ejercicio 9.3 a un nuevo contexto, del que se ha obtenido una pequeña muestra de cinco individuos cuyas características se presentan en la tabla siguiente: Individuos

Elección

tc (min)

tb (min)

cc (min)

c b (min)

1 2

Coche

37,5

70,2

16,8

10,0

Coche

20,2

30,0

16,4

8,0

3

Coche

12,0

15,4

18,6

7,0

4

Bus

35,0

35,6

14,2

8,0

5

Bus

5,3

6,5

56,0

20,0

Suponiendo que no hay constantes modales específicas, calcular el valor de τ, el parámetro de la escala de transferibilidad, utilizando los datos anteriores. Discutir sus resultados.

10. Asignación

10.1. 10.1.1.

E

CONCEPTOS BÁSICOS Introducción

n los últimos seis capítulos han sido estudiados en detalle los modelos más importantes actualmente en uso para representar la demanda de viaje en un área de estudio. En este capítulo en cambio, se estudiará principalmente el problema de la modelización de la oferta de transporte, mientras en el Capítulo 11 se analizará el problema del equilibrio entre la oferta y la demanda. Los aspectos introductorios relativos a la oferta de un sistema de transporte han sido descritos en el Capítulo 3, en el que se trataron la zonificación y la construcción del sistema de red. El sistema de red y, en el caso del transporte público, las características del servicio ofrecido, como la frecuencia y la capacidad, representan los elementos principales de la oferta de un sistema de transporte. ¿Qué significa asignar viajes a una red? Seleccionar (predecir) los caminos o rutas usadas por los viajeros para posteriormente “cargar” los flujos origen-destino sobre los arcos de la red. En este sentido, un recorrido o camino es la secuencia de arcos que los usuarios emplean para llegar del origen a su destino. En la economía clásica las transacciones de bienes y servicios resultan de combinar la demanda y la oferta de éstos y el punto de equilibrio que resulta de esta combinación define el precio al que los bienes serán intercambiados y su correspondiente flujo (cantidad intercambiada) en el mercado. El punto de equilibrio se alcanza cuando el coste marginal de producción y venta de los bienes iguala al beneficio marginal obtenido por quienes lo adquieren. La teoría económica admite que en realidad este equilibrio no puede ser nunca alcanzado en la práctica, porque el sistema de precios y los niveles de produc-



Asignación

ción se encuentran en continua adaptación para enfrentar los cambios en las preferencias, el poder adquisitivo, las técnicas de producción y su tecnología. Sin embargo el concepto de equilibrio todavía es útil para comprender cómo se desarrolla la economía y para prever sus estados futuros. En este contexto es en el que debe considerarse el sistema de transportes. La oferta de transporte está constituida por la red vial S(L,C), representada por L arcos (y sus nodos asociados), y por C sus costes. Los costes vienen representados por funciones de una serie de atributos asociados a los arcos, por ejemplo, la distancia o longitud, la velocidad a flujo libre, la capacidad y la relación flujo-velocidad. Para su estimación, la demanda se representa por el número de desplazamientos que puedan ser realizados por cada par O-D y por modo para un cierto nivel de servicio dado. En este contexto, el tiempo de viaje representa uno de los principales elementos que definen el nivel de servicio, aunque a menudo determinados costes monetarios (tarifas, carburante) y ciertas características como el confort percibido por el individuo también pueden ser relevantes en el proceso. Si el nivel real de servicio ofrecido por una red de transporte resulta más bajo que el estimado, la demanda se reduce y como consecuencia puede ser que se produzca el correspondiente cambio hacia otros destinos, modos o/y horarios del día. En este sentido es importante la relación velocidad/flujo, o costes generalizados/flujo, ya que pone en relación la utilización de la red con el nivel de servicio que ella puede ofrecer. Una red de transporte público se puede definir de forma parecida a una red privada, pero debería contener una especificación adicional del servicio ofrecido en términos de recorrido o ruta, capacidad, frecuencia e idealmente, aunque difícil en la práctica, en términos de calidad, fiabilidad y regularidad. En el caso del sistema de transportes el equilibrio se realiza a varios niveles. El más simple es el equilibrio de la red vial, donde los viajeros representados por una matriz de viajes dada, examinan el recorrido que minimiza su coste de viaje (tiempo de viaje). Esto lleva a la búsqueda de recorridos alternativos diferentes así como a explorar otros nuevos hasta encontrar, después de muchas tentativas, un esquema relativamente estable. Con esta asignación de viajes a rutas (recorridos) se consigue un esquema de flujos en dichas rutas y arcos que pueden llegar al equilibrio cuando los usuarios no logran encontrar mejores recorridos para alcanzar sus destinos. Este equilibrio se denomina equilibrio de la red vial (road network equilibrium). Un fenómeno parecido, pero a menudo menos marcado, se produce también en la red de servicios de transporte público

MODELOS

DE

TRANSPORTE



donde los pasajeros pueden buscar los recorridos (es decir, combinaciones de servicios) que minimizan sus costes generalizados de viaje teniendo en cuenta los problemas de congestión, tiempos de espera, tiempo andando hasta la parada y al punto de destino y tiempo de viaje a bordo del vehículo. Existen, sin embargo, otros niveles (más altos) de interacción. A medida que la congestión vehicular aumenta, también aumentan los tiempos de viaje de los autobuses que recorren la ciudad. Este fenómeno puede inducir a algunos usuarios de transporte público y a los propios operadores del servicio a modificar sus recorridos para evitar demoras. Estas elecciones interaccionan con las de los automovilistas, ya que esta nueva condición puede producir una variación de la capacidad adicional sobre algunos arcos y por tanto llegarse a nuevos estados de equilibrio. A este tipo de situaciones se les denomina problemas de equilibrio de una red multimodal (multimodal network equilibrium), que serán estudiados en el Capítulo 11. A un nivel aún superior, por fin, el esquema de flujos de una red puede también influir en la elección de modo de transporte, de destino y de horario de viaje. Cada uno de estos cambios en la demanda producirá, a su vez, modificaciones en los correspondientes puntos de equilibrio. En términos de modelización, dicho nuevo esquema de flujos produce niveles de servicio sobre los recorridos (rutas) y sobre los modos que pueden ser o no consistentes con los obtenidos en la estimación de la matriz (presunta) de viajes fijada. Esto requiere una nueva estimación de dicha matriz y por lo tanto su utilización (dentro del proceso de estimación) de los nuevos niveles de servicio para conseguir así una nueva. Puede resultar necesario entonces, repetir el proceso de modo sistemático, hasta que se consigan matrices de viajes (y por lo tanto, tiempo de viaje, destino y modo), cuyos valores de los costes sean consistentes con los flujos estimados para cada red. Este nivel más alto se denomina equilibrio del sistema (system equilibrium), en contraposición con el denominado equilibrio de red (network equilibrium). Este capítulo se organiza de la siguiente forma. Ante todo será abordado el problema de la asignación de una matriz de viajes dada a una red vial, lo cual va a requerir la utilización de las típicas curvas de flujo (velocidad y coste con respecto del flujo). El problema de la asignación a una red se compone por un lado del modelo de elección del recorrido y por otro, de la carga de la matriz de viajes sobre los recorridos correspondientes. Existen diferentes métodos de carga según las características del fenómeno en estudio. En particular en el epígrafe 10.4 se estudiarán los métodos estocásticos, los cuales tienen en



Asignación

cuenta la variabilidad de la percepción de los costes de recorrido por parte de los conductores, mientras en el epígrafe 10.5 se describirá un método quizás más interesante y que consiste en la inclusión, de forma coherente, de los efectos de la congestión sobre la elección del recorrido utilizando la asignación determinística. En este epígrafe sólo se incluirán métodos prácticos bajo el título general de asignación sobre redes congestionadas mientras que la asignación de equilibrio (Capítulo 11) se tratará más rigurosamente. Por fin en el epígrafe 10.6 serán analizados los problemas y las aproximaciones necesarias para modelizar la asignación de la demanda al transporte público.

10.1.2. Definiciones y notación Si bien se introducirán otros conceptos más adelante, la notación básica requerida incluye: Tijr es el número de viajes entre i y j por el recorrido o ruta r, Va es el flujo en el arco a, C(Va) es la relación coste-flujos para el arco a, c(Va) es el coste efectivo para un nivel específico de flujo Va; cuando Va = 0 el coste se define como coste a flujo libre, cijr es el coste de viaje de i a j por el recorrido r, 1 si el arco α pertenece al recorrido (o ruta) r desde i a j δaijr = 0 en otro caso La letra n se utilizará para indicar una iteración particular en los métodos iterativos. El asterisco * se empleará, en cambio, para indicar el valor óptimo, por ejemplo, cij* representa el mínimo coste de viaje entre i y j.

10.1.3. Curvas flujo-velocidad y coste-flujo La relación que existe entre la velocidad de circulación y el flujo en un arco es una formulación fundamental de la Ingeniería de Tráfico. El concepto fue desarrollado inicialmente para tramos largos de autopista, de túneles o de calles sin interrupciones. La relación flujo-velocidad se representa usualmente como en la figura 10.1; a medida que el flujo crece, la velocidad tiende a decrecer, con un tramo inicial en el que las variaciones son pequeñas; cuando el flujo alcanza valores próximos a la capacidad del arco, la tasa de reducción de la velocidad se incrementa.

DE



TRANSPORTE

Velocidad S (km/h)

Tiempo de viaje (min/km)

MODELOS

Vmáx

Figura 10.1.

Flujo V (vehículos/h)

Vmáx

Flujo V (vehículos/h)

Relación típica flujo-velocidad y coste-flujo para un arco largo.

El flujo alcanza el valor máximo con la capacidad y cuando se intentan forzar los volúmenes de tráfico más allá de este valor se alcanza una región inestable caracterizada por velocidad y flujos bajos. En la asignación de tráfico y por razones prácticas, este tipo de relación se trata en términos de tiempo de viaje por unidad de longitud en función del flujo, o más generalmente, como relación coste-flujo, tal y como también se muestra en la figura 10.1. Los métodos de asignación que consideran los efectos de la congestión, requieren la utilización de funciones que relacionan los atributos del arco (capacidad, velocidad a flujo libre) y el flujo sobre la red con las velocidades o los costes resultantes. En términos generales, tales funciones pueden ser expresadas como: Ca = Ca ({V})

(10.1)

en las que el coste en el arco a depende de su propio flujo y de los flujos en otros arcos de la red que interactúan con el flujo propio. Esta relación es importante en áreas urbanas en las que hay numerosas interacciones entre los flujos y demoras de los diferentes arcos, por ejemplo, en intersecciones prioritarias (ceda el paso) o en rotondas. En el caso en que se consideren arcos de extensión suficiente, en los que el tiempo perdido en recorrerlos es predominante con respecto a las demoras en las intersecciones, la formulación se puede simplificar reduciendo la dependencia al flujo del arco individual y sus características. En este caso los costes se denominan separables y se puede escribir: Ca = Ca (Va)

(10.2)



Asignación

Esta hipótesis simplifica la estimación de estas funciones además del desarrollo y empleo de técnicas idóneas de asignación. Es necesario recordar que esta simplificación es menos verdadera cuanto más densa y congestionada es el área urbana en estudio. Se han propuesto varias funciones que pueden representar la relación (10.2). El hecho de que el principal objetivo de este epígrafe sea la asignación del tráfico permite concentrar la atención solamente en un reducido número de este tipo de funciones, y en particular sólo sobre las que poseen buenas propiedades matemáticas. Desde el punto de vista de la asignación es importante, en efecto, que la curva de coste-flujo posea algunas propiedades, tales como: • Realismo; es decir, la modelización del tiempo de viaje debería ser suficientemente verdadera. • La función ha de ser continua y diferenciable. • La función tiene que ser no-decreciente y monótona; el aumento del flujo no debería reducir el tiempo de viaje. Esto es no sólo razonable sino también deseable, como se verá más adelante. • La función debe permitir la existencia de una región de carga excesiva, por ejemplo, no debería generar tiempos de viaje infinitos, incluso cuando el flujo supera la capacidad del arco. Esta posibilidad puede aparecer en una fase del proceso iterativo de asignación cuando el tráfico asignado a un arco es superior a su capacidad; en este caso es mejor que la formulación genere un elevado tiempo de viaje en lugar de un valor infinito, lo que resultaría en un error de ejecución. Por lo demás, pueden ocurrir ciertamente en la práctica fenómenos de sobrecarga durante breves períodos de tiempo sin que éstos originen demoras infinitas. La curva de la figura 10.1 describe este fenómeno. • Por razones prácticas la relación coste-flujo debe ser sencilla de transferir de un contexto a otro; bajo esta óptica es mejor utilizar parámetros estándares de la ingeniería del tráfico como son velocidad a flujo libre, la capacidad, el número de intersecciones por km. La curva de coste-flujo debería crecer con el flujo, excepto quizás en el caso de valores bajos de dicho flujo donde los tiempos de viaje no varían con pequeños incrementos de vehículos. En todo caso el coste total incurrido por todos los vehículos en un arco, viene dado por VaCa (Va). A este respecto, es interesante tener en cuenta el correspondiente coste marginal, es decir la con-

MODELOS

DE



TRANSPORTE

tribución al coste total producido por la añadidura marginal de un vehículo al flujo:

Cma 

u ;Va Ca (Va ) = uVa

 Ca (Va ) Va

uCa (Va ) uVa

(10.3)

En el lado derecho de la ecuación se pueden observar dos términos, el primero corresponde al coste medio en el arco y el segundo al incremento de coste (demora) total producido sobre el tráfico restante por la introducción en el flujo de un vehículo adicional. Éste es un efecto externo y corresponde a los costes adicionales soportados por el resto de los usuarios del arco cuando se añade un nuevo vehículo al mismo. Ya que la curva coste-flujo es creciente, esta contribución es siempre mayor de cero. Está claro que en términos económicos el coste medio y el marginal serán los mismos en la parte plana de la curva, si ésta existe. Como se dijo, se han sugerido múltiples formas funcionales para la ecuación de coste-flujo basadas en la hipótesis de que se modeliza en condiciones estacionarias y/o algunas tipologías de comportamientos medios. Branston (1976) proporciona una buena reseña de problemas prácticos que aparecen cuando se tienen que calibrar las curvas de coste-flujo; en particular se refieren a: • Problemas derivados de la definición de la extensión del área de observación en particular en las zonas congestionadas y donde, por ejemplo, una intersección situada aguas arriba produce un estrangulamiento y sus efectos se hacen sentir en el resto de la red. En efecto, la localización exacta de los lugares donde medir los flujos y las demoras en términos de espacio ocupado por las colas, influyen relevantemente en la calidad de los resultados obtenidos. • Problemas derivados de la hipótesis de que las demoras sólo dependan del flujo sobre el arco propio; tal hipótesis, en la mayor parte de las redes urbanas densas, es irreal, constituyendo un hecho particularmente crítico para la estimación de las curvas de coste-flujo. Branston (1976) reexamina también las curvas de Coste-flujo propuestas por otros autores. Algunas de las curvas más utilizadas son las siguientes: 1. Smock (1962), que para un estudio de Detroit propone una curva de costeflujo del tipo: t = t0exp(V/Qs)

(10.4)



Asignación

donde t es el tiempo de viaje por unidad de longitud, t0 es el tiempo de viaje por unidad de longitud en condiciones de flujo libre y Qs es la capacidad del arco en condiciones estacionarias. 2. Overgaard (1967), generaliza la (10.4) como sigue: t = t0 αβ(V / Qp)

(10.5)

donde Qp es la capacidad real del arco, y α y β son parámetros a calibrar. 3. El Bureau of Public Roads (1964) en EE.UU. propuso la que es probablemente la función más comúnmente utilizada: t = t0[1 + α(V / Qp)β]

(10.6)

4. Finalmente, el Department of Transport en UK ha producido un vasto número de curvas de coste-flujo para una gran variedad de tipologías de enlaces de nivel urbano, suburbano e interurbano. Algunas poseen una forma general que tiene en cuenta la primera curva velocidad-flujo s(V):

«S V  F1 ® 0 S S1 ® s (V )  ¬ S0 0 F1 b V b F2 (V F1 ) F

F 2 1 ® ® S / ¨1+  S / 8d )(V / F -1) · V  F2 1 2 ¹ ­ 1 ª

(10.7a) (10.7b) (10.7c)

donde S0 es la velocidad a flujo libre. S1 es la velocidad para la capacidad igual al flujo F2. F1 es el máximo flujo que corresponde a las condiciones de flujo libre y d es la distancia o longitud del arco. La relación tiempo-flujo T(V) resulta ser, por tanto:

«d / S0 V  F1 ® d ® T (V )  ¬d / S (V )  F1 b V b F2 S0 SS01 F1 SS01V ® ®d / S + V / F 1 / 8 V  F2 2 1 ­

(10.8a) (10.8b) (10.8c)

MODELOS

DE



TRANSPORTE

donde SS01 es:

SS01 

S0 S1 F1 F2

(10.9)

La tabla 10.1 presenta algunos valores usuales de estos coeficientes (Department of Transport, 1985). Tabla 10.1.

Coeficientes usuales de curvas velocidad-flujo en U.K. Tipo

S 0 km/h

S1 km/h

F1 pcu/h/ carril

F2 pcu/h/ carril

Calle rural; 2 carriles, uno por sentido Calle rural; 2 carriles, dos por sentido Calle urbana, periférica; 2 carriles, uno por sentido

63 79

55 70

400 1.600

1.400 2.400

45

25

500

1.000

En algunos casos se considera un punto límite en la reducción de la velocidad; por ejemplo, puede asumirse que la velocidad mantenga el valor correspondiente a F2 para V > F2. Todas las curvas coste-flujo vistas anteriormente proporcionan información útil acerca de los tiempos de viaje en el arco. Sin embargo, normalmente se reconoce que la mayor parte de los usuarios minimizan la combinación de atributos del arco, lo cual incluye tiempo y distancia; por tanto, la práctica convencional recomienda el empleo de una versión simplificada del concepto de coste generalizado, es decir una combinación lineal ponderada del tiempo y de la longitud: Ca = α (tiempo de viaje)a + β (longitud del arco)a

(10.10)

Asimismo, dicho coste puede medirse en unidad de tiempo o unidades monetarias generalizados. También se puede incluir un factor relativo a los costes directos (out-of-pocket o costes pagados en el momento del viaje, es decir un pago en efectivo) como, por ejemplo, la aplicación de un peaje en un determinado arco. La calibración de la relación coste-flujo requiere tiempo y datos de buena calidad: es necesario, en efecto, contar con observaciones de tiempos de viaje en los arcos para diferentes niveles de flujo. Por esta razón, muchos países han desarrollado curvas propias que utilizan en sus estudios particulares y dichas relaciones, por tanto, raramente son calibradas. A este propósito deben



Asignación

estudiarse las limitaciones de las curvas de coste-flujo relativas a los arcos en las áreas urbanas expuestas en el epígrafe 11.3. Sush et al. (1990) desarrollaron una novedosa aproximación para estimar curvas de coste-flujo basada en conteos de tráfico; utiliza un método de optimización bi-nivel que, esencialmente, trata de establecer los parámetros de las curvas de flujo minimizando una función que mide la diferencia entre el flujo asignado y el observado. El valor de esta aproximación es limitado por los errores en el proceso de asignación, como se discute en el epígrafe 11.3: así por ejemplo, han de tenerse en cuenta los posibles errores en la red, en la matriz de los viajes, en la hipótesis de información perfecta y en la hipótesis de que todos los usuarios perciben los costes en el arco de la misma forma. Las curvas de flujo estimadas con este método de optimización bi-nivel internalizan estos errores y, por tanto, también la dificultad de transferirlas a otras realidades y, consecuentemente, a otras mejoras de la red.

10.2.

MÉTODOS DE ASIGNACIÓN DE TRÁFICO

10.2.1. Introducción Durante la aplicación del clásico proceso de asignación de tráfico se utilizan una serie de reglas y principios para cargar una determinada matriz de viajes a la red y obtener así una serie de flujos en los arcos. Sin embargo, éstos no sólo son resultados interesantes en el proceso de asignación; tal proceso tiene diferentes objetivos que es importante tener en cuenta en detalle, aunque no todos reciben la misma atención en todas las situaciones y no todos pueden ser logrados con un mismo grado de exactitud. Los principales objetivos son: 1. Primarios: • Obtener buenos resultados agregados de red, es decir, por ejemplo, flujos totales sobre autopistas, beneficios totales por servicios de autobús. • Estimar costes (tiempos) de viaje entre zonas para un nivel dado de demanda. • Conseguir valores razonables de flujos en los arcos e identificar los arcos más congestionados. 2. Secundarios: • Estimar los recorridos utilizados entre cada par O/D.

MODELOS

DE

TRANSPORTE



• Analizar qué pares O/D utilizan arcos o rutas o recorridos particulares. • Obtener los flujos de vehículos que realizan giros para diseñar futuras intersecciones. En términos generales se puede lograr una mayor exactitud en los objetivos primarios que en los secundarios, y dentro de cada grupo es más fácil satisfacer los primeros de la lista; ciertamente es más factible que los modelos estimen correctamente los valores agregados antes que los desagregados. Los requerimientos básicos para un modelo de asignación son los siguientes: • Una matriz de viajes que exprese la demanda estimada. Normalmente la matriz se refiere a una franja horaria punta en un área congestionada, pero se puede contar también con otras matrices que se refieran a otras horas del día. A veces, en el caso de redes no-congestionadas, se utilizan matrices diarias. Sin embargo, la conversión de la matriz diaria en matriz horaria raramente es satisfactoria en términos de congestión, porque las primeras son simétricas mientras las horarias raramente lo son. Las mismas matrices pueden estar disponibles en términos de desplazamientos de personas en cuyo caso deberían ser convertidas en desplazamientos de vehículos, ya que la capacidad y la relación velocidad-flujos de la red están descritas en estos términos. • Una red, es decir, los arcos y sus propiedades incluyendo las curvas de costeflujo. • Principios y reglas de selección de los recorridos (rutas) relevantes para el problema a examen.

10.2.2. Elección del recorrido en coche La premisa básica a tener en cuenta en la asignación es la hipótesis de que el individuo es un usuario racional que elige el recorrido que le supone costes individuales percibidos (esperados) más bajos. La elección del recorrido depende de un cierto número de factores como son el tiempo de viaje, la longitud o distancia, los costes monetarios y el carburante. Influyen también la congestión y las colas así como los tipos de maniobras requeridas, los tipos de calles (autopistas, calles principales, secundarias, el paisaje), la señalización, las obras en los viales, la fiabilidad del tiempo de viaje y la costumbre. La elaboración de una expresión del coste generalizado que incluya todos estos elementos es una tarea bastante compleja. Además, no es fácil en la práctica representar todos



Asignación

estos factores en un modelo de asignación del tráfico, y por tanto es necesario realizar algunas aproximaciones inevitables. La aproximación más común consiste en considerar sólo dos factores en la elección del recorrido: el tiempo y el coste monetario, siendo estos últimos a menudo estimados de forma proporcional a la distancia o longitud del viaje. La mayor parte de los programas de asignación al tráfico permite al modelizador asignar pesos al tiempo de viaje y a la distancia, para así representar la percepción de los conductores respecto de estos dos factores. La suma ponderada de estos dos factores es por lo tanto el coste generalizado de transporte utilizado en la estimación de la elección del recorrido. Muchas aplicaciones sugieren que, al menos en el caso del tráfico automovilístico urbano, el tiempo sea el factor predominante en la elección de dicho recorrido. Outram y Thompson (1978), contrastaron los objetivos declarados por los conductores en la elección de recorridos con su comportamiento real, y observaron que el porcentaje de usuarios que lograron sus objetivos fue relativamente bajo. Los mismos autores investigaron la combinación de tiempo y distancia en la especificación del coste generalizado que proporciona una mejor explicación de la elección del recorrido. Ellos encontraron que la combinación tiempo y distancia solamente logra explicar un 60-80% de los recorridos realmente observados en la práctica. Dado que la contribución marginal de otros factores en la explicación de la elección del recorrido es muy baja, las partes no-explicadas tienen que deberse a factores como las diferencias en las percepciones, la información imperfecta sobre los costes de recorrido o sencillamente a errores. En general el hecho de que diferentes usuarios elijan diferentes recorridos cuando se desplazan entre el mismo par O/D se atribuye a dos factores diferentes: 1. Las diferencias individuales de los usuarios sobre qué es lo que constituye el mejor recorrido; no sólo individuos diferentes pueden incorporar distintas características en sus costes generalizados sino que también pueden percibirlos de modo distinto. 2. Los efectos de la congestión que afectan primero a los recorridos más cortos y que hacen que sus costes generalizados aumenten hasta ser comparables a los recorridos inicialmente menos atractivos. Ejemplo 10.1: considérese una hipotética ciudad con un recorrido interior de baja capacidad (1.000 vehículos/hora) y otro exterior (circunvalación) más largo pero que permite una mayor velocidad con una capacidad de 3.000 veh/hora (ver Figura 10.2). Se aprecia que durante la hora punta de la mañana se dirigen

MODELOS

DE



TRANSPORTE

hacia la ciudad 3.500 usuarios y que todos ellos querrían utilizar el recorrido más corto, es decir el que pasa por el centro de la ciudad. Está claro que no es posible que todos los usuarios utilicen dicha ruta, ya que estaría bastante congestionada incluso antes de alcanzar la capacidad. Muchos usuarios, por lo tanto, optarán por el segundo recorrido evitando largas colas y demoras. Presumiblemente los usuarios experimentarán ambos recorridos hasta encontrar una solución más o menos estable, que corresponde a la condición en la que ninguno pueda mejorar el tiempo propio de recorrido cambiando dicho recorrido. Éste es el caso típico de equilibrio de Wardrop, que será tratado en detalle en los epígrafes siguientes. La distribución de los flujos entre los recorridos, en este caso, se debe a las restricciones de capacidad. Circunvalación (3.000 v/h)

A

B Centro ciudad (1.000 v/h)

Figura 10.2. Ciudad servida por una circunvalación y un acceso interior.

Sin embargo no todos los 3.500 usuarios se comportarán del mismo modo; en efecto, parte de ellos preferirán siempre la circunvalación por sus condiciones de flujo ininterrumpido o por su paisaje así como otra parte valorará otras características del recorrido por la ciudad. También estas diferencias en los objetivos y en las percepciones contribuirán a distribuir los flujos a través de los diferentes recorridos; a tal efecto generalmente se le denomina componente estocástico de la elección de ruta o recorrido. Diferentes modelos representarán mejor el fenómeno aquí citado. Una posible clasificación de los métodos de asignación del tráfico se ilustra en la tabla 10.2. Los detalles y las características de cada método se discutirán a continuación. Cada método de asignación tiene varias fases, las cuales han de ser tratadas secuencialmente. Las funciones fundamentales son: • Identificar un conjunto de recorridos que pueden ser atractivos para los usuarios; estos recorridos se esquematizan en una determinada estructura



Tabla 10.2.

Asignación

Clasificación de los modelos de asignación del tráfico ¿Incluye efectos estocásticos? No

¿Incluye restricción de capacidad?



No

Todo o nada

Puramente estocástico (Dial y Burrel)



Equilibrio de Wardrop

Equilibrio estocástico del usuario

particular denominada árbol y esta fase es, por lo tanto, a menudo llamada de construcción de árboles. • Asignar un porcentaje apropiado de la matriz de viajes a estas rutas o árboles; así se determinan los flujos en los arcos de la red. • Investigar la convergencia; muchas técnicas siguen un procedimiento iterativo de sucesivas aproximaciones a la solución ideal, por ejemplo, al equilibrio de Wardrop; la convergencia a la solución debe ser controlada para decidir cuándo detener el proceso iterativo.

10.2.3. Construcción de los árboles La construcción de los árboles es una fase importante en cualquier método de asignación por dos razones relacionadas. La primera es que, en la mayor parte de los algoritmos, la construcción de árboles se ejecuta varias veces, al menos una vez por iteración. La segunda es que un buen algoritmo de construcción de árboles puede producir ahorros sustanciales de tiempo y costes y ha de ser un instrumento eficiente que pueda también ser correctamente programado. Van Vliet (1978), ha realizado una buena recopilación y discusión de los algoritmos más importantes utilizados para la construcción de árboles de recorrido mínimo. Este epígrafe se basa fundamentalmente en ese estudio. En general existen dos algoritmos fundamentales que pueden ser utilizados en la búsqueda de los caminos mínimos (más económicos) en las redes viales; uno de ellos debido a Moore (1957) y el otro a Dijkstra (1959). Ambos serán estudiados utilizando una notación conveniente basada en los nodos de un gráfico de red; la longitud (coste) de un arco entre A y B en la red se indicará por dA,B. La ruta, recorrido o itinerario se define por una serie de nodos unidos, A-C-D-H, etc., en tanto que la longitud del recorrido es la suma aritmética de las correspondientes longitudes de los arcos que lo componen. Sea dA la mí-

MODELOS

DE

TRANSPORTE



nima distancia para alcanzar el nodo o el centroide A desde el nodo raíz S del árbol, si PA es el nodo predecesor de A entonces el arco (PA, A) es parte del recorrido mínimo de S a A. El procedimiento de construcción de un árbol de rutas o recorridos mínimos (o de mínimo coste) desde S a todos los demás nodos puede describirse de la siguiente manera: Inicialización: se fija para todos los nodos dA = ∞ (es decir, un valor de la distancia suficientemente grande que va a depender del tipo de ordenador y del compilador que posea), excepto para el nodo raíz cuyo coste (ds) se fija en cero; se confecciona una lista L que deberá contener todos los nodos ya alcanzados desde S y susceptibles de ser el nuevo pivote según el algoritmo correspondiente pero no completamente examinados como predecesores del resto de los nodos. Los nodos contenidos en esta lista L serán aquellos a partir de los cuales se pueden alcanzar el resto de los nodos (copa del árbol, a partir de S, con sus respectivas ramificaciones extendiéndose hasta alcanzar todos los nodos). Por tanto, inicialícense todas las entradas Li en L a cero y todos los PA, entre los cuales estará el próximo candidato a ser pivote a un valor predefinido conveniente. Proceso: partiendo del origen S y considerando el nodo A como nuevo pivote: 1. Se examina cada arco (A,B) de salida desde el nodo pivote A; si dA + dA, B < dB entonces se escribe dB = dA + dA, B, PB = A y se suma B a la lista L. 2. Se quita A de la lista L; si la lista de nodos está vacía se para el proceso y se pasa al paso 3. 3. Se selecciona otro nodo de la lista y se vuelve al paso 1 con el nodo seleccionado como posible nodo pivote a examinar. Llegados a este punto deben considerarse tres observaciones. En primer lugar, generalmente en los recorridos no se permite utilizar centroides, por tanto en el primer paso, si B es un centroide no debería ser añadido a la lista L. La segunda concierne a la diferencia sustancial existente entre el algoritmo de Moore y el de Dijkstra y que se refiere al procedimiento de selección del nodo de la lista L. Moore selecciona el nodo que está más arriba en la lista, es decir el primer nodo que ha entrado; Dijkstra selecciona el nodo más cercano al origen, es decir el nodo Li tal que dLi sea mínimo. Eso requiere cálculos adicionales (incluida la ordenación de los nodos), pero asegura que cada arco sólo sea examinado una vez. Es sabido que el algoritmo de Dijkstra es superior



Asignación

al de Moore, en particular para redes grandes, aunque algo más difícil de programar. Finalmente, estos árboles son almacenados a menudo en ordenadores de dos maneras: como un conjunto de nodos predecesores ordenados donde el nodo A es el predecesor de B si el arco (A,B) forma parte del árbol o como un conjunto de arcos predecesores con idéntica definición. Van Vliet (1977) ha identificado un algoritmo menos conocido pero con prestaciones muy interesantes para el caso de redes grandes. Se trata del algoritmo de D’Esopo descrito y probado por Pape (1974). El algoritmo de D’Esopo utiliza una tabla “de doble entrada” tal que el nodo B sea introducido al principio o al final de la lista dependiendo de su “estatus”. Si B no ha sido previamente extraído del árbol, será integrado al final de la lista; si ya está en la lista, no es necesario realizar ninguna inserción; pero si B ya ha sido insertado en L, examinado y eliminado de la lista entonces puede ser insertado en la parte alta. Es posible utilizar un vector sencillo para registrar el estatus de cada nodo con tres valores potenciales (+1 cuando el nodo nunca ha estado en L, 0 cuando el nodo está en L, –1 para aquellos nodos que ya estuvieron en L y salieron de él porque fueron elegidos pivote. Este último (estatus = 1) es el estatus de todos los nodos cuando el algoritmo termina. Tal y como indica Van Vliet (1977), el algoritmo de D’Esopo puede reducir el tiempo de cálculo al 50% con respecto al de Moore, siendo además sus prestaciones muy cercanas y a menudo mejores a las del algoritmo de Dijkstra; también es más sencillo de programar. Los árboles tienen además otras dos ulteriores aplicaciones importantes en la planificación del transporte. A menudo se utilizan para obtener informaciones sobre los costes en una red. Por ejemplo, se puede saber el tiempo total de viaje entre dos zonas siguiendo la secuencia de arcos en el árbol que los conecta acumulando sus tiempos de viaje. Esta operación a menudo se denomina de “extracción de las propiedades de un árbol” (skimming). De los árboles construidos, por ejemplo, en función del tiempo de viaje, pueden a su vez extraerse otros atributos como los costes generalizados, la distancia, o el número de nodos, etc. Los árboles pueden ser también utilizados para proporcionar informaciones sobre qué pares O-D utilizan ciertos arcos particulares. Estos procedimientos, denominados a menudo “análisis de arcos específicos o seleccionados” permiten identificar qué pares O-D podrían quedar afectados por una modificación de la red. Además, dada una determinada área de estudio es posible utilizar dicho análisis también para delimitar el cordón externo de una sub-área más pequeña y su correspondiente matriz de viajes; en este caso los arcos seleccionados se utilizan para identificar los puntos de entrada y

MODELOS

DE

TRANSPORTE



salida para dicha sub-área y los árboles son utilizados para asociar las zonas originales a zonas “externas” para la nueva sub-área.

10.3. ASIGNACIÓN TODO O NADA El método de elección del recorrido y asignación más simple es la asignación “todo o nada”. Este método supone que no hay congestión, que todos los conductores consideran los mismos atributos, su percepción, su importancia o peso en la elección de ruta de la misma manera. La ausencia de congestión significa que los costes de los arcos son fijos, mientras la suposición de que todos los usuarios perciben el coste de la misma forma significa que todos los que viajan entre i y j deben elegir la misma ruta o recorrido; por tanto dichos usuarios son asignados a un solo recorrido entre i y j y ningún usuario es asignado a otros recorridos menos atractivos. Estas hipótesis son razonables en redes no densas y no congestionadas, con pocas alternativas de recorrido y con costes de recorrido muy diferentes entre ellos. El algoritmo de asignación lo constituye el propio procedimiento de carga de la matriz T a los árboles de camino mínimo y de la determinación de los flujos VA, B en los arcos (entre los nodos A y B). Todos los algoritmos de carga de la red comienzan con una fase de inicialización, en este caso imponiendo que todos los VA, B = 0, y a partir de aquí, se pueden aplicar métodos para resolver el problema: aproximación par por par y aproximación en cascada, es decir, todos a la vez o en cascada. Par por par: éste probablemente es el método más simple, lo cual no quiere decir el más eficiente. En este caso se parte de un origen y un destino a la vez. Primero se inicializa todos los VA, B = 0. A continuación para cada par (i,j): 1. se fija B igual al destino j; 2. si (A, B) es el arco predecesor de B entonces se incrementa VA, B en Tij, es decir: VA, B = VA, B + Tij; 3. se fija B igual a A; 4. si A = i el procedimiento se termina [es decir, se pasa a examinar el próximo par (i, j)], en otro caso se vuelve al punto 2. En cascada: este método se denomina en cascada porque, a partir de un origen i, carga sobre los arcos los flujos acumulados de los nodos siguiendo los árboles de mínimo coste. Sea VA el flujo acumulado en el nodo A:



Asignación

1. se fijan todos los VA = 0 excepto para el destino en que Vj = Tij; 2. se fija B igual a la mayor distancia al nodo más lejano desde i; 3. se incrementa VA en VB donde A es el nodo predecesor de B, es decir, VA = VA + VB; 4. se incrementa VA, B en la cantidad VB, es decir VA, B = VA, B + VB; 5. se fija B igual al siguiente nodo más lejano; si B = i entonces el origen ha sido alcanzado y el proceso vuelve a comenzar por el origen siguiente. En caso contrario volver al punto 3. De este modo VB representa el número total de viajes que desde i atraviesan el nodo B en ruta hacia el destino más lejano de i. Seleccionando los nodos en orden inverso respecto de la distancia, cada nodo es examinado una sola vez. Este algoritmo requiere que los árboles sean almacenados en términos de predecesores ordenados por distancia al origen. Ejemplo 10.2: sea la sencilla red de la figura 10.3 y la siguiente matriz a ella asociada: A-C = 400, A-D = 200, B-C = 300 y B-D = 100. En la parte (a) de dicha figura se presentan los costes (tiempos) de viaje sobre cada arco; en la parte (b) se representan los árboles correspondientes relativos a dichos costes junto con los flujos después de la asignación, mientras que éstos son mostrados en la parte (c) de la figura 10.3. La asignación “todo o nada” generalmente tiene un interés muy limitado para el planificador, porque sólo puede ser utilizada para representar algunos tipos de “líneas de deseo”, es decir las que los usuarios desearían recorrer en ausencia de congestión. Sin embargo su característica práctica más importante es que constituye la base para la construcción de otros tipos de técnicas de asignación, por ejemplo, las de equilibrio y las estocásticas.

10.4.

MÉTODOS ESTOCÁSTICOS

Los métodos estocásticos de asignación de tráfico ponen de manifiesto la variabilidad por parte de los usuarios de la percepción de los costes y la medida en que tratan de minimizar a la vez distancia, tiempo de viaje y costes generalizados. En los métodos estocásticos es necesario también tener en cuenta los recorridos siguientes al recorrido mejor o second best routes (en términos de costes calculados por el analista o modelizador); y este hecho genera problemas posteriores, ya que el número de las rutas second-best alternativas entre cada par O-D puede resultar extremadamente amplio.

MODELOS

DE



TRANSPORTE

(a)

A

5 10 3 4 3 10

6

2 8 4 4 C 4 5 8 3 2 D 2

600 200

400 200

300

300

300

100 100

6

B

(b)

A

400 400 C 200

200 200 300 A (c)

A

B

300

100

D C D

600

400 400 0 400 200 300 500 300 0 C 300 200 100 300 0 0 D 300

0

Figura 10.3. Red simple, sus árboles y flujos de carga de una matriz de viajes.

De los diversos métodos propuestos sólo dos son relativamente aceptados: los métodos basados en la simulación y los basados en proporciones. Los primeros utilizan los resultados de una simulación Monte Carlo para representar la diferente percepción de los costes que tienen los usuarios. Los segundos, en cambio, asignan flujos a las diferentes rutas alternativas de recorrido de proporciones calculadas utilizando expresiones tipo logit.

10.4.1.

Métodos basados en la simulación

Son muchas las técnicas que utiliza la simulación Monte Carlo para representar la variabilidad por parte de los usuarios en la percepción de los costes de los arcos, y en particular destaca la técnica desarrollada por Burrel (1968) que ha sido profusamente utilizada durante muchos años. Normalmente estos métodos se basan en las siguientes hipótesis:



Asignación

Proporción de conductores

• Por cada arco de una red deberían distinguirse los costes objetivos o medidos/ estimados por un observador (modelizador) de aquellos subjetivos o percibidos por cada conductor o usuario. Se acepta además que el coste de arco estimado por dicho modelizador sea sólo la media de los costes percibidos por todos los usuarios. Se supone que estos costes percibidos se distribuyen aleatoriamente según una cierta función de probabilidad como, por ejemplo, la representada en la figura 10.4. Las distintas implementaciones de estos métodos difieren en las hipótesis acerca de la forma de dichas distribuciones de probabilidad; en efecto, mientras Burrel supone una distribución uniforme, otros modelos consideran una distribución normal. En uno y otro caso es necesario obtener o calibrar una desviación estándar o un intervalo para la distribución de los costes percibidos; en general se supone que:

Media del coste en el arco

Coste

Figura 10.4. Distribución de los costes percibidos sobre un arco.

• Las distribuciones de los costes percibidos por los usuarios son independientes. • Los usuarios eligen el recorrido que minimiza sus costes de recorrido percibidos, es decir la suma de los costes de cada arco usado. En términos generales estos algoritmos pueden describirse como se explica a continuación: se selecciona una distribución de costes percibida para cada arco (y un parámetro de dispersión σ). Se subdivide el número de individuos que viajan entre cada par O/D en N estratos de forma que, en cada uno de ellos, se acepta que sus usuarios perciben los mismos costes. 1. Hágase n = 0. 2. Hágase n = n+ 1.

MODELOS

DE

TRANSPORTE



3. Para cada par i, j: • Se calcula el coste percibido por cada arco efectuando una extracción de la correspondiente distribución de costes utilizando números aleatorios. • Se construye la ruta de mínimo coste percibido de i a j y se asignan Tij / N viajes que se suman a los flujos que resultan sobre la red. 4. Si n = N se para, en otro caso vuélvase al paso 2. En la práctica se realizan diferentes atajos para reducir el tiempo de cálculo, por ejemplo: • Generar nuevos conjuntos de costes aleatorios por origen y no por par O-D. • Utilizar N igual a 3 ó 5 y generar un conjunto de costes aleatorios para cada matriz y no para cada par O-D u origen. • Utilizar valores pequeños de N, incluso 1 en algunas circunstancias. Este tipo de aproximación utiliza la simulación para reducir el número de recorridos second best a tener en cuenta. Si se considera necesario, se puede utilizar una gama más amplia de rutas (recorridos) es decir, se puede incrementar el valor de N y/o el parámetro de dispersión de los costes de arco. La formulación de Burrell tiene la ventaja de asignar una probabilidad más alta a aquéllos recorridos que el modelizador ha estimado más económicos, como consecuencia de las variaciones estocásticas en los costes de arco. Si un recorrido es costoso, es menos probable que se comporte como el más económico. Aunque la distribución uniforme se sabe, es más eficiente en términos de tiempo de cálculo, no es, sin embargo demasiado realista. Una función mejor, pero más costosa en términos de tiempo de ejecución, es la Normal con variancia proporcional al coste medio estimado por el modelizador. Como en todos los métodos Monte Carlo, los resultados finales dependen de las series de números aleatorios utilizados en la simulación, aunque este problema puede reducirse aumentando el número N de iteraciones. Hay sin embargo, dificultades más serias con este enfoque como, por ejemplo: • Los costes de arco percibidos no son independientes porque en realidad los conductores tienen preferencias, por ejemplo, prefieren los arcos de autopista para evitar intersecciones o calles locales. La hipótesis



Asignación

de independencia de los costes percibidos puede conducir a cambios en la distribución del tráfico poco realistas entre recorridos paralelos conectados por calles locales. • No se tiene en cuenta de modo explícito el efecto de la congestión. En compensación, estos métodos a menudo producen dispersiones razonables de los viajes y son relativamente simples de programar, no requiriendo la elección y/o la estimación de relaciones flujo-velocidad (lo cual, no obstante, puede llegar a ser un problema en determinados casos).

10.4.2.

Métodos estocásticos proporcionales

Contrariamente al método de asignación Todo o Nada que asigna todos los viajes a un nodo individual de salida, todos estos métodos están basados en un algoritmo de carga de la red y distribuyen los viajes que llegan al nodo entre todos los posibles nodos de salida. Muy a menudo en la implementación de estos métodos se invierte el problema de modo que la división de los viajes en un nodo de llegada se realiza en base a su procedencia y no con respecto al nodo destino. Sea el nodo B de la figura 10.5, en el que hay un número de arcos posibles de entrada definidos por A1, A 2, A3, A4, A5 para la demanda de i a j (pasando por B), se define un factor de reparto f i, tal que:

fi  0

si d Ai r d B

0  fi b 1

si d Ai  d Bi

donde dAi representa el coste mínimo de viaje desde el nodo de origen al nodo Ai. La primera condición requiere que f i sea igual a cero si el nodo inicial Ai está más lejos del origen que B, asegurando de esta forma que los viajes sean asignados a las rutas más eficientes desde el origen. Los viajes TB que pasan por B se reparten de acuerdo a la siguiente ecuación: A4 A2 i

Origen

B

A1 A3

Figura 10.5.

j Destino

A5

Arcos que convergen en un nodo B.

MODELOS

DE



TRANSPORTE

F (A i , B) 

TB f i ¤ fi

(10.11)

i

El procedimiento de asignación ahora es equivalente al proceso de cascada del método Todo o Nada. Los algoritmos que se utilizan en este procedimiento difieren principalmente en la forma de cálculo de f i. El método Single-path, debido a Dial (1971), requiere que: f i = exp(–Ωδdi)

(10.12)

donde δdi es el sobrecoste originado por viajar desde el origen al nodo B, pasando por el nodo A i en lugar de pasar por el recorrido de coste mínimo. Por lo tanto si A i está en el recorrido o ruta de coste mínimo resulta que δdi es igual a cero y f i = 1. Los nodos que pertenecen a la ruta más costosa tienen sus δdi > 0 y sus f i son menores de 1. De este modo los recorridos más cortos son favorecidos con respecto a los más costosos. Inicialmente Dial describe un algoritmo de doble-paso que utiliza una formulación tipo logit para distribuir los viajes de i a j entre las rutas o recorridos alternativos r:

Tijr 

Tij exp( 7Cijr )

¤ exp( 7C

ijk

)

(10.13)

k

El parámetro Ω puede ser utilizado para controlar el reparto de viajes entre rutas. El algoritmo requiere un paso hacia adelante y otro atrás: 1. En el paso hacia adelante se toma cada nodo A en orden creciente de distancias dA y se define un peso por cada arco de salida (A, B), tal que: w(A, B) = WAexp(–Ωδd(A, B)) si dA < dB y cero en otro caso; donde WA es el peso acumulado de A definido: WA =

Ʃw

(A', A)

y WI = 1 (con A’ como predecesor de A).

A'

2. El paso hacia atrás es idéntico al algoritmo single-pass con la excepción de que los pesos w(A, B) se utilizan para calcular la distribución de los viajes en lugar de los factores de reparto Fi.



Asignación

Ejemplo 10.3: un problema práctico del algoritmo de Dial es el relativo a la distorsión que se presenta en la elección entre una ruta principal y otra de carácter secundario. Por ejemplo, considere una ciudad servida por una circunvalación y tres recorridos urbanos que se diferencian muy poco entre ellos (ver Figura 10.6). Asimismo se sabe que hay 4.000 viajes entre A y B y que los cuatro recorridos tienen más o menos el mismo coste. Circunvalación Ruta 2 A

Ruta 1

B

Ruta 3

Figura 10.6.

Ciudad servida por una circunvalación y tres recorridos urbanos.

En este caso el algoritmo de Dial distribuirá los 4.000 viajes de la siguiente forma: 1.000 a lo largo de la circunvalación y 1.000 a cada uno de los recorridos urbanos. Sin embargo, la mayor parte de los usuarios considerarían este problema como si estuvieran disponibles dos alternativas: la circunvalación y los recorridos por el centro de la ciudad. Recuérdese a este respecto la discusión acerca de la propiedad de independencia de las alternativas inherentes al modelo logit vista en el Capítulo 5. El algoritmo de Dial presenta dificultades cuando se consideran todos los recorridos posibles, aun cuando algunos varían poco o son combinaciones de arcos que pueden diferir en un pequeño porcentaje de coste. En términos de comportamiento, Dial ignora la correlación entre recorridos similares y, por lo tanto, en la práctica, asigna más tráfico a las secciones densas de redes con arcos cortos en comparación con partes menos densas con arcos relativamente más largos. De hecho, las estrategias de codificación de redes pueden afectar a la asignación de los flujos.

10.5. ASIGNACIÓN CON CONGESTIÓN 10.5.1. Equilibrio de Wardrop Si se prescinde de los efectos estocásticos y se concentra la atención en las restricciones de capacidad, pueden utilizarse otros modelos diferentes para asignar viajes a la red. Los modelos con restricciones de capacidad utilizan

MODELOS

DE



TRANSPORTE

funciones que relacionan el flujo con los costes (tiempos) de viaje sobre los arcos. Estos modelos generalmente buscan, con diferente éxito, la forma de aproximarse formalmente a las condiciones de equilibrio enunciado por Wardrop (1952): Bajo condiciones de equilibrio, el tráfico se distribuye en las redes congestionadas de modo tal que ningún viajero puede reducir su propio coste de viaje cambiando el recorrido.

Si todos los viajeros perciben los costes de la misma forma (sin ningún efecto estocástico), el equilibrio de Wardrop se puede enunciar así: Bajo condiciones de equilibrio, el tráfico se distribuye en las redes congestionadas de modo tal que todos los recorridos utilizados entre un par O-D tienen el mismo y mínimo coste mientras todos los recorridos no utilizados tienen costes más altos o iguales.

Generalmente a este principio se le denomina Primer Principio de Wardrop o sencillamente equilibrio de Wardrop. Es evidente que si estas condiciones no fueran válidas, al menos algunos conductores deberían ser capaces de reducir sus costes cambiando el recorrido. Ejemplo 10.4: sea de nuevo el caso de la circunvalación y del recorrido individual urbano estudiado en el epígrafe 10.2.2 (Figura 10.2), se supone que la restricción de capacidad para cada recorrido se sustituye por dos relaciones correspondientes tiempo-flujo como las indicadas en la figura 10.7. Los flujos sobre los dos recorridos han de satisfacer el equilibrio de Wardrop cuando los correspondientes costes son idénticos. En este caso es relativamente simple escribir las dos ecuaciones del tiempo de viaje en función del flujo e igualarlas para encontrar la solución de equilibrio, así: tb = 15 + 0,005 Vb

(10.14a)

tt = 10 + 0,02 Vt

(10.14b)

donde tb y tt son los costes de viaje (tiempo en minutos) por la circunvalación y por la ruta urbana respectivamente, y Vb y Vt son sus flujos correspondientes. Igualando tb y tt se puede encontrar, en este caso sencillo, la solución directa al equilibrio de Wardrop como una función del flujo total Vb + Vt = V: 15 + 0,005 Vb = 10 + 0,02 Vt



Asignación

Tiempo

Tiempo

30 25 20 15 10

30 25 20 15 10

5

Flujo V

5

200 400 600 800 1.000 Recorrido centro ciudad

Flujo V 200

400 600 800 1.000 Circunvalación

Figura 10.7. Curvas tiempo-flujo para las rutas de la figura 10.2.

y de aquí: Vb = 0,8 V – 200

(10.15)

La expresión (10.15) tiene sentido solamente para flujos no negativos, es decir, para V mayor o igual que 200/0,8 = 250. Para V < 250, Ct < Cb, Vb = 0 y Vt= V, todo el tráfico irá a través del recorrido urbano. Para situaciones en las que V > 250 se utilizarán ambas rutas; se propone al lector que verifique que para V = 2.000 los flujos de equilibrio son Vb = 1.400 y Vt = 600 y los costes de cada recorrido son 22 minutos. Se podría aplicar el mismo procedimiento para la asignación de flujos sobre redes, en que los costes de viaje considerados en cada ruta entre dos puntos sean los mismos bajo las condiciones de equilibrio de Wardrop. El problema es que en la mayoría de los casos no es posible resolver algebraicamente el problema del equilibrio planteado y para su solución es necesario utilizar otros algoritmos. En esta línea se han propuesto varios algoritmos que logran una aproximación razonable al equilibrio de Wardrop: algunos son simples aproximaciones heurísticas y otros, más interesantes, siguen un esquema de programación matemática bastante más riguroso. Para comparar dichos algoritmos es importante valorar si se cumplen las siguientes propiedades: • ¿Alcanzan una solución estable? • ¿Convergen a una solución correcta (equilibrio de Wardrop)? • ¿Son eficientes en términos de requisitos computacionales?

MODELOS

DE



TRANSPORTE

A menudo se utiliza el indicador δ para valorar en qué medida la solución se acerca al equilibrio de Wardrop. Dicho indicador se define en la siguiente ecuación:

¤ T (C C )  ¤T C ijr

* ij

ijr

ijr

ij

* ij

(10.16)

ij

Cijr – C*ij es el exceso de coste de viaje sobre una ruta particular con respecto al mínimo coste de viaje para el par (i, j). Estos costes se calculan después de que se haya realizado la última iteración y se hayan conseguido los flujos totales para cada arco. Por tanto, δ es una medida del sobre-coste total debido al hecho de utilizar recorridos peores (diferentes de los de coste mínimo) que el óptimo, donde el denominador permite conseguir una medida concreta en términos relativos antes que en términos absolutos. Wardrop, 1952, propuso también una forma alternativa de asignación del tráfico a la red que toma el nombre de Segundo Principio de Wardrop: Bajo condiciones de equilibrio social en redes congestionadas, el tráfico debería distribuirse de tal modo que los costes medios (o totales) de viaje sean mínimos.

Este segundo principio contrasta con el primero, el cual se esfuerza en modelizar el comportamiento individual del usuario que busca minimizar sus costes de viaje. El segundo principio va dirigido al planificador y a los ingenieros de transportes que intentan organizar el tráfico de modo que se minimicen los costes totales de viaje y así conseguir un equilibrio social óptimo. Generalmente los flujos que resultan de los dos principios no son los mismos, y sólo puede esperarse que, en la práctica, el tráfico se sitúe en la red siguiendo una aproximación del primer principio de Wardrop, es decir el equilibrio del usuario individual. Es interesante constatar que el objetivo de la tarificación vial por congestión es lograr acercarse a este óptimo social o Segundo Principio de Wardrop.

10.5.2. Métodos de adaptación de velocidad Algunos de los métodos heurísticos iniciales se basaban en la hipótesis de asignar todos los viajes de cada par O/D a una única ruta (todo o nada), aunque se reconociese el hecho de que la velocidad y, por tanto el tiempo de viaje, estaba



Asignación

influenciada por el nivel de flujo. El más simple de estos métodos consiste en recalcular los tiempos de viaje en los arcos después de una asignación todo o nada, para así conseguir que sean coherentes los costes con los niveles de flujo corriente. Utilizando los nuevos costes y árboles (de mínimo coste), se efectúa una nueva asignación todo o nada. Es fácil confirmar que este método es pobre en cuanto a que los recorridos seleccionados oscilan y el flujo estimado no converge nunca. En el caso de la circunvalación y del recorrido urbano del ejemplo 10.4 con V > 250, los flujos oscilan de tal forma que todo el flujo se asigna a la ruta por la ciudad en la primera iteración y todos a la circunvalación en la siguiente. Este fenómeno sucede obviamente también en las redes más amplias, aunque en algunos casos puede ser difícil de identificar. En un intento de reducir estas oscilaciones de recorridos y flujos se ha propuesto utilizar, en la siguiente iteración, una media de las velocidades pertinentes de dos o más asignaciones todo o nada. Este procedimiento se denomina de adaptación ponderada de velocidades, en contraste con el originario denominado de adaptación directa. Este método, sin embargo, sólo puede proporcionar una mejora aparente en cuanto a que la principal debilidad de ambos, en contradicción por tanto al principio de Wardrop, es que asignan todo el tráfico a un recorrido individual para cada par O/D. En efecto, si se reconsidera el caso del ejemplo 10.4, es fácil observar que también el método de la adaptación ponderada de velocidad carga todo el tráfico alternativamente sobre un recorrido en una iteración y sobre el otro en la siguiente. Ambos métodos producen soluciones inestables, son intrínsecamente no convergentes y, en redes más amplias, el empleo de la media de las variaciones de velocidad sólo disfraza este fenómeno. En términos algorítmicos los dos métodos se pueden describir como sigue: 1. Seleccionar un conjunto inicial de costes de arco corrientes, normalmente referidos a condiciones de flujo libre; hágase n = 0. 2. Construir un conjunto de árboles de rutas de mínimo coste con los costes corrientes y asignar (con el método todo o nada) la matriz a los recorridos para conseguir una nueva serie de flujos; incrementar n en uno, es decir, hacer n = n + 1. 3. (a) En el caso de adaptación directa de velocidades se recalculan los costes de los arcos en relación a los nuevos flujos. (b) En el caso de adaptación ponderada de velocidades se calculan los costes correctos de los arcos como la media aritmética de los costes de las dos últimas iteraciones.

MODELOS

DE



TRANSPORTE

4. Si los flujos o los costes normales del arco no se han modificado significativamente en dos iteraciones consecutivas se para el procedimiento; en otro caso, se vuelve al paso 2. Como se ha sugerido anteriormente, probablemente estos algoritmos no se pararán nunca en el paso 4 a menos que se imponga un límite arbitrario del número n de iteraciones.

10.5.3. Asignación incremental La asignación incremental constituye un método indudablemente más interesante y realista. En este caso el analista fracciona el total de la matriz de demanda T en un número de matrices a través de una serie de factores proporcionales pn comprendidos entre cero y uno, tal que Ʃn pn = 1. Las matrices fraccionadas son cargadas, según un procedimiento incremental, sobre los árboles de mínimo coste que de iteración a iteración han sido calculados en base a los costes de arco de los flujos acumulados. Valores usuales de pn son: 0,4, 0,3, 0,2 y 0,1. El algoritmo se puede describir así: 1. Seleccionar un conjunto inicial de costes de arco (actualizados), normalmente en condiciones de flujo libre, y hacer todos los flujos Va = 0; seleccionar un conjunto de factores pn de fraccionamiento de la matriz T de viajes, tal que Ʃn pn = 1; hacer n = 0. 2. Construir los árboles de mínimo coste (uno por cada origen) utilizando los costes actualizados; hacer n = n + 1. 3. Cargar toda la fracción de demanda Tn = pnT al árbol de mínimo coste con el método todo o nada; de este modo se consigue un conjunto de flujos auxiliares Fa; los flujos acumulados mediante la suma de los flujos sobre cada arco, provenientes de otras iteraciones, son: Van = V an–1 + Fa 4. Calcular un nuevo conjunto de costes de arco actualizados sobre la base de los flujos Van; si no ha sido asignada toda la fracción de T se vuelve al paso 2; de otro modo, parar. Aunque el número de fracciones en que ha sido subdividida la demanda sea muy amplio y los incrementos que se utilizan (pnT) sean muy pequeños, este algoritmo no necesariamente convergerá al equilibro de Wardrop. La técnica de la carga incremental, en efecto, presenta la desventaja de que un flujo ya



Asignación

asignado a un arco no puede ser suprimido en éste y asignado a otro; por tanto, si en una de las iteraciones iniciales se asigna demasiado flujo a un arco (p. ej., a un arco con baja capacidad), las condiciones de equilibrio de Wardrop no se alcanzan y el algoritmo no converge a una solución correcta. No obstante el método de la asignación incremental tiene dos ventajas: • es muy sencillo de programar; • sus resultados pueden ser interpretados como la acumulación de la congestión en los períodos punta. Ejemplo 10.5: considérese, como en los casos anteriores, el ejemplo de los dos recorridos, la circunvalación (bypass) y el recorrido urbano del ejemplo 10.4. Se subdivide la demanda de 2.000 viajes en cuatro incrementos de 0,4, 0,3, 0,2 y 0,1, es decir 800, 600, 400 y 200 viajes. Para cada incremento, calcular los nuevos costes de viaje utilizando la ecuación (10.14). La siguiente tabla sintetiza los resultados de este algoritmo: N

Incremento

Flujo ciudad

Coste ciudad

Flujo bypass

Coste bypass

0

0

0

10

0

15

1

800

800

26

0

15

2

600

800

26

600

18

3

400

800

26

1.000

20

4

200

800

26

1.200

21

Se puede comprobar que el algoritmo no converge a una solución correcta de equilibrio y el error proviene de haber asignado demasiado flujo (800) al arco urbano en la primera iteración. En efecto, dado que no es posible reducir tal flujo en las sucesivas iteraciones, dicho flujo y el coste sobre este recorrido quedan sobrevalorados. Si se calcula el valor del indicador δ, resulta: δ = [800 (26-21) + 1.200 (21-21)] / (2.000 × 21) = 0,095 Es posible comprobar que utilizando un número mayor de incrementos más pequeños se puede aproximar a una verdadera solución de equilibrio. Se observa además que si se comienza con un incremento de 0,3 veces el total de la demanda, la solución que se alcanza es la de equilibrio, aunque esto solamente es una casualidad aplicable a este caso sencillo.

MODELOS

10.5.4.

DE



TRANSPORTE

Método de los promedios sucesivos

Se han desarrollado varios algoritmos iterativos para tratar de superar, al menos en parte, el problema de asignar demasiado flujo a un arco con capacidad restringida. En un algoritmo iterativo de asignación, el flujo actualizado de un arco se calcula como una combinación lineal de los flujos asignados en las iteraciones anteriores y el flujo auxiliar resultante de una asignación todo o nada en la iteración actual. El algoritmo puede ser descrito de la siguiente manera: 1. Seleccionar un conjunto de costes de arco iniciales (actualizados), normalmente en condiciones de flujo libre; se inicializa haciendo todos los flujos Va = 0; hacer n = 0. 2. Construir los árboles de mínimo coste con los costes actualizados y hacer n = n + 1. 3. Cargar toda la matriz T, con método todo o nada, a los árboles de coste mínimo para así conseguir un conjunto de flujos auxiliares Fa; 4. Calcular el flujo actualizado como: Van = (1 – ϕ)V an–1 + ϕFa

(10.17)

con 0 ≤ ϕ ≤ 1. 5. Calcular un nuevo conjunto de costes de arco en base a los flujos Van. Si los flujos o los costes de arco no se han modificado significativamente en dos iteraciones consecutivas, el procedimiento se para; en caso contrario ir al paso 2. Alternativamente, se puede utilizar el indicador δ de la ecuación (10.16) para decidir si parar el procedimiento o no. Otro criterio peor pero comúnmente utilizado para definir el punto de parada, consiste en fijar sencillamente el máximo número de iteraciones; δ en este caso se calcularía para conocer lo cerca que se está de la solución del equilibrio de Wardrop. Las implementaciones de estos algoritmos difieren en cómo asignar un valor a ϕ. Una regla simple es poner ϕ constante, por ejemplo, igual a 0,5 aunque la implementación que proporciona los resultados mejores se debe a Smock (1962), en el que ϕ = 1/n. El lector puede verificar que en este caso se asigna el mismo peso a cada flujo auxiliar Fa y, por esta razón, se denomina el Método de Promedios Sucesivos (Method of successive averages o MSA en inglés). Se ha demostrado que (véase, p. ej., Sheffi, 1985) haciendo ϕ = 1/n, se llega a una



Asignación

solución convergente al equilibrio de Wardrop, aunque no muy eficientemente. Como se demostrará en el Capítulo 11, el algoritmo de Frank-Wolfe estima los valores óptimos de ϕ que garantizan y agilizan la convergencia. Ejemplo 10.6: considérese el problema del recorrido urbano y la circunvalación del ejemplo 10.5 con ϕ = 1/n. En la tabla siguiente se sintetizan los pasos para el cálculo del algoritmo MSA. Iteración 1

2 3 4 5 6 7 8 9 10

ϕ

Flujo ciudad

F V

2.000 n

1

F

2.000

1/2

1.000

1/3

667

F F 1/4

Vn

1/5

F

500

F 1/6

667

Vn

1/7

572

F

1/8

750

Vn

1/9

667

F

V

26

1.200

0,1

600

20 21,7 22,5

0 21

2.000 23,3

1.333

21,7

2.000 21,4

1.428

22,1

0 25

1.250

21,25

2.000 23,3

0 n

1.333 1.500

0

F

1.000

20

2.000 n

15

2.000

0

F

0

2.000 23,3

0 n

V

30

2.000 800

Coste bypass

2.000

0 n

V

50

0

Vn

Flujo bypass

0

0

Vn

V

Coste ciudad

1.333

21,7

2.000 22

1.400

22

Se puede observar que para aproximarse a la solución correcta es necesario un cierto número de iteraciones. En este caso, el valor de δ después de diez iteraciones es cero. También es posible notar que el algoritmo ya estuvo

MODELOS

DE

TRANSPORTE



próximo a la solución correcta de equilibrio en las iteraciones 3, 6 y 9, aunque de hecho sólo es alcanzada en la iteración 10. Ello es debido a la naturaleza rígida de la regla de cálculo de ϕ; en efecto, para redes más reales el número de iteraciones para conseguir convergencias satisfactorias puede ser muy alto. Otra lección que se obtiene de este ejemplo es que fijar el número máximo de iteraciones no representa una buena aproximación desde el punto de vista de la evaluación. Arcos y costes totales pueden variar considerablemente de iteración en iteración y ello puede influenciar la factibilidad de un proyecto de mejora de algunos arcos de la red.

10.6.

ASIGNACIÓN AL TRANSPORTE PÚBLICO

10.6.1.

Introducción

En este epígrafe se describen los problemas de la modelización de la elección de ruta y la asignación de los viajeros en el caso de redes de transporte público. Por múltiples motivos estos problemas son más difíciles de tratar que los de la asignación al transporte privado; los requisitos de cálculo generalmente son más complicados y, además, los métodos más eficientes requieren importantes hipótesis simplifìcatorias. Estas dificultades de modelización conjuntamente con el bajo perfil que ha caracterizado las políticas sobre transporte público en el pasado, han hecho que se hayan destinado menos recursos en investigación para esta modalidad de transporte que para el privado. Evidentemente es posible invertir esta tendencia dedicando mayor atención a las mejoras de los servicios actuales y, en general, a la eficiencia operativa del transporte público. En este epígrafe por tanto, se tratarán en primer lugar los aspectos más significativos que diferencian la asignación al transporte público en relación con la elección de ruta de los vehículos privados. Posteriormente se describirán a grandes rasgos algunos métodos o aproximaciones que han sido aplicados para afrontar estos problemas desde un punto de vista práctico.

10.6.2. Características de la asignación al transporte público 10.6.2.1.

La oferta

La red de servicios de transporte público es diferente a la de transporte privado, en tanto que incluye, como arcos, secciones de los servicios de los autobuses o



Asignación

trenes que transitan entre dos paradas o estaciones. En el transporte público, el concepto de capacidad del arco se asocia a la capacidad de cada unidad (autobús o tren) y a su correspondiente frecuencia. Además, el tiempo de viaje tiene una componente pura a bordo del medio más otra relativa al tiempo de espera en las paradas y otra más debida al tiempo andando hacia y desde la parada para llegar al punto de destino. Muchas secciones del transporte público utilizan los arcos viales dado que los servicios de autobús y algunos tranvías (LRT) recorren las calles de una ciudad. Otras secciones o servicios utilizan en cambio arcos completamente diferentes, por ejemplo, carriles exclusivos para buses, trazados reservados a los trenes, etc. Generalmente la naturaleza de estos arcos genera una red más compleja, como puede verse en el ejemplo de la figura 10.8. 10.6.2.2. Los pasajeros En el transporte público la elección del recorrido se refiere a la elección de los pasajeros y no de los vehículos. Los pasajeros pueden caminar hasta la parada, hacer intercambio entre dos servicios y también efectuar parte del recorrido en coche y luego tomar el transporte público. Ello comporta la necesidad de construir y precisar los arcos peatonales y de transbordo entre diferentes servicios, entre diferentes modos de transporte público (autobús, tren) y entre infraestructuras de transporte público y privado (p. ej., “Park and Ride”). 10.6.2.3.

Los costes monetarios

En las redes de transporte individual es normal suponer que los costes monetarios estén asociados directamente con el consumo de carburante, que es a su vez, proporcional a la distancia de viaje. Éstas son obviamente aproximaciones y son generalmente aceptadas porque los conductores no perciben estos costes de modo tan directo como un pasajero de transporte público percibe su tarifa. En años recientes ha aumentado la variedad de estructuras tarifarias de transporte público; existen hoy tarifas variables con la distancia, tarifa única independiente de la distancia del viaje, tarifas zonales para una o más zonas geográficas particulares, billetes combinados que incluyen transbordos (válido para dos o más servicios), tarifas limitadas en el tiempo (p. ej., tarifas válidas para cualquier número de embarques en una hora), diarias, semanales u otros “bonos o pases” para un servicio dado o que cubren una o más zonas y modos.

MODELOS

DE



TRANSPORTE

16 41 15

1 16

17

14 9 19

2

23

3

18 22 21

20 8 2

24 3

25 7

4 27 20

4

6

28 1

35 34

29

37

11

10 36

39

30

5

6

5

4

31

2

32

5

38

12 33

5

LEYENDA 13

5 40 17

Figura 10.8.

Centroide Nodo Línea de Bus Nº Línea Bus Límite de Zona Conector

Un ejemplo de red de transporte público.



Asignación

Esta amplia variedad tarifaria dificulta el trato de tarifas en los modelos de elección de recorrido y asignación, en cuanto a que los costes monetarios no dependen directamente de la distancia y sí generalmente de la localización del origen y del destino y del recorrido seleccionado. 10.6.2.4.

Definición de coste generalizado

En el caso de una asignación de demanda al transporte público el coste generalizado de viaje puede ser definido como sigue: Cij = a1tijv + a2tijw + a3tijt + a4tijn + a1δn + a5Fij

(10.18)

donde tijv es el tiempo de viaje a bordo del modo para ir de i a j; tijw es el tiempo andando para llegar o ir desde la parada (estación); tijt es el tiempo de espera en la parada; tijn es el tiempo de transbordo; δn es una “penalidad” intrínseca o resistencia al trasbordo, medida en unidad de tiempo (usualmente de 2 a 5 minutos); Fij es la tarifa pagada para desplazarse entre i y j; de a1 a a5 son coeficientes asociados a los elementos de coste respectivos. Usualmente a a1 ó a5 suele otorgársele el valor 1 según se deseen medir los costes generalizados de transporte en unidad de tiempo o coste respectivamente. También es habitual encontrar que a2, a3, y a4 sean dos o tres veces el valor de a1, es decir los viajeros perciben el tiempo de espera o caminando dos o tres veces más que a bordo del medio. En términos de modelización, el software debería ser capaz de tratar todas estas variables y producir una buena estimación de cada uno de estos componentes de tiempo (a bordo, peatonal, de espera, de intercambio) a menos que sus valores no sean proporcionados externamente. El tiempo de viaje a bordo del modo depende de la velocidad alcanzable y del número y de la duración de las paradas en el recorrido; el tiempo utilizado caminando depende de la proximidad de la parada más cercana (más atractiva) y se suele utilizar, en algunos casos, aproximadamente un valor medio del tiempo para la zona completa; el tiempo de transbordo varía en función de la configuración y de la distancia entre las paradas y las estaciones; por fin el tiempo de espera depende esen-

MODELOS

DE



TRANSPORTE

cialmente de la frecuencia del servicio y de su fiabilidad. Una formulación general del tiempo de espera es: tw 

(h 2 S 2 ) 2h

(10.19)

donde h es tiempo entre dos pasos de bus (intervalo) previstos por la programación del servicio y σ es su desviación estándar (cuanto menos regular es el servicio, mayor es el tiempo de espera). Esta formulación supone que los pasajeros llegan aleatoriamente a la parada y que los autobuses tienen capacidad ilimitada, de modo que todos pueden subirse a bordo. El problema relativo a la “congestión del autobús” es difícil de resolver, pero si los algoritmos utilizados no lo consideran es probable que las cargas producidas no sean reales en términos de capacidad real del servicio (véase De Cea y Fernández, 1989). Si el servicio es perfectamente regular, es decir si σ = 0, entonces el tiempo previsto de espera es la mitad del intervalo entre el paso de dos autobuses consecutivos. Es sabido, sin embargo, que si la frecuencia del servicio es baja, los pasajeros tienden a llegar justo pocos minutos antes de la siguiente salida, así que el límite superior del tiempo de espera puede ser establecido entre 5 y 10 minutos; obviamente los pasajeros llegarán tanto más cerca del horario de salida programado cuanto más fiable resulte el servicio. 10.6.2.5.

El problema de las líneas comunes

Éste es probablemente uno de los problemas más difíciles y típicos en la asignación al transporte público. El problema surge cuando, al menos para algunos pares O/D, hay secciones en recorrido donde transita paralelamente más de un servicio de los ofertados, de forma que los pasajeros pueden elegir aquél que se acomoda mejor a sus exigencias. Para dichos pasajeros esta elección no es trivial (habría sido preferible que el usuario hubiese sabido que un servicio expreso iba a llegar tres minutos después del más lento que ha tomado) ni simple desde el punto de vista modelístico. En efecto, mientras en el transporte privado normalmente un conductor elige un recorrido individual entre el conjunto de todos los recorridos posibles, en el caso del transporte público, los usuarios pueden elegir un conjunto de itinerarios prefijados, de forma que cuando una línea de bus susceptible de ser utilizada llega primero a la parada, va a determinar cuáles de los itinerarios factibles realmente van a ser escogidos. La elección es por tanto más compleja y necesita un trato más detallado.



Asignación

No es posible presentar aquí una discusión completa de los algoritmos más apropiados para la asignación al transporte público. Se describirán, por tanto, los principales métodos o aproximaciones a la modelización, primeramente la elección del recorrido y posteriormente la asignación. Estos enfoques difieren en el modo en que se tratan algunas de las problemáticas citadas anteriormente, en particular las que conciernen a la superposición de las líneas y a las de la elección de los métodos de asignación: todo o nada, estocásticos o con restricción de capacidad.

10.6.3. Modelos de elección de ruta en el transporte público Antes de discutir los problemas de la elección del recorrido en presencia de líneas comunes es útil definir con mayor detalle algunos términos como recorrido o ruta, línea y sección. Una línea de transporte público, o sencillamente una línea, es una flota de vehículos que transitan entre dos puntos (terminales) de una red, generalmente con las mismas características de dimensión, capacidad, velocidad, etc. La parada de los vehículos en cada nodo a lo largo de sus recorridos permite a los usuarios subir o bajar de los autobuses (o trenes, etc.). Por tanto cada línea se define por las características del vehículo, la secuencia de los nodos que ella sirve y la frecuencia de los servicios ofrecidos. Una sección de línea es una porción cualquiera de una línea de transporte colectivo entre dos nodos, no necesariamente consecutivos. Una ruta o recorrido de transporte público es cualquier itinerario que un usuario puede seguir sobre la red del transporte colectivo para desplazarse entre dos nodos. La porción de recorrido entre dos nodos de intercambio consecutivo se denomina sección de ruta, a la que se asocian una serie de líneas atractivas o comunes. Una estrategia es una serie de reglas que permiten al viajero alcanzar el mismo destino. Ejemplo 10.9: considérese la red de transporte público de la figura 10.9; una estrategia simple de recorrido podría ser: • Tomar la línea 2 para bajarse en H; trasladarse a la línea 3 y luego bajar en la parada J. En cambio una estrategia más compleja podría ser:

MODELOS

DE



TRANSPORTE

• Esperar hasta 3 minutos a la línea 5 o hasta 4 minutos a la línea 2; o también tomar la línea 1; si está viajando en la línea 5 y se ve un vehículo de la línea 4 en la parada F se puede realizar un cambio de línea y bajar en la parada J; al contrario, si en F no se observa ningún vehículo de la línea 4 se continúa en la 5 hasta J; si se toma en cambio un transporte público en la línea 2 y, si en H se observa la existencia de un vehículo de la línea 4 que esté partiendo, se transfiere a la línea 4, en otro caso se espera a la línea 3 para llegar a J, etcétera. 20 min Línea 1 Línea 2

14 min 4 min

Línea 3 4 min

Línea 4 Línea 5 Nodo A

Figura 10.9.

6 min

8 min 14 min

F

H

J

Red simple de transporte público con los tiempos relativos de viaje.

Durante muchos años la elección de la ruta que minimiza el tiempo de viaje ha constituido la aproximación convencional al problema. Sin embargo, una buena estrategia flexible produce tiempos de viaje esperados más breves con respecto a la aproximación convencional; en efecto, dicha estrategia flexible es más realista y permite al usuario obtener ventaja de la variabilidad del tiempo de espera con respecto a una elección más oportuna de un buen servicio pero con frecuencias más bajas (véanse los trabajos de Spiess y Florian [1989]). Para cada nodo se puede definir también una serie de líneas atractivas que serían parte de una buena estrategia para alcanzar un determinado destino j. Dada una estrategia, un desplazamiento real se desarrolla en base al siguiente mecanismo: 1. Situar al viajero en el nodo i de origen. 2. Abordar el primer bus que llega y que pertenece a la serie de líneas atractivas para los pasajeros de i. 3. Descender del bus en un nodo predeterminado.



Asignación

4. Si todavía no es su destino, se emplaza i en el nodo correspondiente y se vuelve al paso 2; en otro caso, el viaje ha finalizado. Obsérvese que aunque este mecanismo tenga el nodo de destino bien definido, el origen no forma parte de la estrategia. Una estrategia es el conjunto de reglas que permite a los usuarios alcanzar su destino partiendo de un nodo cualquiera de la red. Esta exposición se explica por las siguientes notaciones adicionales: Sjk = conjunto de secciones de línea que conectan directamente los nodos j y k; L+j = conjunto de secciones de línea en salida (en entrada se utiliza el – en lugar del +) del nodo j; vs = flujo sobre la sección de línea s; ts = tiempo de viaje a bordo del vehículo sobre la sección de línea s; fs = frecuencia asociada a la sección de línea s; g j = número de viajes hacia el destino j; Vjk = flujo total sobre la sección de ruta jk. Entonces, se puede identificar el conjunto de líneas atractivas que provienen del nodo j utilizando la variable Xs; donde Xs es igual a 1 si la sección s de la línea, perteneciente al conjunto de secciones que van de j a k, es atractiva, en otro caso es igual a cero. Luego para un par de nodos jk dados, los valores asociados Xs (s ū Sjk) definen el conjunto óptimo o atractivo de las líneas hacia k. El total del tiempo de espera para los usuarios que se desplazan de j a k puede escribirse como:

w  jk

V jk

¤fX s

(10.20)

s

sS jk

El problema de encontrar una estrategia óptima para desplazarse desde todos los orígenes a un destino se puede escribir así: Minimizar s.a.

¤v t ¤ w s s

s

¤v

s

sL j

(10.21)

jk

jk

gj 

¤V

s

sL j

(10.22)

MODELOS

DE



TRANSPORTE

vs 

X s f sV jk

¤fX s

 X s f s w jk s

(10.23)

sSi j

El primer término de la función objetivo (10.21) representa el tiempo de viaje a bordo mientras que el segundo es el tiempo total de espera. Esta función objetivo es lineal en las variables vs y wjk y el principal problema se genera por la no linealidad de las restricciones (10.23). Spiess (1983) ha demostrado que estas restricciones pueden ser relajadas de la siguiente manera: vs ≤ fs wjk

(10.24)

Se puede introducir además la restricción (10.23) dentro de la función objetivo:

« º V jk ¬¤ ts X s f s 1» s ­ ¼ Minimizar ¤ jk ¤ fs X s

(10.25)

sSij

sometida a (10.22). Éste es un problema (0,1) de programación hiperbólica. En este caso pueden seguirse dos aproximaciones diferentes. Una de ellas, propuesta por Spiess y Florian (1989), utiliza programación lineal para resolver el problema; la otra, propuesta por De Cea y Fernández (1989) usa una formulación de programación hiperbólica, no lineal. Si no hay problemas de congestión ni restricciones de capacidad, lo expuesto anteriormente se puede simplificar ya que el conjunto de estrategias óptimas no depende del flujo actual. El algoritmo de Florian y Spiess ha sido implementado en el software EMME/2 (Babin et al., 1982) y el algoritmo de De Cea-Fernández en Santiago de Chile. Las pruebas realizadas con la aproximación de De Cea-Fernández resultan cerca de 2,5 veces más rápidas que las de Florian-Spiess y casi 50 veces más rápidas que una buena aproximación convencional. Estas mejoras en las prestaciones, que son cruciales para modelizar problemas de dimensiones reales, se alcanzan a costa de mayor memoria adicional, aunque hoy en día esto ya no es un problema significativo.

10.6.4.

Asignación de viajes al transporte público

Una vez identificado el mejor conjunto de segmentos de línea que unen los orígenes y los destinos es necesario realizar la asignación de los viajes a estas



Asignación

líneas. La mayor parte de los programas tratan de conseguir una distribución razonable y realista de los viajes entre los recorridos factibles. En las aproximaciones convencionales, en las que las problemáticas de las líneas comunes no se afrontan explícitamente, resulta que la amplia distribución de viajes se genera teniendo en cuenta una serie de criterios; por ejemplo: distinguir explícitamente los diferentes puntos de acceso (paradas, estaciones) para cada zona y construir para cada punto de acceso, y no simplemente para los centroides, los árboles de mínimo coste hacia todos los destinos. De este modo se identifican varios recorridos alternativos, uno por cada punto de acceso diferente. Los usuarios pueden asignarse a estos recorridos utilizando una función multinominal logit en la que los costes son los costes de los arcos entre los orígenes y los destinos para cada ruta o recorrido. Spiess y Florian (1989) realizan la fase de asignación siguiendo estrategias óptimas identificadas. La asignación, por tanto, se consigue asignando a cada arco el porcentaje de volumen acumulado aguas arriba del nodo y que corresponde a la frecuencia ofertada por el arco. De Cea y Fernández (1989), siguen una aproximación parecida pero en dos pasos: 1. En el primero, una vez que ha sido localizada la serie de líneas comunes para todos los pares (i,j) se construye una nueva red en base a los nodos y las secciones de ruta. Es de destacar que las secciones de ruta contienen solamente las líneas que minimizan el tiempo total de viaje esperado en la sección; ellas tienen asociado un tiempo de viaje (tr) y una frecuencia ( fr) correspondiente a la suma de las frecuencias atractivas (las de las líneas comunes). Con estos dos elementos se puede obtener un coste de viaje compuesto a lo largo de esta sección de ruta, y por lo tanto para encontrar la mejor ruta puede utilizarse un algoritmo apropiado y eficiente de construcción de árboles de mínimo coste. Cargando estos árboles resulta un conjunto de flujos de sección de ruta (vr). 2. A continuación se descomponen los flujos de la sección de ruta en las secciones de línea que la conforman:

vs 

f s vr fr

(10.26)

Hasta aquí no se ha tratado el problema referente al empleo de sistemas particulares de tarificación. Si el sistema de tarificación es proporcional a la longitud de viaje se pueden reconvertir las unidades de tiempo en unidades

MODELOS

DE

TRANSPORTE



de costes y, a partir de aquí, añadir a dicho tiempo de viaje sobre cada arco la tarifa. Este tipo de estructura tarifaria, en todo caso, no es muy común. Podría asimismo introducirse un sistema tarifario único (tarifa plana o flat fare) aunque es preciso indicar que el tratamiento de esquemas más complejos desde el punto de vista modelístico puede añadir también dificultades al diseño del algoritmo. En muchos casos prácticos no es posible modelizar toda la complejidad de un sistema tarifario y por tanto, han de realizarse determinadas aproximaciones de acuerdo a las tipologías más comunes de billetes utilizados. Por ejemplo, en el caso de un sistema tarifario zonal la asignación se puede elaborar en base solamente al tiempo de viaje mientras que el coste de la tarifa sólo será añadido al final. Esta solución no tiene en cuenta a los usuarios que dispongan de contratos especiales de transporte (bono-buses), aunque dicho sistema de tarificación zonal puede resultar en todo caso bastante bueno en ciertas situaciones como, por ejemplo, el acceso al centro de Londres. Finalmente, se debe subrayar que la asignación al transporte público presenta, generalmente, los mismos límites que los identificados para las redes de transporte privado. Además es correcto afirmar que la asignación en situaciones de congestión está menos desarrollada que la de situaciones sin congestión. En el caso de redes congestionadas se presentan dos efectos: el primero concierne a la capacidad limitada de las unidades de transporte (autobuses, trenes), lo que provoca que algunos usuarios no puedan realizar sus estrategias óptimas, lo cual supone en general un incremento de su tiempo de viaje; el segundo es que hay una interacción entre transporte público y circulación privada debida al hecho de que se utilizan las mismas calles, de forma que el consiguiente incremento de tráfico sobre un modo influirá en el tiempo de viaje del otro. Los métodos actuales que afrontan estos problemas son bastante aproximados; se tratarán algunos desarrollos de este tema en el próximo capítulo.

10.7.

CONSIDERACIONES PRÁCTICAS

El submodelo de asignación representa una fase crítica en la elaboración del proceso completo de modelización del sistema de transportes. A diferencia de los otros tres submodelos, no existe ningún procedimiento unificado de calibración que pueda asegurar que la fase de asignación reproduzca las observaciones de la mejor forma posible. Los procedimientos más acreditados de validación externa del modelo son los que utilizan los conteos de tráfico



Asignación

o/y los conteos sobre cordones. En particular los procedimientos siguientes pueden aplicarse a todos los tipos de paquetes de asignación, incluso a los de transporte público y a los métodos de equilibrio como los que se tratarán en el próximo capítulo. Validación y doble validación de la red. Ésta es una de las causas más relevantes de error en la asignación del tráfico. Hay numerosas posibilidades de cometer un error en la codificación de una red: omisión de arcos y nodos anteriormente considerados irrelevantes, codificación equivocada de las distancias, empleo de sentidos de marcha erróneos, falta de penalidades por las maniobras de giros, especificación de restricciones de capacidad y curvas de flujo no correctos, etc. En este sentido, aunque los buenos paquetes de software detectan muchos de estos errores de entrada, es muy importante la utilización de visualizaciones gráficas de la red así como editar el grafo representativo y esquematizado de dicha red. Además, no es recomendable subestimar el tiempo necesario para codificar y comprobar su bondad para un estudio determinado. Por ello, cualquier apoyo técnico-científico para agilizar y aumentar la precisión del proceso vale muchos días de trabajo, por ejemplo, el uso de cartografía digital y sistemas de información geográfica. Un método adicional para comprobar una red es cargarla con una matriz unitaria (un sólo desplazamiento por celda) y luego analizar los flujos modelizados. Ello facilitará la detección de los arcos no utilizados (quizás porque se codificaron con una velocidad demasiado baja o con longitudes demasiado largas) y de los demasiado cargados: ambos extremos pueden indicar errores de codificación. La impresión o mejor, el ploteo de algunos árboles de ruta mínima también puede ser útil para la verificación de la red; del mismo modo la individualización de recorridos más breves dispersos y de los nodos no alcanzables puede ser de ayuda para identificar posibles causas de problemas. Si algunos recorridos pareciesen demasiado improbables se debería mejorar la conexión de los centroides a la red, aunque debe tenerse en cuenta que en condiciones de congestión otros recorridos pasarán a ser atractivos para los usuarios y por lo tanto serán utilizados por éstos. En el caso de modelos de asignación de mayor detalle (microsimulación), pueden detectarse posteriormente problemas adicionales ya que la cantidad de datos es más numerosa. Ello también es válido en la asignación de transporte público donde la conexión a las paradas de los autobuses o a las estaciones es crítica para una buena representación de la elección del recorrido. Lo mismo ha de decirse para las infraestruc-

MODELOS

DE



TRANSPORTE

turas intermodales, para las frecuencias y para las velocidades. La regla base es pues: antes de ir a la siguiente fase en la comprobación del modelo, se ha de estar seguro de que todos los datos observables (medibles), estén representados correctamente sobre la red. Entonces lo primero es comprobar la conectividad, posteriormente los atributos de los arcos y después los datos detallados, por ejemplo, los flujos de saturación, la regulación semafórica, etcétera. La adaptación de la función de coste generalizado. Se trata aquí de determinar los pesos asignados al tiempo, a la distancia y a cualquier otra variable incluida en la función de coste generalizado (tipología del arco, calidad del escenario en el que se viaja, etc.). Como criterio de ajuste se podría utilizar un estadístico con forma de Chi-cuadrado:

¤ a

 flujos observados

a

- flujos modelizados a

2

flujos observados a

Cuanto más bajo es el valor de este estadístico mejor es el ajuste (menor el error). Esto puede ser aplicado a los conteos en el cordón o a grupos de conteos de tráfico sobre la parte de la red considerada como más crítica, por ejemplo, la que se refiere a las calles principales y a las secundarias. El valor del estadístico para toda la red también proporciona un indicador de adaptación general. Normalmente un buen punto de partida consiste en suponer que solamente el tiempo explica la elección del recorrido; si se utiliza esta hipótesis, se ha de ejecutar completamente el modelo de asignación con la matriz del año base y, posteriormente, se calcula el estadístico indicado anteriormente. A continuación se inicia de nuevo la ejecución del modelo con un incremento del peso asociado a la distancia (o a otros factores) y se recalcula el estadístico de modo que se puedan elegir los parámetros que proporcionen la mejor adaptación. Ha de resistirse a la tentación de mejorar el ajuste de cada paso con una variación trivial de la velocidad del arco o de la penalidad de giro, ya que éstas reducen el valor del modelo para realizar previsiones. Los errores efectivos descubiertos en esta fase deben, naturalmente, ser corregidos; el modelo debería ser luego también re-elaborado para el resto de los coeficientes del coste generalizado. Cabe señalar que el estadístico propuesto líneas atrás da un peso mayor a la misma diferencia absoluta si se trata de bajos niveles de f lujo que a los más altos. Si no se desea que esto suceda, se debe calcular el indicador para diferentes intervalos de flujo. El porcentaje de infra o supravaloración de flujos



Asignación

puede proporcionar algunas indicaciones de la distorsión que si persiste debería ser estudiada más a fondo. También ha de señalarse que si las capacidades de arco están bien identificadas y codificadas y hay una considerable congestión, la asignación de equilibrio tiende a proporcionar una buena adaptación a los flujos observados, hasta el punto de disfrazar algunos errores presentes en los demás submodelos. Otra forma complementaria de comprobar la buena calibración de una red es mostrar en un gráfico los tiempos de recorrido en el modelo con aquellos observados en la red mediante vehículo flotante. Para ello se seleccionan normalmente tramos con unos cinco o más arcos para obtener tiempos de recorrido significativos y que no dependan mucho de variaciones en las demoras en intersecciones. Hay evidencia de que diferentes tipos de usuarios asignan pesos distintos a los componentes del coste generalizado; por ejemplo, los viajes de los vehículos pesados son más sensibles a la distancia y a la pendiente que los coches. En este caso, las clases deberían ser asignadas separadamente en la red utilizando coeficientes apropiados a cada caso. En el caso del transporte público los pesos relativos del tiempo andando, de espera y a bordo del vehículo son parte del proceso de calibración. Las penalidades de intercambio o transbordo desarrollan un papel parecido y proporcionan un elemento adicional para hacer que el modelo sea más realista. Los conteos de pasajeros en el transbordo y en las paradas deberían considerarse separadamente para la calibración de estos pesos. Una aproximación similar a la de Sush et al. (1990) podría ser conveniente para mejorar el ajuste una vez que el resto de los errores de la función de coste generalizado fueran reducidos a lo mínimo. Álvarez (1995) ha estudiado con buenos resultados un método de optimización analítica para conseguir el mejor ajuste del modelo de asignación. Afinamiento del modelo de asignación. Se trata aquí de investigar para obtener los mejores parámetros de dispersión en un modelo de asignación estocástica. Esta fase debería ser desarrollada con particular cuidado, ya que según la implementación, estos parámetros pueden tener diferentes interpretaciones y dimensiones. La documentación de los programas de cálculo debe examinarse en detalle para guiar este proceso, pues cada paquete difiere en sus detalles prácticos. Modelos detallados de asignación a nivel urbano como los que se describen en el próximo capítulo, proporcionan oportunidades adicionales para refinar el

MODELOS

DE



TRANSPORTE

modelo de asignación. Estos modelos son mucho más poderosos pero también pueden, inadvertidamente, ocultar errores más sustanciales en el proceso de codificación. Ejemplos de este tipo son el ajuste de los parámetros de aceptación de brechas en intersecciones, la representación de las maniobras de giro obstaculizadas en los semáforos, etc. Debería prestarse particular atención para asegurar que estas correcciones correspondan a las actuales condiciones de la ingeniería del tráfico y no manipular simplemente los parámetros para mejorar el ajuste del modelo. Ha de tenerse presente que ningún modelo de asignación reproducirá exactamente las observaciones. Siempre habrá variaciones y errores en los conteos de tráfico y en las matrices de viaje, así como un porcentaje del comportamiento real de elección de ruta quedará sin explicar. Lo que realmente importa, sin embargo, es que los costes resultantes sean lo más precisos posibles y que el modelo constituya una base válida para comparar alternativas a nivel táctico o estratégico.

EJERCICIOS 10.1. La red vial representada en la figura 10.10 conecta dos zonas residenciales, A y B, con dos centros comerciales importantes, L y M. Los tiempos de viaje entre los nodos se indican en minutos y todos los arcos son de doble sentido. Supóngase que inicialmente los costes de estos arcos son independientes del nivel de tráfico. 5

A 7 15 B

7 11

11

11

C 9

7 E

9 7

D

13

F

9 7

9 3

G 9 H

2

I

13

12

J 9

3

L

K

12 2

M

Figura 10.10. Red simple para el ejercicio 10.1.

a) Utilizar un procedimiento sistemático para encontrar los recorridos más rápidos entre los orígenes A y B y los destinos L y M; calcular los correspondientes tiempos de viaje.



Asignación

b) Durante la hora punta del sábado por la mañana el número de vehículos que viajan de A y B hacia L y M son los siguientes: A – L = 600

A – M = 400

B – L = 300

B – M = 400

Estimar los flujos de tráfico sobre cada arco en el período considerado. c) Supóngase ahora que los tiempos de viaje sobre cada arco aumentan en 0,02 minutos para cada vehículo/hora. Utilizar una técnica incremental de carga de la red para obtener un conjunto de flujos calculados con restricción de capacidad. Calcular los tiempos de viaje finales por cada par O-D. d) Utilizar una técnica iterativa de carga de la red para obtener los flujos y los costes en las condiciones indicadas en el punto (c). 10.2. Un área de estudio contiene dos zonas residenciales A y B y tres zonas de actividad laboral J, K y L. Las zonas están conectadas por una red vial como la indicada en la figura 10.11, en la que además se señalan los costes de viaje en ambas direcciones; se supone además que los costes son independientes de los flujos de tráfico. 3

A 4 B

8

4 6

4 C

5

F

7

G 5

4

E 4

2

6

D

5

5 2

H 5

4

J

7 I

K 5

2

L

Figura 10.11. Red simple para el ejercicio 10.2.

a) Utilizar un procedimiento sistemático para obtener las rutas de mínimo coste entre los nodos A y B y los destinos J, K y L y obtener la matriz de costes de viaje C. b) El número total de viajes con origen y destino en cada zona en la hora punta de la mañana es:

MODELOS

DE



TRANSPORTE

Origen

Viajes

Destino

Viajes

A

1.000

J

700

B

2.000

K

1.000

L

1.300

Ejecutar un modelo gravitacional restringido a origen en el que la función de fricción sea proporcional a exp (–0,1 Cij) y obtener la matriz de viajes. Utilizar esta matriz para calcular los flujos en todos los arcos de la red. c) Ejecutar un modelo gravitacional doblemente acotado con el mismo tipo de función de fricción y obtener una nueva matriz de viajes y flujos de tráfico. Contrastar los resultados conseguidos en los casos (b) y (c). 10.3. Considérese la red elemental representada en la figura 10.12 en la que hay 100 vehículos/hora entre A y X y 500 entre B y X. Los tiempos de viaje en función del flujo se indican en la figura en minutos y el flujo q en vehículos/hora. t = 10 + 0,001 q A C

t = 3,4 + 0,001 q

t = 2,0 + 0,01 q E

X

t = 12,0 + 0,001 q

B D t = 1,0 + 0,001 q

Figura 10.12. Red simple para el ejercicio 10.3.

a) Utilizar una técnica incremental de carga de la red con fracciones del 40, 30, 20 y 10% del total de la demanda para obtener una aproximación a la asignación de equilibrio. b) Utilizar una técnica iterativa de carga de la red para conseguir el mismo resultado. ¿Cuántas iteraciones son necesarias para alcanzar un buen nivel de convergencia?

11. Equilibrio entre oferta y demanda

11.1.

E

INTRODUCCIÓN

n el Capítulo 10 se han expuesto las técnicas de asignación a transporte público y privado identificando las dos motivaciones principales por las que, en la práctica, la demanda entre un mismo par O/D se reparte entre diferentes rutas. La primera de ellas se refiere a la diferente percepción de los costes del arco y de viaje por parte de los usuarios. La segunda hace referencia a los efectos de la congestión, y para estudiar este problema y como esquema general de referencia, se utilizaron los principios de Wardrop. En particular el primer principio de Wardrop afirma que bajo condiciones de congestión los usuarios entre un mismo par O/D se reparten entre diferentes recorridos hasta que ninguno pueda reducir su propio coste de viaje cambiando el recorrido; y si todos los usuarios perciben los costes de la misma manera, quedan establecidas las condiciones de equilibrio a partir de las cuales todas las rutas o recorridos utilizados entre dos puntos tienen el mismo y mínimo coste y todas aquellas no utilizadas tienen costes iguales o mayores. Las técnicas de asignación sobre redes congestionadas, tal y como se expuso en el anterior capítulo, tratan de aproximarse a este tipo de equilibrio. Se ha comprobado que estos métodos heurísticos a menudo fracasan a la hora de alcanzar el verdadero equilibrio de Wardrop. Es por ello que este problema merece una atención más profunda. En el epígrafe 11.2 se estudiará la asignación de equilibrio mediante una estructura de programación matemática más rigurosa, aunque en dicho epígrafe sólo se hará referencia al caso en que los costes en un arco únicamente dependen de los flujos que recorren ese mismo arco; en ese mismo epígrafe también se tratará el equilibrio estocástico y social. En el apartado 11.3, en cambio, se extenderá la asignación de equilibrio a los problemas en que el coste en un arco, o las posibles demoras, dependan de los flujos del resto de los arcos de la red. Esta formulación más general es



Equilibrio entre oferta y demanda

apropiada para redes urbanas, donde las demoras en las aproximaciones, por ejemplo a una rotonda, dependen más que nada de los flujos que circulan en la intersección. En el subtítulo 11.4 se extenderá el tratamiento de equilibrio a la elección modal y al modelo de distribución; el objetivo en este caso es asegurar que los tiempos de viaje implícitos en los costes utilizados para ejecutar estos modelos sean coherentes con los obtenidos durante la asignación. Sin embargo, como se ha visto en el caso de la asignación, en condiciones de congestión con métodos que ajustan sólo velocidades, la simple iteración de los últimos tres submodelos no garantiza convergencia a condiciones de equilibrio. En este epígrafe se describen algunos de los métodos más interesantes, aportándose asimismo algunas consideraciones prácticas sobre este tema. Por fin en el epígrafe 11.5 se tratará el problema de la modelización del horario de salida mediante la extensión de las formulaciones estudiadas, para así tener en cuenta esta importante reacción conductual.

11.2.

EL EQUILIBRIO

En este epígrafe se exponen los métodos concebidos concretamente para lograr soluciones del modelo de asignación del tráfico que satisfagan el primer principio de Wardrop. Para afrontar esta problemática se seguirá una combinación de aproximaciones intuitivas y analíticas, aunque en estas últimas no se profundizará más allá de lo necesario para saber utilizar las técnicas de asignación de equilibrio. Los lectores interesados en los aspectos más teóricos de la asignación de equilibrio pueden consultar el excelente libro de Sheffi (1985) o más recientemente el texto de Bell y Iida (1997).

11.2.1.

Enfoque de programación matemática

Antes de todo, se han de tener en cuenta algunas propiedades intrínsecas del equilibrio de Wardrop, y en particular la que se refiere a que todos los recorridos utilizados (para cada par O-D) deberían tener el mismo coste de viaje (mínimo), y todos los recorridos no utilizados deberían tener costes superiores o al menos iguales. Esto puede escribirse como:

«® Cij* cijr ¬ * ­®r Cij

Tijr*  0 Tijr*  0

MODELOS

DE



TRANSPORTE

donde {T *ijr} es un conjunto de flujos de ruta que satisface el primer principio del equilibrio de Wardrop, de forma que todos los costes han sido calculados después de que T *ijr hayan sido cargados. En este caso los flujos vienen dados por: Va  ¤ Tijr Dijra (11.1) ijr

donde δaijr vale 1 si la ruta r entre i y j utiliza el arco a y cero en otro caso. El coste a lo largo de una ruta o recorrido puede calcularse como:

Cijr  ¤ Dijra ca (Va* ) a

(11.2)

Aunque Wardrop presentó este principio en 1952, tuvieron que pasar cuatro años más para que Beckman et al. (1956) propusieran un esquema riguroso para expresar dicho principio en términos de programación matemática; y pasaron algunos años más hasta que fue propuesto y probado un algoritmo válido para las aplicaciones prácticas. El enfoque de programación matemática expresa el problema de obtener el equilibrio de Wardrop en términos de minimización de una función objetivo sometida a restricciones que representen las propiedades de los flujos. El problema puede escribirse así: Minimizar

Va

Z [Tijr ]  ¤ ° Ca ( )d a

s.a.

¤T

ijr

r

Tijr ≥ 0

 Tij

0

(11.3) (11.4) (11.5)

Es importante destacar que la función objetivo corresponde a la suma de las áreas debajo de las curvas de coste-flujo para todos los arcos de la red. El por qué (11.3) es un objetivo razonable de minimización que satisface el equilibrio de Wardrop, es algo que se tratará de demostrar más adelante; antes es necesario considerar las propiedades generales de este problema de programación matemática. Las dos restricciones (11.4) y (11.5) han sido introducidas para asegurar que sólo se opera en el espacio de soluciones factibles, es decir con flujos de ruta no negativos provenientes de la matriz de viajes. El papel de la segunda



Equilibrio entre oferta y demanda

restricción (no negatividad de los viajes) es importante pero no esencial a este nivel de discusión del problema. El lector interesado en este problema puede recurrir al libro de Sheffi o a los clásicos artículos sobre este tema como los de Fernández y Friesz (1983), y Florian y Spiess (1982). Se puede demostrar que la función objetivo Z es convexa ya que sus derivadas primera y segunda no son negativas. En efecto:

uZ u  uTijr uTijr

¤° a

Va

0

Ca ( )d  ¤ a

d dVa



Va

0

Ca ( )d )

uuTV

a

ijr

pero de (11.1) se tiene:

uVa  Dijra uTijr Ahora, como Va sólo depende de Tijr si el recorrido pasa por este arco,

d dVa

°

Va

0

Ca ( )d  Ca (Va )

se tiene que

uZ  ¤ Ca (Va ) ijra  cijr uTijr a

(11.6)

la derivada segunda de Z con respecto del flujo de ruta es:

u2Z u  2 uTijr uTijr

¤ C (V )D a

a

a

a ijr

¤ a

dCa (Va ) uVa a dC (V ) Dijr  ¤ a a Dijra Dijra dVa uTijr dVa a

(11.7)

Esta expresión sólo es mayor o igual a cero si la derivada de la relación coste-flujo es positiva o cero. Ésta es una condición general de convergencia del equilibrio de Wardrop a una solución única. El significado de esta condición es que las curvas de coste-flujo no deberían tener secciones donde los costes decrezcan cuando los flujos aumenten: deben ser curvas de crecimiento monotónico. Ya que el problema identificado por (11.3) a (11.5) es un problema de optimización restringida, su solución se puede encontrar utilizando el método de Lagrange. El Lagrangiano se puede escribir así:

MODELOS

DE



TRANSPORTE

¨ · L [Tijr ,ij ]  Z [Tijr ] ¤ ij ©Tij ¤ Tijr ¸ ij r ª ¹









(11.8)

donde ϕij son los multiplicadores de Lagrange que corresponden a las restricciones (11.4). Derivando (11.8) con respecto a ϕij se obtiene, naturalmente, la correspondiente restricción. Derivando con respecto a Tijr e igualando a cero (para optimizar), se tiene:

uL uZ 

ij  cijr ij uTijr uTijr Dos posibilidades con respecto del valor de T *ijr óptimo. Si T *ijr = 0:

uL ≥  0 , ya que la función es convexa uTijr Si T *ijr ≥ 0 entonces:

uL 0 uTijr Esto puede ser trasladado a las siguientes condiciones de optimalidad:

ij* b cijr ,

ijr

donde Tijr*  0

ij*  cijr ,

ijr

donde Tijr*  0

En otras palabras, ϕij* ha de ser igual a los costes a lo largo de las rutas con Tijr positivo y debe ser menor (o al menos igual) a los costes a lo largo de las demás rutas (por ejemplo, donde Tijr = 0). Por tanto, ϕij* es igual al coste mínimo de viaje de i a j: ϕij* = cij*. En este sentido, el conjunto de Tijr* que minimiza (11.7) tiene las siguientes propiedades:

cijr r cij*

Tijr*  0

cijr  cij*

Tijr*  0

por tanto la solución satisface el primer principio de Wardrop.



Equilibrio entre oferta y demanda

Ejemplo 11.1: considérense el recorrido urbano y la circunvalación del ejemplo 10.4. La figura 11.1 muestra la relación coste-flujo, de forma que el área sombreada es la función objetivo que se desea minimizar. Naturalmente un modo para minimizar dicha área es tener un flujo igual a cero, es decir V b = Vt = 0; en todo caso esta solución es trivial y también de escaso interés. Lo que se desea conseguir es una solución que satisfaga el total de la demanda (2.000 vehículos) como se indica en la figura 11.2, en la que las dos funciones de flujo ahora están situadas en el mismo eje de abscisas pero desarrolladas en dirección opuesta, separadas por el flujo total que debe ser distribuido entre las dos rutas. Coste

Coste

30

30

20

20

10

10

0

0

500

1.000

V

0

0

500

1.000

V

Figura 11.1. Curvas de coste-flujo para la circunvalación y para el recorrido urbano.

En la figura 11.2a es fácil ver que la suma de las áreas cubiertas por las curvas de coste-flujo es mínima para Cb = Ct; como puede verse en la figura 11.2b cualquier desplazamiento desde la igualdad añade una nueva sección de área. Como se aprecia, la solución de equilibrio comporta un flujo circulante por el centro de la ciudad de 600 vehículos y 1.400 por la circunvalación. Merece la pena resaltar que el coste para cada recorrido es de 22 minutos y el coste total en la red es de 44.000 vehículos-minuto. En esta explicación de la asignación de equilibrio se han omitido algunos detalles como por ejemplo, el de la unicidad de la solución. En efecto, puede demostrarse que sólo los costes de arco ca*, los costes interzonales cij* y los flujos de arco Va* son únicos en el punto óptimo de equilibrio. Los flujos de ruta Tijr* no son, en general, únicos. Esto significa que puede haber muchas combinaciones de rutas y de viajes que las utilizan, que producen el mismo flujo de arco así como que soportan el mismo coste de arco; como todos los

MODELOS

DE



TRANSPORTE

recorridos utilizados (para un par O-D) tienen el mismo coste mínimo, los totales de los costes interzonales son los mismos. Ello se puede comprender fácilmente si se piensa en diferentes zonas con origen externo que producen viajes en la entrada de la intersección A y posteriormente salen a diferentes destinos en la intersección B, como puede verse en la figura 11.2; aunque estos viajes puedan distribuirse en diferentes modos entre las rutas del centro ciudad y de la circunvalación, en condiciones de equilibrio, los flujos en arcos y los costes de arco permanecerán iguales. (a)

40

40

30

30

20

20

10

10

0

0 2.000

(b)

50 Ct

Cb 50

500 1.500 Vt

1.000

1.500 500 Vb

0 2.000 0 50 Ct

Cb 50 40

40

30

30

20

20

10 0

0 2.000

10 500 1.500 Vt

1.000

1.500 500 Vb

0 2.000 0

Figura 11.2. Equilibrio en una red simple.

11.2.2. Métodos solución En el epígrafe anterior se ha descrito el problema matemático de asignación de equilibrio y se ha mostrado la importancia de su correcta resolución. El problema de programación matemática no es lineal y puede resolverse de varias



Equilibrio entre oferta y demanda

formas. Aunque la teoría de la asignación de equilibrio requiera cierta base matemática resulta que las aplicaciones de estos principios y algoritmos de solución son relativamente sencillos. El algoritmo más comúnmente utilizado se debe a Frank y Wolfe, y se considera una importante mejora de los métodos iterativos heurísticos tratados en el epígrafe 10.5.4. 11.2.2.1. Algoritmo de Frank-Wolfe 1. Seleccionar un conjunto inicial idóneo de costes de arco, generalmente tiempos de viaje Ca(0) a flujo libre. Al inicio del proceso hacer todos los flujos V a0 = 0; también n = 0. 2. Construir el conjunto de árboles de mínimo coste con los costes de que se dispone; hacer n = n + 1. 3. Cargar toda la matriz T sobre estos árboles con el método todo o nada; de este modo se consigue un conjunto de flujos auxiliares Fa. 4. Calcular los flujos correspondientes: V an = (1 – ϕ)V an–1 + ϕFa eligiendo ϕ de modo tal que el valor de la función objetivo Z sea mínima. 5. Calcular un nuevo conjunto de costes de arco en base a los flujos V an; si los flujos (o los costes de arco) no se han modificado significativamente en dos iteraciones consecutivas, se para; en otro caso se vuelve al paso dos. Con respecto al método iterativo heurístico, la principal mejora reside en el paso 4, donde ϕ se calcula utilizando una formulación de programación matemática en lugar de reglas predefinidas. Esta forma de proceder es suficiente para garantizar una convergencia eficiente hacia el equilibrio de Wardrop. El algoritmo de Frank-Wolfe puede visualizarse como una aproximación de tipo descendente al problema de la minimización de la función objetivo. Una forma de explicar este enfoque es asimilarla al conjunto de reglas que deben seguirse para encontrar “el punto más bajo de un valle cerrado envuelto en una espesa niebla” (o más concretamente quizás, “encontrar la cima de una montaña en un día de espesa niebla”), pero en este caso, las reglas expuestas anteriormente se deben utilizar en una dirección de subida en lugar de en una de descenso. El conjunto idóneo de reglas para el problema de la búsqueda del “valle” es:

MODELOS

DE



TRANSPORTE

1. Elegir la dirección que parezca más idónea para descender; con niebla densa (número de puntos denso), dicha dirección dependerá esencialmente de la topografía local. 2. Caminar en la dirección elegida hasta que se comience a subir de nuevo. 3. Detenerse momentáneamente en este punto, elegir otra dirección de pendiente que permita descender y progresar como en el punto 2 hasta que se llegue a un punto en el que no haya más direcciones de descenso. En este caso se habrá llegado “al fondo del valle”. Lo citado hasta aquí es lo que básicamente ha de realizarse para utilizar el algoritmo de Frank-Wolfe, aunque en un espacio no expresamente tridimensional sino evidentemente multidimensional. En cada paso de la iteración se tiene una posible solución factible (una posición en el valle) de forma que el algoritmo utiliza la última asignación todo o nada para proporcionar una dirección de descenso. Con este fin, la utilización de dicha asignación todo o nada en la última asignación puede contemplarse como una aproximación local para minimizar la función objetivo Z. Puesto que la solución factible se precisa para el flujo de ruta {Tijr}, Frank-Wolfe busca una segunda posible dirección atractiva {Wijr} utilizando una aproximación lineal de Z (mediante desarrollos en serie de Taylor):













Z ' [Wijr ]  Z [Tijr ] ¤ ijr

uZ (Wijr Tijr )  uTijr

(11.9)

 Z [Tijr ] ¤ CijrWijr ¤ Cijr Tijr ijr

ijr

Aquí el único término que no es fijado por la solución factible {Tijr} es CijrWijr por tanto si se desea minimizar una aproximación local de Z se deben elegir los recorridos o rutas Wijr tales que minimicen los correspondientes multiplicadores Cijr. Una forma de hacerlo es elegir rutas que sean factibles a coste mínimo, por ejemplo las de la asignación todo o nada con los costes más recientes. En términos generales el algoritmo de Frank-Wolfe tiende a converger rápidamente en las primeras iteraciones, pero más lentamente cuando se acerca al óptimo. Éste es un problema bien conocido y para agilizar la convergencia, se han sugerido varias mejoras; véase, por ejemplo, el trabajo de Arezki (1986).



Equilibrio entre oferta y demanda

11.2.3. Equilibrio social Todo lo tratado hasta aquí aplica en gran parte el primer principio de Wardrop a los problemas del equilibrio del usuario (UE). El segundo principio de Wardrop especifica que los usuarios deberían elegir rutas que minimicen los costes totales (o el coste medio para una matriz fija). Ésta es una solución de óptimo social y es una receta para el planificador que no trata de representar el comportamiento espontáneo de los usuarios. Es fácil ver que el segundo principio de Wardrop puede ser incluido en un programa matemático del siguiente tipo: Minimizar

S [Tijr ]  ¤Va ca ( )

(11.10)

a

s.a. (11.4) y (11.5). La función objetivo también puede expresarse de la siguiente forma: Minimizar

Va

S [Tijr ]  ¤ ° Cm a ( ) d a

0

(11.11)

donde Cma es el coste marginal de viajes en el arco a. Este problema puede resolverse con una simple adaptación del algoritmo de Frank-Wolfe, consistente en reemplazar la función objetivo utilizada en la estimación de los parámetros ϕ en el paso 4 por (11.10) o por (11.11). Es sencillo ver que en la solución a este problema los costes marginales de todas las rutas utilizadas entre dos puntos son iguales y mínimos. Las soluciones de estos dos problemas no son las mismas; en otras palabras, el equilibrio (egoísta) del usuario genera soluciones con costes totales más altos que en el caso del equilibrio social. La diferencia está en los efectos externos debidos a la congestión. El usuario percibe sólo su coste individual y no distingue las demoras adicionales generadas a otros usuarios como consecuencia de la incorporación de su vehículo al arco. La tarificación vial urbana por congestión (road pricing o peaje urbano), en particular en su versión electrónica, representa una forma de lograr que dicho usuario perciba este coste marginal en lugar de su coste medio individual. Ejemplo 11.2: sea de nuevo el problema del recorrido urbano y la circunvalación considerada en ejemplos anteriores, se trata de obtener el modelo de

MODELOS

DE



TRANSPORTE

flujo que minimiza el total del gasto (o dicho de otra forma, en el caso de una matriz fija de viajes, minimizar la media de los costes de viaje). Los costes totales son:

Eb  Vb 15 0, 005 Vb

para la circunvalación

Et  Vt 10 0, 02 Vt

para el centro ciudad

y los respectivos costes marginales son:

uEb  15 0, 01 Vb uVb uEt  10 0, 04 Vt uVt Igualando los dos términos y sabiendo que Vb + Vt = 2.000 se puede resolver el sistema y encontrar así las condiciones de equilibrio social: Ruta urbana

Flujo

Circunvalación

500

1.500

Coste marginal

30

30

Coste medio

20

22,5

10.000

33.750

Coste total

Total

2.000

43.750

Observar que el coste total sobre la red ahora es de 250 vehículos-minuto menos que el que había en la solución del equilibrio del usuario obtenida en el ejemplo 11.1. Naturalmente no se puede esperar que, con estos valores, los usuarios elijan la circunvalación, en cuanto a que, indudablemente, algunos de ellos podrán reducir su coste de viaje eligiendo la ruta urbana. Para conseguir el óptimo social deberían incrementarse los costes de los usuarios que pasan por el centro de la ciudad en 2,5 minutos, por ejemplo haciendo pagar este hecho en forma de un peaje. Ello representaría sencillamente un traslado de un consumo privado a uno colectivo con el resultado de ahorrar en la utilización de los recursos (tiempo y combustible).



Equilibrio entre oferta y demanda

11.2.4.

Asignación de equilibrio estocástico

Hasta ahora se han tratado los modelos de asignación estocástica pura así como los de asignación de equilibrio del usuario. En el primer caso se ha visto que la distribución de flujos entre las rutas que conectan dos puntos se produce por la variabilidad en la percepción de los costes de ruta; en el segundo caso en cambio, se debe a los efectos de las restricciones de capacidad. En realidad, ambos tipos de efectos desarrollan su papel correspondiente en la elección de ruta. Los modelos que prueban a incluir ambos efectos se denominan modelos de equilibrio estocástico del usuario (Stochastic User Equilibrium o SUE en inglés) y buscan las condiciones de equilibrio en que: cada usuario elige la ruta de mínimo coste de viaje percibido: en otras palabras, bajo condiciones de SUE ningún usuario puede reducir el coste propio percibido de recorrido y por tanto todos quedan sobre su recorrido factible.

La diferencia entre equilibrio estocástico y de Wardrop es que en el modelo SUE cada conductor define el coste de viaje individualmente en lugar de utilizar una sola definición de costes aplicable a todos los conductores. Estos modelos que incorporan propiedades estocásticas y de equilibrio son teóricamente atractivos aunque presentan dificultades operativas y prácticas de aplicación. Desde un punto de vista práctico su principal dificultad reside en las propiedades de convergencia de estos algoritmos. Para examinar este problema, la convergencia se define de la siguiente manera: un algoritmo de asignación se dice “convergente” si: • comenzando con un conjunto particular de costes de arco Ca, por ejemplo costes a flujo libre en la primera iteración y los costes calculados en función de los flujos en la segunda iteración y • asignando una matriz, en base a reglas específicas, por ejemplo las del algoritmo de Dial, y produciendo nuevos flujos de arco {Va}, resulta que: Ca = Ca{Va} En otras palabras, los costes que resultan de los nuevos flujos son prácticamente los mismos que los utilizados para encontrar las rutas y la asignación de tráfico. Si el algoritmo no convergiese, la solución (flujos y costes) dependería del momento de parada del proceso iterativo, puesto que sería una decisión arbitraria. Diferentes analistas que afrontasen este mismo problema pero que

MODELOS

DE



TRANSPORTE

realizasen diferente número de iteraciones, encontrarían costes diferentes y evidentemente en el caso de que se estuviese evaluando un proyecto de transportes, esto no sería una característica deseable. Puede demostrarse que, bajo circunstancias específicas, se pueden formular algoritmos SUE convergentes (Sheffì 1985). De hecho, un algoritmo práctico para elaborar un modelo de asignación SUE es justamente una extensión del método de promedios sucesivos (algoritmo MSA) descrito en el epígrafe 10.5.4. Este algoritmo puede describirse como se indica a continuación: 1. Considerar el conjunto de costes factibles Ca = Ca(0), es decir, los costes de viaje a flujo libre; hacer Va = 0 para todos los arcos a, y también n = 0. 2. Hacer n = n + 1 y construir un conjunto de árboles de mínimo coste con los costes factibles. 3. Asignar el total de la matriz de viajes a la red utilizando los árboles construidos en el paso anterior con un método estocástico apropiado, por ejemplo Burrell; se obtienen los flujos auxiliares Fa. 4. Calcular los flujos factibles como: V an = (1 – ϕ)V an–1 + ϕFa con ϕ = 1 / n 5. Hallar un nuevo conjunto de costes de arco factibles en base a los flujos V an; si los flujos o los costes factibles de arco no se han modificado significativamente en dos iteraciones consecutivas, parar; en caso contrario, volver al paso 2. Este algoritmo siempre tiende a producir pequeñas variaciones en los flujos y en los costes en cuanto a que ϕ es pequeño para valores grandes de n. Sin embargo, es importante confirmar que se converge a la solución correcta SUE. Sheffi (1985) demostró que este algoritmo converge a una solución SUE en el límite, es decir después de un número elevado de iteraciones, quizás 500 o más. La convergencia de este algoritmo no es monótona porque la dirección de la búsqueda sólo es descendiente en promedio. La velocidad de convergencia depende del nivel de congestión de la red y del parámetro de dispersión. La convergencia del algoritmo MSA para un problema SUE es bastante lenta en redes congestionadas. Sheffi (1985) demostró también que para redes muy congestionadas, el equilibrio del usuario (UE) proporciona una buena aproximación al SUE y converge más rápidamente. Ello sugiere que el empleo de SUE sólo podría ser ventajoso para problemas de asignación en redes poco o medianamente congestionadas.



11.3.

Equilibrio entre oferta y demanda

EXTENSIÓN DE LA ASIGNACIÓN DE EQUILIBRIO

11.3.1. Limitaciones de los métodos clásicos En los epígrafes anteriores han sido descritos los métodos clásicos más importantes para la asignación del tráfico. Antes de estudiar métodos más detallados y de algún modo avanzados, es útil analizar las principales limitaciones de estas aproximaciones. 11.3.1.1.

Limitaciones debidas a la modelización de la red con nodos y arcos

Estas limitaciones son debidas a diferentes razones: a la agregación de los destinos representados por los centroides individuales (efectos finales), a los giros penalizados y a prohibiciones no precisadas en la red, al hecho de que no todos los arcos reales son considerados en una red (red incompleta), y aún más al hecho de que los viajes intrazonales no están tratados completamente. El principal problema de las redes incompletas se produce en los arcos muy congestionados, en cuanto a que algunos viajes de media-larga distancia pueden utilizar calles secundarias (atajos): en este caso, la introducción de mejoras en la red puede aliviar la congestión atrayendo algunos de estos viajes que podrían parecer viajes generados cuando no lo son. Aunque la conexión de la red a los nodos centroides se efectúa con mucha atención, los “efectos finales” son inevitables. Ello hace que los flujos de arco estimados en las proximidades de los conectores al centroide sean menos fiables, tendiendo probablemente a sobrevalorar los mismos. Una forma de tratar mejor las demoras en intersecciones es expandir los nodos de modo que estén representadas todas las maniobras de giro (véase el ejemplo de la figura 11.3) y luego penalizar o eliminar los arcos que representan maniobras prohibidas. Pueden, por tanto, penalizarse ciertas maniobras particularmente complicadas. Por ejemplo una vuelta en redondo puede penalizarse asociándole un tiempo o coste mayor. Existen excelentes programas de software que proporcionan formas semi-automáticas para realizar esta expansión y que permiten eliminar o penalizar maniobras. Alternativamente, este paso debe ser realizado a mano durante la fase de construcción de la red. Aun así, es bastante difícil que todas las maniobras de giro sean representadas correctamente en su verdadero coste. Por otro lado, el tratamiento de los viajes intrazonales origina problemas puesto que algunos de dichos viajes pueden utilizar en la realidad arcos prin-

MODELOS

DE



TRANSPORTE

(a)

Figura 11.3.

(b)

Representación de una intersección como simple nodo (a), y con un gráfico expandido representativo de los giros (b).

cipales de la red y, sin embargo, no aparecer en la red modelizada. Es difícil desarrollar un buen método que tenga en cuenta esta cuestión en la asignación. Las complicaciones originadas por estos problemas son aún más difíciles de tratar cuando las zonas son grandes y la representación de la red dispersa. Como siempre, una definición más detallada de la red y del número de zonas aumenta el realismo de la simulación pero también los costes de adquisición y elaboración de los datos. 11.3.1.2.

Errores en la definición de los costes medios percibidos

Ciertamente no existen en la literatura al respecto suficientes estudios sobre cómo estos errores pueden variar con el tiempo, con el motivo del viaje, con su longitud, con el ingreso, con la capacidad de previsión y con el ámbito de referencia. Aún más, cuando se desea prever los componentes del coste, por ejemplo los consumos de carburante, se suelen realizar hipótesis simplistas que, efectivamente, pueden dar lugar a errores posteriores. 11.3.1.3.

No todos los viajeros perciben los costes del mismo modo

Los métodos estocásticos permiten considerar este fenómeno aunque de forma aproximada en cuanto a que, por razones económicas, el número de elementos de aleatoriedad debe ser limitado. Otra posibilidad para tratar este fenómeno consiste en considerar diferentes clases de usuarios, cada una con su propio conjunto de costes percibidos. En efecto, se puede expresar un problema de asignación determinística de equilibrio con múltiples clases de usuarios, cada una con su propio conjunto de parámetros para definir los costes percibidos de arco; véase, por ejemplo el trabajo de Laurent (1998). En este caso la convergencia a una solución única se consigue bajo las mismas condiciones que las



Equilibrio entre oferta y demanda

requeridas para el problema del usuario individual. Además el problema y la solución pueden también extenderse a modelos de demanda elástica, combinación de elección modal y asignación. Existen varios paquetes software como SATURN y EMME/2 (INRO, 1996) que ofrecen esta flexibilidad. Los modelos para múltiples clases de usuarios (cada uno con diferente disponibilidad a pagar por una mejora del servicio) son a menudo cruciales en los estudios de demanda para el sector privado en el caso de concesiones de servicios ferroviarios y carreteras de peaje. En efecto, en el caso de carreteras con peaje determinados usuarios pueden tener una mayor disponibilidad a pagar por el servicio porque sus costes están cubiertos por sus empresas; otros usuarios, sin embargo, pueden ser muy sensibles al precio, como las personas de ingresos bajos o que tienen limitados sus recursos disponibles. Estas categorías de usuarios se pueden representar bien en los modelos, pero obviamente es necesario disponer de serios estudios de preferencias declaradas/reveladas para determinar los parámetros correctos de cada caso. 11.3.1.4.

Hipótesis relativa a la disposición de información perfecta acerca de los costes en todas las partes de la red

Aunque esta hipótesis es común a todos los modelos es, evidentemente, optimista en exceso, al menos hasta que los viales que conforman las redes a estudio sean suficientemente informatizados. Los métodos usuales ignoran algunos efectos importantes, como el hecho de que los conductores sólo tienen información parcial acerca de las condiciones de tráfico sobre la ruta en función de la última vez que pasaron por ella, así como de los problemas en otros puntos de la red dependiendo de la propia experiencia, de la predisposición a utilizar nuevas rutas y del empleo de servicios de información sobre el tráfico. Además, está demostrado que muchos usuarios a la hora de elegir ruta están influenciados fuertemente por la señalización vial y que, a veces, las calles indicadas no son las más convenientes (Wootton et al., 1981). La influencia de la señalización vial mediante mensajes variables y de las tecnologías avanzadas de ayuda a la definición de rutas en parte de la flota vehicular son elementos a considerar en futuros modelos de asignación de tráfico (ver varios artículos sobre este tema en Papageorgiou, 1991). 11.3.1.5.

Variación diaria de la demanda

Las variaciones diarias de la demanda impiden en la práctica que se alcance un verdadero equilibrio. En este sentido, el equilibrio de Wardrop representa

MODELOS

DE

TRANSPORTE



el comportamiento “medio” si todos los viajeros pensaran del mismo modo y tuvieran información perfecta. Su solución en todo caso, tiene la propiedad de la estabilidad y su interpretación es lo suficientemente apreciable para justificar su uso eficiente en la práctica. Aun así, es sólo una aproximación de las condiciones de tráfico en un día cualquiera y esto debe tenerse en cuenta al interpretar los resultados. Análogamente, la demanda de viajes así como los flujos son también variables a lo largo del día. Ello hace que los modelos diarios (24 horas) sean mediocres en términos tanto de asignación como de tiempo y coste. Para la modelización y la asignación en las áreas urbanas congestionadas es esencial la consideración de períodos punta y valle; aunque también en ese caso se sabe que la congestión varía en torno a la hora punta muy rápidamente, afectando a los tiempos de viaje y a su fiabilidad. Además, para el mismo viaje, 10 minutos de retraso en salir pueden producir un retraso mucho mayor a la llegada a destino porque durante este tiempo ha aumentado la congestión en la red. Los costes sobre los arcos cambian dinámicamente en respuesta al tráfico; algunos usuarios conocen muy bien este fenómeno y planifican por tanto sus desplazamientos, en cambio otros no tienen suficiente experiencia para hacerlo. En realidad, los problemas de elección de ruta dependen fuertemente del tiempo, siendo necesario indicar a este propósito que las aplicaciones de las técnicas de asignación dinámica están progresando rápidamente. 11.3.1.6.

Estimación imperfecta de los cambios en el tiempo de viaje con los cambios en los flujos estimados en los arcos

Este problema es en parte debido a la naturaleza de las relaciones coste-flujo utilizadas. Como ya se expuso en el epígrafe 10.1.3, es normal aceptar que el tiempo de viaje sobre el arco sólo dependa de los flujos de ese mismo arco. Sin embargo, se ha visto que en las áreas urbanas, las demoras en un arco dependen también en general de los flujos en otros arcos de la red. Éste es el caso de intersecciones con prioridad por señal de Stop o Ceda el Paso, por ejemplo. Este aspecto será estudiado más adelante, ya que se requiere una modelización más exhaustiva de dichas demoras con respecto a las consideradas en las curvas convencionales de flujo. 11.3.1.7. Errores en los datos de entrada La exactitud de un modelo de asignación también depende del rigor de otros componentes y en particular de la confiabilidad de la matriz de viajes que va



Equilibrio entre oferta y demanda

a ser cargada. Así, pueden producirse errores a la hora de convertir matrices de pasajeros en flujos de vehículos y este hecho contribuye a limitar dicha exactitud. Aún más, ya se ha visto que rara vez es posible contar con matrices de viaje altamente confiables.

11.3.2.

Métodos de interacción entre intersecciones

Como ya se ha citado anteriormente, algunas de las hipótesis simplificatorias implícitas en los modelos clásicos de asignación del tráfico hacen que tales modelos no sean suficientemente reales, sobre todo para áreas urbanas congestionadas. En efecto, para mejorar los modelos de elección de ruta y asignación, se debería mejorar la modelización de las demoras en intersecciones así como sus aspectos dinámicos. Además deben considerarse las interacciones entre el control del tráfico y la selección de ruta, así como también tratar separadamente las diferentes clases de vehículos. A continuación se tratarán una a una estas cuestiones. 11.3.2.1.

Mejoras en la modelización de las demoras

Hasta ahora se ha considerado el tráfico como una variable continua que opera bajo condiciones de estacionalidad. En realidad el tráfico está compuesto por entidades discretas (vehículos) que forman colas en las intersecciones y embotellamientos en ámbito urbano. Si un modelo particular de asignación carga sobre una intersección un tráfico superior a su capacidad, es muy probable que los flujos aguas abajo de la intersección resulten sobreestimados; esto ocurre porque el modelo no reconoce el límite superior de capacidad de la intersección y por tanto los flujos estimados por dicho modelo aguas abajo serán mayores que los reales. Como consecuencia algunos recorridos que podrían utilizar estos arcos pueden ser ignorados por el modelo. El tratamiento simplista hace que las demoras se estimen mal y se omitan recorridos potenciales importantes. En este caso son necesarios dos tipos de mejoras. La primera consiste en considerar la naturaleza física de las colas en las intersecciones y sus efectos en la limitación del tráfico aguas abajo; la segunda en modelizar el hecho de que, cuando la demanda crece y decrece antes, durante y después de la hora punta, las colas en las intersecciones dependen del tiempo. El segundo problema puede ser tratado utilizando modelos de colas en función del tiempo como los propuestos por Kimber y Hollis (1979). Estas aproximaciones modelizan la forma en la que los atascos y las demoras cambian a medida que se desarrolla

MODELOS

DE

TRANSPORTE



la demanda de tráfico en el tiempo, y también tienen en cuenta la presencia de las colas al principio del período de interés. El primer problema, en cambio, requiere un modelo físico de formación de los atascos, lo cual puede lograrse con una simple conversión de los vehículos de la fila a lo largo de la misma o, en modelos más detallados, a través de la simulación de las colas actuales. Un aspecto crucial se refiere a la capacidad de representar las situaciones en las que una cola comienza a atascar, aguas arriba, una intersección y las demoras adicionales que origina sobre otros flujos. 11.3.2.2.

Naturaleza dinámica de la formación de las colas y sus efectos sobre la elección de ruta

Éste es un problema difícil que modelos como SATURN (Hall et al., 1980) resuelven dividiendo los períodos de estudio en intervalos más pequeños, usualmente 10 ó 15 minutos, y luego estudiando cada intervalo de tiempo como un problema de asignación en condiciones estacionarias. De esta forma se pueden capturar algunos de los efectos propios del aumento de la congestión, aunque se acepta que todos los vehículos en el mismo intervalo están sometidos al mismo conjunto de costes. Otros modelos asignan los vehículos bien sea individualmente o bien en pequeños grupos (paquetes), distribuyéndolos secuencialmente durante cada intervalo de tiempo. Este enfoque, seguido por ejemplo por CONTRAM (Leonard y Gower, 1982) proporciona una representación mejor de las demoras que los vehículos soportan en cada fase de su paso en la red. Es sabido que SATURN no trata los vehículos individualmente sino como parte de un pelotón simulado en una porción de tiempo menor del minuto (1 a 5 segundos). En ambos casos, los correspondientes modelos presentan un elevado nivel de detalle y por tanto son clasificados como modelos de (meso) simulación. No obstante ambos se basan aún en la hipótesis de información perfecta sobre las condiciones del sistema. 11.3.2.3.

Interacción entre control del tráfico y demoras

Éste es un problema difícil de tratar correctamente y en detalle. Muchas áreas urbanas de gran dimensión tienen sistemas de control del tráfico (ATC), es decir, control informatizado de los semáforos para reducir las demoras y, en algunos casos, para organizar atractivas “ondas verdes”. Tales sistemas se planifican para hacer frente de modo satisfactorio a los actuales esquemas de tráfico y pueden permitir un 10-20% de ahorro de tiempo con respecto de las



Equilibrio entre oferta y demanda

situaciones sin coordinación semafórica. El problema es que el patrón de flujos de tráfico (conjunto de flujos en los arcos), depende del conjunto de las mejores rutas disponibles; éstas dependen, a su vez, de los tiempos de los semáforos de cada intersección. Sin embargo, algunos modelos que intentan combinar asignación y control del tráfico han enfrentado serios problemas; véase por ejemplo Allsop y Charlesworth (1977) y Smith (1979, 1981). Una solución consiste en establecer un problema de asignación con regulaciones semafóricas fijas, conseguir un conjunto futuro de flujos de arco y luego ejecutar un software como TRANSYT (Robertson, 1969) para optimizar la regulación de estos flujos. El proceso debería repetirse con los nuevos tiempos de semáforo, lo que generaría nuevas rutas y flujos, con la esperanza de que estas iteraciones converjan a una solución estable y autoconsistente. En este caso, el problema es que la solución depende considerablemente del punto de partida; en efecto, si por ejemplo un corredor resultase muy utilizado en la primera iteración, TRANSYT produciría temporizaciones semafóricas tendentes a reducir demoras, aumentando así el número de viajes que usan el corredor en el futuro. En los problemas de asignación/control de tráfico esta forma de proceder tiende también a favorecer soluciones del tipo todo-nada. 11.3.2.4. Múltiples clases de vehículos En el caso de modelos detallados de asignación, coches, autobuses, camiones y vehículos a dos ruedas necesitarán probablemente un tratamiento diferenciado. La evaluación de su impacto debe ser separada: sus impactos ambientales son diferentes, pueden estar sometidos a esquemas específicos de organización del tráfico (por ejemplo, restricción en la circulación de camiones) y pueden utilizar diferentes criterios para la elección de ruta o para la minimización de los costes monetarios en lugar del tiempo. Los modelos clásicos de asignación del tráfico consideran una matriz individual de viajes apta para ser representada bien por unidad de coches equivalentes (PCUs) o bien por combinaciones apropiadas de matrices de vehículos y sus valores PCU. Existen diferentes modelos capaces de tratar separadamente tres o más clases de vehículos e incluso permitir el empleo selectivo de los arcos, de las maniobras de giro y de los costes; ver por ejemplo Van Vliet et al. (1987). Un ejemplo particular es el que se refiere a los vehículos obligados a seguir un recorrido específico, principalmente los autobuses. En este caso usualmente son precargados a la red, de forma que sus impactos puedan ser considerados sobre el resto del tráfico para los objetivos de asignación.

MODELOS

DE

11.3.2.5.

TRANSPORTE



Fiabilidad del tiempo de viaje

La variabilidad y poca confiabilidad del tiempo de viaje en las áreas urbanas congestionadas se ha convertido en un problema significativo para muchos tipos de desplazamientos. A medida que el tráfico crece en las redes particularmente cargadas es especialmente difícil estimar el tiempo de viaje requerido para desarrollar un desplazamiento determinado. En estos casos, los usuarios deben planear una holgura adicional para evitar, por ejemplo, perder un avión o una reunión de negocios. En cambio, en el caso de otras actividades los usuarios pueden aceptar sencillamente las consecuencias negativas de los retrasos previstos: viajes de compras o turismo. Los beneficios derivados de incrementar la fiabilidad del tiempo de viaje y los ahorros significativos de recursos producidos por ello, son un argumento usualmente utilizado para establecer tasas o precios de circulación en ciudades congestionadas. Por ello, para poder desarrollar funciones de coste generalizado idóneo que incorporen estos efectos, pueden utilizarse datos de preferencias declaradas/reveladas, los cuales permiten calcular un valor subjetivo de la fiabilidad del tiempo de viaje. Obviamente es necesario definir una medida de tal fiabilidad, como por ejemplo, la desviación estándar esperada del tiempo de viaje σ o el coeficiente esperado de la variación del tiempo de viaje. Cabe destacar el énfasis sobre la medida subjetiva de la variabilidad del tiempo de viaje. Una exigencia igualmente importante consiste en desarrollar modelos que ligan la variabilidad del tiempo de viaje con la congestión y las condiciones de la oferta (con servicios para la gestión de los incidentes, redundancia de la red, etc.). Indicar aquí que, por diferentes razones, ésta es un área de investigación poco desarrollada. Ante todo hace falta señalar que la adquisición de datos a menudo es una actividad muy cara, en cuanto a que para poder notar variaciones sistemáticas y aleatorias es necesario disponer de viajes o desplazamientos repetidos (mismo tiempo de salida, mismo origen y distancia) sobre un amplio número de días; y ello debe ser repetido para diferentes horarios del día y para muchos pares O/D. En segundo lugar, es preciso destacar que los modelos de oferta tienen que ser razonablemente simples para que sean de utilidad en los modelos estratégicos a gran escala, o sensibles a instrumentos clave de política (nuevas medidas de control del tráfico, paneles de mensajes variables, recorridos guiados) para la planificación táctica de detalle. Willumsen y Hounsell (1998) proporcionan un estudio general que puede ser utilizado en los modelos estratégicos en el ámbito de una intervención de ta-



Equilibrio entre oferta y demanda

rificación vial por congestión. En este estudio se utilizó un número considerable de observaciones relativas a una red congestionada (Londres) y se extendieron sus valores ejecutando simulaciones con más de 2.000 pares O/D y durante un gran número de días. Como variables independientes fueron seleccionadas el tiempo de viaje actual (JT), el tiempo de viaje a flujo libre (FFTT) y un índice de congestión definido como CI = JT / FFTT. Fueron calibrados diferentes modelos para estimar las desviaciones estándar del tiempo de viaje según diferentes condiciones de congestión, y para obtener un buen compromiso entre sencillez y realismo los autores recomendaron el siguiente modelo: σ = 0,9FFTT0,87 (CI – 1) En términos prácticos el modelo ofrece una forma simple que relaciona la desviación estándar del tiempo de viaje con las condiciones de la red y es relativamente insensible a la longitud del viaje, presentando por tanto una buena adaptabilidad también en contextos diferentes del de Londres. La ventaja de esta forma de resolver el problema es que la variabilidad del tiempo de viaje puede ser estimada después de la asignación y luego incorporada dentro de los demás modelos de elección (elección de la hora del día, del modo y del destino). De este modo pueden evitarse complejas interacciones entre congestión, variabilidad del tiempo de viaje y elecciones de recorrido.

11.3.3. Simulación y equilibrio En los epígrafes anteriores han sido expuestos dos de los modelos más conocidos para planificar detalladamente esquemas de organización del tráfico urbano, los modelos CONTRAM y SATURN. Otro modelo de esta extensa familia es NETSIM (Lieberman, 1981), utilizado principalmente en EE.UU. Con respecto a los modelos clásicos estudiados anteriormente, estos modelos de simulación resultan más laboriosos en términos de adquisición de datos, calibración y recursos de ordenador. Sin embargo, los datos requeridos son, en todo caso, necesarios para planificar cualquier esquema de gestión del tráfico, y hoy en día hay versiones disponibles para ordenador personal. Sin embargo, en la elección del modelo a utilizar juegan un papel importante aspectos como los requisitos en términos de recursos del ordenador, formación, calibración, validación e interpretación de los resultados. Además, es necesario destacar que los modelos de simulación no son el único instrumento con que es posible

MODELOS

DE



TRANSPORTE

estudiar las exigencias particulares de una asignación de tráfico en las áreas urbanas. En efecto, se han desarrollado también modelos más simples basados en aproximaciones más clásicas para afrontar problemas como la interacción arco-intersección y, en alguna medida, la formación dinámica de las colas. Un ejemplo de estos modelos es TRIPS (MVA Sistemática, 1982). No es objetivo de este libro la exposición más detallada de estos paquetes comerciales. Será presentado no obstante, el ejemplo de SATURN con la finalidad de examinar el modo en que estos modelos pueden afrontar el equilibrio de Wardrop. En particular SATURN utiliza dos modelos complementarios (Van Vliet, 1982). El primero es un modelo de simulación basado en la utilización de perfiles de flujo cíclico para representar el movimiento de grupos (pelotones) de vehículos sobre una red. Este modelo considera la interacción de diferentes flujos en rotondas y en intersecciones semaforizadas con preferencia, y utiliza información relativa a los flujos sobre cada arco de la red para estimar capacidad, colas y demoras. Por lo tanto, es necesario un modelo de asignación para cargar una matriz de viajes sobre una red y para obtener una estimación de flujos. En particular, para ello se utiliza un segundo modelo de asignación que es capaz de converger al equilibrio de Wardrop y al equilibrio estocástico. El enlace entre los dos modelos se realiza a través de los volúmenes de los arcos (de la asignación a la simulación) y a través también de la curva velocidad/flujo (de la simulación a la asignación), tal y como se ilustra en la figura 11.4. El modelo de simulación es utilizado, por lo tanto, para generar relaciones idóneas coste-flujos (curvas de coste-flujo) necesarias para la asignación. Las curvas son producidas para cada arco en términos de volumen sobre el arco mismo y tienen forma polinómica. C(Va) = a0 + a1V an Datos de la red

(11.12)

Simulación

Nueva curva coste-flujo Ca(Va) = a0 + a1Van

Nuevos flujos de arco

Asignación

Matriz de viajes

Figura 11.4. Ciclo simulación-asignación en el software SATURN.



Equilibrio entre oferta y demanda

Sin embargo, estas relaciones se calculan para el modelo de simulación usual de modo que se tenga en cuenta la interacción y las restricciones generadas por los flujos sobre otros arcos de la red. De hecho han de realizarse varias iteraciones antes de que el recorrido entero converja hacia un conjunto de flujos y costes congruentes entre ellos. En términos teóricos, lo que SATURN intenta realizar es la diagonalización de las curvas de coste-flujo. En redes congestionadas y bien conectadas como las de las áreas urbanas, el coste sobre el arco depende no sólo del flujo que transita por ese arco sino también de los demás flujos sobre la red (aunque dependerá especialmente de los flujos que convergen en la misma intersección). Ello puede escribirse como: Ca = Ca(V1, V2, …, Va, …Vn) Si se fijan todos los flujos excepto el existente en el arco Va y se varía Va de cero a la capacidad de dicho arco a, se puede “calibrar” una curva de coste-flujo que, en esta iteración sólo dependa de Va. Por lo tanto, se puede elaborar posteriormente un modelo de asignación convencional de equilibrio de Wardrop utilizando por ejemplo, el algoritmo de Frank Wolfe y así conseguir un nuevo conjunto de flujos sobre todos los arcos y ejecutar de nuevo el programa de simulación. La condición estricta para la convergencia de este tipo de esquemas requiere que las demoras en un arco dependan principalmente de los flujos sobre dicho arco y, en menor medida, de los flujos en el resto de los arcos (Sheffi, 1985). Sin embargo, en la práctica, esta condición se satisface rara vez ya que las demoras, por ejemplo, en las intersecciones con preferencia o en las rotondas dependen, sobre todo, de los flujos de los arcos que tienen la preferencia (los flujos circulantes respectivos en las rotondas y en las calles principales). Ejemplo 11.3: sea la sencilla red de la figura 11.5 que corresponde a dos rutas desde un origen a un destino que convergen en un nodo. El flujo total es de 100 vehículos de A a Z. Se considera primeramente el caso en el que ambos flujos se entrelazan (merge); por tanto las demoras en cada arco también dependen de los flujos en el otro arco. Se supone ahora que las curvas de coste-flujo son las siguientes:

C1 (V1 , V2 )  8 0, 3V1 0, 2V2 C2 (V1 , V2 )  13 0, 4V2 0, 2V1

MODELOS

DE



TRANSPORTE

V1

V2 A

Figura 11.5.

Z

Red sencilla con una intersección con preferencia.

El problema se puede resolver encontrando un punto de equilibrio en V1 = 83,5 y V2 = 16,5 con un coste mínimo de 36,35. No obstante, es útil una representación que muestre el intervalo de valores de V1, su coste de arco y el coste total: V1

C1

C2

Coste total

0

28,0

53,0

5.300

10

29,0

51,0

4.880

20

30,0

49,0

4.520

30

31,0

47,0

4.220

40

32,0

45,0

3.980

50

33,0

43,0

3.800

60

34,0

41,0

3.680

70

35,0

39,0

3.620

80

36,0

37,0

3.620

83

36,3

36,4

3.632

84

36,4

36,2

3.633

90

37,0

35,0

3.680

100

38,0

33,0

3.800

Como puede verse, la solución es un punto de equilibrio único y estable. Si algunos flujos se desplazan por el arco 2, se incrementa la demora en dicho



Equilibrio entre oferta y demanda

arco y por lo tanto los usuarios volverán a la ruta original. Lo mismo sucede si se desplaza más tráfico al arco 1. El hecho de que el coste total sea mínimo en otro punto, aproximadamente para V1 = 75, es otro ejemplo de la diferencia entre equilibrio social y equilibrio individual del usuario. Considere ahora un problema levemente diferente con el mismo tipo de red. Ahora la intersección prevé que quien provenga del arco 1 ha de ceder el paso; el flujo procedente del arco 2 tiene la preferencia de paso y por tanto su tiempo de viaje no depende del flujo sobre el arco 1. La nueva relación será entonces:

C1 (V1 , V2 )  8 0,1 V1 0, 2V2 C2 (V2 , V1 )  20 0, 05V2 Puede utilizarse el mismo tipo de tabla para ilustrar las posibles soluciones de este problema de asignación. En este caso la solución V1 = 60 y V2 = 40 no es estable. El traslado de flujo al arco 1 hará disminuir los costes en el arco 1 más rápidamente que en el arco 2, así que se vuelve a la solución V1 = 100 y V2 = 0. Sin embargo, el traslado del flujo al arco 2 tiene el efecto opuesto, incrementa más lentamente los costes sobre el arco 2 que sobre el arco 1 conduciendo, por tanto, a otra solución: V1 = 0 y V2 = 100. Estas dos soluciones extremas son estables, aunque no con costes iguales en cada ruta, y representan equilibrio del usuario ya que los costes de las rutas no utilizadas son mayores que los costes sobre las rutas utilizadas. Cualquier desviación de estos puntos extremos producirá nuevos costes que llevarán la solución al punto de partida. Es importante destacar que las ecuaciones elegidas son sencillas pero no improbables, y también que la ecuación de los flujos sin preferencia muestra que la demora depende principalmente del flujo en el arco con preferencia, contraviniendo por tanto, el requerimiento básico para una solución única. V1

0

C1

C2

Coste

28

25,0

2.500

10

27

24,5

2.475

20

26

24,0

2.440

30

25

23,5

2.395

40

24

23,0

2.340

MODELOS

DE



TRANSPORTE

50

23

22,5

2.275

60

22

22,0

2.200

70

21

21,5

2.115

80

20

21,0

2.020

90

19

20,5

1.915

100

18

20,0

1.800

El hecho de que la solución V1 = 100 sea preferible porque tiene un coste total menor, es relevante sólo en términos de diseño de la red. Por ejemplo, se puede pretender estimular a los usuarios a que elijan el arco 1 e ignorar el arco 2. Sin este consejo, los usuarios pueden elegir la forma de generar uno u otro de los dos puntos extremos o bien uno de ellos en una determinada ocasión particular y el otro el día siguiente. En realidad puede ocurrir que no se converja a una solución estable de equilibrio; buenos modelos de asignación pueden no converger sencillamente porque representan bien esta característica de la realidad. SATURN y los modelos del mismo tipo, por tanto, pueden considerarse solamente como un enfoque razonable práctico del equilibrio ideal de Wardrop en las áreas urbanas congestionadas. Normalmente dichos modelos ofrecen indicadores prácticos para estimar cuán cerca del equilibrio se encuentra la solución en un paso cualquiera. Para planificar medidas de gestión del tráfico u otras intervenciones en las áreas urbanas, los modelos de simulación representan, sin embargo, el estado del arte en la asignación detallada del tráfico.

11.3.4.

Asignación al transporte público con congestión

En el capítulo anterior ha sido tratada la asignación del transporte público con costes fijos. Ello significa que los costes del arco no dependen del número de pasajeros a bordo del autobús o del tren, no habiendo limitaciones a la capacidad de carga de cada unidad. Este enfoque es razonable en todos aquellos casos en los que el objetivo del proceso de planificación es proporcionar suficiente capacidad para todos los pasajeros en la ruta seleccionada. Con ello se tiene la ventaja de facilitar la solución de los problemas de asignación al transporte público. Hay, sin embargo, situaciones en las que no es posible proporcionar al transporte público una capacidad ilimitada que evite la congestión, o simplemente



Equilibrio entre oferta y demanda

que tal capacidad no esté disponible en el año de referencia del análisis. En estos casos la elección de ruta por parte de los pasajeros probablemente esté influenciada por la aglomeración a bordo de los vehículos; algunos viajeros se desplazarán de los recorridos abarrotados a otros menos congestionados aunque estos últimos resulten menos atractivos en términos de tiempo y coste de viaje. Este epígrafe enfoca los problemas de asignación en los que los tiempos de viaje en el arco no son constantes. La dependencia de los costes de arco del flujo de pasajeros puede adoptar diferentes formas. Desde el punto de vista de encontrar una solución, las formas más convenientes de dicha dependencia son funciones continuas no decrecientes de los correspondientes flujos en los arcos. Esta dependencia entre coste del arco y la demanda de transporte público puede representar una disminución efectiva de velocidad del vehículo a causa del número de pasajeros o puede ser interpretada como un coste generalizado que incluye un término de “falta de confort” que aumenta a medida que el vehículo se encuentra más abarrotado. En este contexto, el problema de asignación al tráfico no es separable del nodo de destino, ya que los costes de arco dependen del total del flujo de pasajeros. El volumen total del transporte colectivo es la suma de los volúmenes directos hacia cada uno de los destinos. Debido a que el coste esperado para cualquier estrategia dada no es fijo, sino que depende de los volúmenes totales, sólo las estrategias con el mínimo coste esperado serán utilizadas por los viajeros (Wardrop, 1952). Spiess (1984) expone cómo el problema anterior puede ser formalizado y solucionado aplicando el método de aproximaciones lineales sucesivas (Frank y Wolfe, 1956). Una ventaja importante de este método es que han de ser computados y memorizados sólo los volúmenes totales, ya que los volúmenes dependientes de los destinos se tratan implícitamente. Este enfoque se puede implementar en un software como el EMME/2, por ejemplo. Una variante de este proceso se utilizó para modelizar el abarrotamiento en el metro de Londres (para el London Transport). En lugar de utilizar una de las funciones de congestión por defecto basadas en la capacidad nominal, se modificó el proceso incluyendo el perfil actual de densidad de los trenes y carga de los pasajeros durante los períodos punta (Abraham y Kavanagh, 1992). Sin embargo hay condiciones en las que no es razonable aceptar que los costes de arco sólo dependan del nivel de pasajeros en el arco. Por ejemplo, la demora en las paradas puede depender del número de pasajeros a bordo (autobús,

MODELOS

DE

TRANSPORTE



tren/metro), ya que algunos pasajeros quizás no puedan embarcar. En este caso las demoras o los costes generalizados en el arco dependerán significativamente también de los flujos en el resto de los arcos: la situación puede ser parecida en las demoras originadas en las intersecciones viales. En estos casos la modelización de la congestión debería realizarse utilizando funciones de coste generalizado asimétrico. Aquí el tiempo de espera percibido por un servicio (línea) para un pasajero que tiene que embarcar, depende del número de pasajeros a bordo así como la demora del vehículo en la parada depende de los pasajeros que suben y bajan. Tal fenómeno es real; sin embargo, su inclusión en los modelos de asignación resulta en que la convergencia hacia una solución única no está garantizada. De Cea y Fernández (2000) han desarrollado un modelo de equilibrio multimodal con múltiples clases de usuarios que incorpora funciones de coste generalizado asimétrico para la asignación al transporte público (y sin embargo, simétrico para asignación vial). El modelo combina destino, elección de modo y asignación en una función de equilibrio. El destino y la elección modal se tratan mediante una formulación logit jerárquico (destino en nido superior), y el problema se combina con la asignación de equilibrio con restricciones de capacidad. El problema es formulado como una desigualdad variacional de forma que para su solución se utiliza un algoritmo de diagonalización. Aun reconociendo que no hay garantía de convergencia a una solución única, los autores afirman haber llegado a dicha convergencia en todas las aplicaciones por ellos realizadas. Esta cuestión es una extensión importante del ya sofisticado modelo ESTRAUS para Santiago.

11.4. 11.4.1.

EQUILIBRIO DEL SISTEMA DE TRANSPORTES Introducción

La tipología de los problemas de equilibrio tratada en los párrafos anteriores se refiere a un modo individual de transporte en la red. Este tipo de comportamientos puede modelizarse utilizando el primer principio de Wardrop para posteriormente, y con un algoritmo idóneo, identificar las rutas y los flujos de forma tal que los costes generados sean consistentes para todos los usuarios. Como se ha citado antes, también es válido un principio parecido en los problemas de congestión o de capacidad de las redes de transporte público.



Equilibrio entre oferta y demanda

El problema resulta ser más complejo cuando se tienen en cuenta las interacciones entre dos o más modos. Éstos pueden adoptar las siguientes formas: • Congestión generada por los coches, influye en el tiempo de viaje de los autobuses en ciertas rutas y, por ello, modifica las estrategias de asignación de los usuarios de transporte público; la congestión generada por los autobuses (y los sistemas de LRT en la calle) y las maniobras a la hora de parar influyen evidentemente en la capacidad y en la velocidad de los coches y, por tanto, en sus elecciones de ruta. • Interacciones debidas a las operaciones “park-and-ride” y “kiss-and-ride” por los autobuses y los sistemas guiados o con carriles exclusivos. La ventaja de estos modos combinados de transporte dependerá de la congestión vial, de la frecuencia del servicio y de las tarifas modales y de aparcamiento, también teniendo en cuenta que todos estos factores están, por lo general, mutuamente interrelacionados. Las aproximaciones prácticas a este problema generalmente son del tipo de las tratadas en el epígrafe 10.5, referentes a los ajustes de velocidades. Se acepta inicialmente que el tiempo de viaje en bus y sus volúmenes en la red son fijos y conocidos; se asignan los coches a la red en equilibrio y los viajeros a la red de transporte colectivo resultando en nuevas frecuencias y nuevos tiempos de viaje; se repite el proceso hasta que se alcanza un equilibrio. Naturalmente si no se está dispuesto a modificar las frecuencias de los autobuses en relación a la demanda, el problema puede converger rápidamente. Para el transporte combinado el problema es más difícil porque sus usuarios, a causa de la congestión en la red vial, pueden decidir cambiar su estación de “park-and-ride” y ello, a su vez, determina una variación de los niveles mismos de congestión. Aunque en la situación actual fueran pocos los viajes combinados, no incluirlos en los procedimientos de equilibrio puede dar lugar a graves problemas en previsiones anuales de redes seriamente congestionadas (ver ESTRAUS, 1989). En todos los casos estudiados en las líneas anteriores se ha supuesto como hipótesis que la matriz de viajes se mantiene fija para cada modo (demanda inelástica). Sin embargo, como se ha tratado en capítulos precedentes, dicha hipótesis de matriz fija debe ser tratada con cautela, al menos cuando se estén considerando cambios relevantes en la red de transporte o cuando se refiera a horizontes lejanos de planificación. En efecto, es necesario aceptar el hecho de que en algunos casos la demanda es en particular elástica con respecto de los

MODELOS

DE

TRANSPORTE



costes de viaje y de ruta, lo cual comporta la necesidad de considerar la influencia de la congestión y de las demoras en la elección de modo y de destino. A este nivel de análisis, la elección modal se modeliza usando los tiempos de viaje de cada modo y cada par O-D. Si los tiempos de viaje y demoras cambian como resultado de la asignación, el modelo deberá ejecutarse nuevamente para obtener un reparto modal más consistente. Ello también es válido para los modelos de distribución de viajes en los que el tiempo representa una variable explicativa importante de la función de fricción o impedancia. Procediendo así se llega a tener un conjunto anidado de modelos en los que es necesario asegurar que los costes de viaje utilizados en todos ellos sean consistentes entre sí. Una estrategia iterativa ingenua: ejecutar todos los modelos, obtener nuevos tiempos de viaje y repetir el proceso hasta la convergencia, tiene todas las características de ser una aproximación no-convergente. En efecto, es probable que las oscilaciones entre los diferentes valores sean una característica más o menos recurrente de este tipo de técnicas; es por ello deseable usar soluciones más robustas. Una de las mejores reseñas del estado del arte sobre estos modelos está en Fernández y Friesz (1983). Antes de comenzar a sintetizar este trabajo se van a exponer algunos ejemplos para entender correctamente cómo se puede desarrollar la modelización de equilibrio.

11.4.2. Combinación de elección modal y asignación Para afrontar razonablemente los problemas hasta aquí indicados puede procederse a englobar el mayor número posible de submodelos en uno solo, sobre todo si en el mismo proceso se incluye la asignación. Es importante sin embargo, no comprometer demasiado el realismo de la modelización para la búsqueda del equilibrio, sobre todo en las decisiones a corto plazo. Sea primeramente el problema general en que una curva típica de demanda puede invertirse para expresar los costes de viaje en función del número de viajes Cij = gij(Tij), tal y como se muestra en la figura 11.6. Naturalmente los costes de viaje entre i y j no serán nunca iguales a cero, por tanto es razonable suponer que habrá un coste mínimo Cijmin asociado a un valor mínimo de la demanda Tijm. Es interesante intentar construir un modelo que combine demanda y asignación. Considérese, en primer lugar, la siguiente función objetivo:



Equilibrio entre oferta y demanda

Demanda D

Coste C Coste C

Cmin

Dmáx

Figura 11.6.

Demanda D

Curva de demanda invertida. Tij

Va

Minimizar Z  ¤ ° ca ( ) d ¤ ° g ij (t ) dt a

s.a.

0

ij

0

(11.13)

Tijr r 0 Tij  ¤ Tijr

(11.14)

Va  ¤ Tijr  ijra

(11.15)

r

ijr

La derivada de Z con respecto de Tijr es:

uZ  Cijr g ij uTijr

MODELOS

DE



TRANSPORTE

Procediendo a analizar el comportamiento de Z con respecto a Tijr* , resulta que: Si T *ijr = 0, entonces

uZ ≥ 0 y cijr ≥ gij uTijr

(11.16a)

Si T *ijr ≥ 0, entonces

uZ  0 y cijr = gij uTijr

(11.16b)

Por lo tanto, si se utiliza una ruta particular, su coste viene determinado por el valor en la curva de demanda, es decir: gij(Tij) = cij* La función de demanda invertida puede tener una forma muy general. Sin embargo, en algunos casos, conseguir funciones analíticas concisas puede ser muy difícil. Sea ahora el problema más simple en el que sólo se combinan la elección del modo y la asignación. En este caso el problema de asignación con demanda elástica se puede reformular como una extensión del problema de asignación con demanda inelástica. Si Tij es el número total de viajes en todos los modos (transporte público y privado) entre i y j, y Tijc representa los realizados en coche, evidentemente la demanda restante Tijb = Tij – Tijc es satisfecha por transporte público. Para cargar los viajes no realizados en coche pueden establecerse nuevos arcos ficticios entre cada par O-D para representarlos configurando así una red ampliada. Tb Transporte público Tc1 T

B A

T

2 c

Red base

Figura 11.7.

Red ampliada.

T



Equilibrio entre oferta y demanda

Una simplificación podría ser concentrar estos arcos ficticios en uno sólo para cada par O-D, como se indica en la figura 11.7. Los viajes en transporte público pueden escribirse así: Tijb = Tij – ƩTijr

(11.17)

r

por lo que el problema de minimización queda: Va

Tij

Tij

0

0

Tij

Minimizar Z  ¤ ° ca (v) dv ¤ ° g ij (t ) dt ¤ ° c g ij (t ) dt a

ij

ij

sometida a las mismas restricciones (ver Gartner, 1980; Sheffi, 1985). La primera integral es la función objetivo convencional de una asignación de equilibrio. La segunda es, en este contexto, una integral cuyos límites son dos constantes (0 y el número total de viajes) y, por tanto, puede ignorarse en el proceso de optimización. De esta forma, puede considerarse aquí una pseudo curva coste-flujo para viajes en coche mediante un cambio de origen, es decir modificando los límites de integración iniciales (del intervalo Tijc a Tij al intervalo comprendido entre 0 y Tijb). g'ij (t) = gij (Tij – t) con lo que la función objetivo puede ser escrita así: Tijb

Va

Minimizar Z  ¤ ° ca ( ) d ¤ ° g ija (t ) dt a

0

ij

0

(11.18)

Ésta es ahora una función objetivo compuesta en la que ambos términos pueden ser interpretados como el área bajo la curva coste-flujo; en el segundo caso, una pseudo curva coste-flujo. El problema, por tanto, ahora puede resolverse utilizando un algoritmo estándar de asignación de equilibrio como el de Frank-Wolfe. Sin embargo, no es necesario fijar una red ficticia explícitamente, ya que sólo es necesario construir la correspondiente curva coste-flujo, es decir: 1. Se construye una pseudo curva coste-flujo para cada par i, j utilizando un modelo existente de reparto modal, por ejemplo un logit binomial. 2. Se hace n = 0; se asigna toda la Tij a las rutas de coste mínimo a flujo libre y se denotan los flujos resultantes como Va sobre los arcos reales, y como Tij(n) para los arcos ficticios.

MODELOS

DE



TRANSPORTE

3. Se hace g'ij (n) = g'ij [Tij (n)], es decir los pseudo costes de arco corrientes como deducidos del total de los viajes menos el número de viajes en coche de i a j. 4. Se define una matriz Wij(n) para asignar a la red real, tal que: * ®«Tij si g ija (n) r cij Wij (n)  ¬ ®­0 en otro caso

5. Se estiman las nuevas rutas de coste mínimo y se asigna la matriz Wij(n) sobre tales rutas para así obtener nuevos flujos de arco reales Fa(n). 6. Se combinan los viajes entre i y j y los flujos reales de la siguiente forma:

Tij (n 1)  (1  )Tij (n)  Wij (n) Va (n 1)  (1  )Va (n)  Fa (n) donde ϕ es elegido para minimizar la función objetivo (11.18). 7. Se hace n = n + 1 y se vuelve al paso 2 a menos que alguno de los criterios de convergencia haya sido satisfecho, en cuyo caso se termina el procedimiento. En los pasos 3 y 4 se calculan los costes en la pseudo-curva de flujo y se contrastan con los costes mínimos corrientes de la red real. Posteriormente, si g'ij < c*ij, se asigna Tij (total de los viajes) a los arcos ficticios; en otro caso, se asignan a la red real. Es decir, se efectúa una nueva asignación auxiliar todo o nada a la red ampliada utilizando el algoritmo de Frank-Wolfe. La implementación de este algoritmo sólo requiere pequeñas modificaciones en la codificación del método de asignación de equilibrio de Frank-Wolfe.

11.4.3. 11.4.3.1.

Métodos de equilibrio para la elección de modo, destino y ruta Combinación de destino y asignación

Este modelo deriva de la siguiente minimización: Va

Minimizar Z  ¤ ° ca ( ) d a

0

1 ¤ Tij (log Tij 1)  ij

(11.19)

s.a. Tijr ≥ 0 ƩTij – Oi = 0 j

(11.20)



Equilibrio entre oferta y demanda

ƩT i

ij

– Dj = 0

(11.21)

Se puede demostrar que la ecuación (11.19) es una función convexa y que, utilizando el Lagrangiano, la solución viene dada por:

Tij*  ai b j exp(  cij* ) donde la asignación de equilibrio se utiliza para la estimación de c*ij. También se puede utilizar el algoritmo de Frank-Wolfe para resolver este problema, aunque Evans (1976) ha estudiado un algoritmo más eficiente que comporta una solución iterativa del modelo gravitatorio y del problema de asignación de equilibrio con demanda inelástica. 11.4.3.2.

Combinación de distribución, reparto modal y asignación

El paso siguiente consiste en combinar la distribución, el reparto modal y la asignación en un esquema de optimización individual y resolver simultáneamente tres problemas. Este enfoque ha sido seguido por muchos autores, entre ellos Florian y Nguyen (1978) que tienen en cuenta las ventajas del modelo combinado de distribución y reparto modal tratado en el Capítulo 6 para formular el problema de la siguiente forma: Va

Minimizar Z   ¤ Tijc log Tijc ¤ Tijb ( log Tijb uijb ) ¤ ° ca ( ) d ij

a

ij

0

(11.22)

s.a.

¤ (T

c ij

Tijb )  Oi

(11.23a)

¤ (T

c ij

Tijb )  D j

(11.23b)

j

i

¤T

c ijr

 Tijc

r

Va  ¤  ijra Tijrc Vab ijr

(11.24) (11.25)

además de las restricciones de no negatividad de Tijc, Tijb y Tijrc donde los índices c y b se refieren respectivamente al modo coche y al modo transporte público, y donde:

MODELOS

DE



TRANSPORTE

uijb es el tiempo de viaje en transporte público, considerado independiente de los volúmenes de tráfico; V ab es la contribución del tráfico público a flujo libre en el arco a; puede ser igual a cero para modos de transporte guiado restringido o con vías reservadas; Florian y Nguyen (1978) han demostrado que con las hipótesis usuales para Ca la función objetivo es la suma de funciones convexas y, por lo tanto, también es convexa y el problema tiene, en general, una solución única de la forma:

Tijc  ai b j exp(  cij*c )

(11.26a)

Tijb  ai b j exp(  uijb )

(11.26b)

Además, el reparto modal se convierte en un logit binomial con parámetro de escala β. Dichos autores han desarrollado una adaptación del algoritmo de Frank-Wolfe para solucionar este problema. Su principal innovación se refiere al método para encontrar la dirección de búsqueda utilizando un enfoque de programación lineal que se traduce en el algoritmo más simple de Hitchcock para los problemas de transporte en este caso. En efecto, este algoritmo en los problemas de esta dimensión requiere pocos requisitos computacionales. El algoritmo completo se puede sintetizar así: 1. Obtener una posible solución inicial para Tijc, Tijb y Vac. 2. Para cada arco a se computa el coste actualizado Ca = Ca(Va). 3. Para cada par O-D se determina la ruta más corta Tij; c*ijc es el coste de viaje a lo largo de dicha ruta. 4. Calcular:

Cijc  Cij*c   log Tijc Cijb  Cij*b   log Tijb 5. Si cijc > cijb hacer yijc = 0; en otro caso hacer yijb = 0. 6. Resolver el problema de transporte de Hitchcock para conseguir nuevas demandas auxiliares yc e yb. 7. Inicializar wa = 0 para todos los arcos a; para todas las (i, j) fijar wa = wa + yijc para a en la ruta Tij.



Equilibrio entre oferta y demanda

8. Obtener la longitud óptima ϕ que minimice la función objetivo (o una versión linealizada de ella) y revisar la demanda y los flujos así:

Tijc  Tijc  ( yijc Tijc ) Tijb  Tijb  ( yijb Tijb ) Va  Va  ( wa Va ) 9. Si se alcanza una convergencia idónea se para, en caso contrario ir al paso 2. En este problema, el único parámetro a calibrar es τ y para calibrarlo Florian y Nguyen (1978) proponen utilizar una media ponderada de los costes de viaje. También reconocen que en algunos casos puede ser ventajoso utilizar dos parámetros diferentes de calibración, uno de ellos para el transporte público y otro para el privado; en este caso se puede utilizar el mismo algoritmo solución. 11.4.3.3.

Combinación generación, distribución, elección modal y asignación de viajes

Safwat y Magnanti (1988) han dado un paso más desarrollando un programa matemático llamado STEM (Simultaneous Transportation Equilibrium Model). También han proporcionado formas funcionales caracterizadas por una mayor flexibilidad respecto de las producidas para las formalizaciones normales de maximización de la entropía. Sin embargo, sus funciones de demanda aún son menos generales que las utilizadas en los modelos secuenciales de transportes. Emplean una medida flexible de la desutilidad del viaje Uij definida por: Uij = –βuij + Aj

(11.27)

donde β es un parámetro de calibración, uij es el coste percibido de viaje entre i y j, y Aij es el efecto compuesto de diferentes variables socioeconómicas que influyen en la atracción de viaje, por ejemplo una suma ponderada de los empleos, áreas comerciales, etcétera. Safwat y Magnanti (1988) ligan la generación de viajes a una medida sistemática de la accesibilidad expresada como:

« º Si  max ¬0, log ¤ exp(  uij Aj ) » j ­ ¼

(11.28)

MODELOS

DE



TRANSPORTE

La distribución de los viajes viene dada por un modelo logit:

Tij 

exp (  uij Ai )

¤ exp (  u

ij

Aj )

Gi

(11.29)

j

Safwat y Magnanti sostienen que esta forma es más general que la del modelo gravitacional porque incluye variables socioeconómicas y una función de utilidad flexible. Es fácil ver que si se hace Aj = logDj, como se hizo en el Capítulo 5, el modelo se convierte en un modelo gravitacional simplemente acotado con función de impedancia exponencial. Un modelo de gravitación doblemente acotado puede aproximarse, en cambio, con un valor de β muy pequeño y positivo. La elección modal en este modelo es análoga a la elección de ruta. Cada usuario individual selecciona el modo que le resulta más atractivo. La elección de ruta y el modo se combinan entonces dentro del esquema de asignación de equilibrio. El método de solución propuesto por Safwat y Magnanti (1988) es de nuevo una adaptación del algoritmo de Frank-Wolfe; el lector puede analizar su publicación para tener mayores detalles sobre este método. El modelo STEM ha sido aplicado en un pequeño número de estudios en Egipto y en Texas, y estas aplicaciones han demostrado que el modelo requiere una buena cantidad de recursos de ordenador.

11.4.4.

Consideraciones prácticas

La modelización del sistema de transporte requiere encontrar el equilibrio adecuado entre la riqueza conductual, los costes de adquisición de los datos, la eficiencia computacional y la capacidad de realizar previsiones. Los modelos de equilibrio analizados en los párrafos anteriores intentan alcanzar la eficiencia computacional sin comprometer demasiado los aspectos relacionados con el comportamiento en la estimación de la demanda. Sin embargo, estos modelos de equilibrio del sistema limitan los tipos de funciones de demanda que pueden ser usados. Estas limitaciones, efectivamente, son análogas a las impuestas para proporcionar funciones de flujo que garanticen buenas propiedades de unicidad y convergencia en la asignación en equilibrio. En particular, debería ser posible invertir las funciones de demanda, que tendrían que ser simétricas y negativas definidas.



Equilibrio entre oferta y demanda

Safwat y Magnanti (1988) analizaron cuánta flexibilidad puede conservarse con estas restricciones y concluyeron que la riqueza conductual del modelo no es significativamente inferior a la de la mayor parte de los modelos agregados de transporte. Sin embargo, si se desea explotar el poder de los modelos de demanda desagregada, se requerirá una aproximación al equilibrio de los sistemas de transporte más concisa y elaborada. Se han efectuado múltiples experimentos para implementar esquemas más ambiciosos de equilibrio del sistema. Uno de éstos ha sido el que se ha puesto en práctica en parte del estudio de transportes de Santiago de Chile (ESTRAUS, 1989), cuya discusión en detalle excede de los objetivos de este libro. Sin embargo teniendo en cuenta el estado del arte sobre estos temas, se puede responder, al menos parcialmente, a las dos siguientes preguntas clave: • ¿es realmente importante alcanzar el equilibrio del sistema? • ¿son necesarios ordenadores muy potentes? La respuesta a la primera pregunta se ha visto que es Sí. Si no se intenta alcanzar el equilibrio del sistema, la solución final del modelo de transporte puede depender fuertemente de los costes iniciales adoptados para ejecutar cada submodelo. Esta dificultad puede incluso distorsionar la selección de los mejores proyectos (véase por ejemplo, Arezki et al., 1991). Esta cuestión debería influir a la hora de alcanzar el equilibrio en los problemas de modelización del transporte. Actualmente, los software modernos como la combinación de SATURN y SATCHMO (Willumsen et al., 1993), permiten buscar soluciones de equilibrio que comprendan la elección del horario de salida, del destino, del modo y de la ruta. La respuesta a la segunda pregunta era también afirmativa hacia finales del siglo XX; felizmente hoy no lo es. Naturalmente, para obtener el equilibrio completo del sistema hace falta más tiempo que en el caso de la asignación de equilibrio con pocas iteraciones retroactivas para la distribución y la elección modal. Pero las soluciones no son comparables en cuanto a que, en el primer caso, se consigue una solución convergente y única mientras que en el segundo el logro de una solución estable sólo puede ocurrir aleatoriamente, probablemente en situaciones de baja congestión. Dependiendo del rango del comportamiento de las respuestas del modelo, resulta que un verdadero equilibrio de sistema requiere un tiempo CPU de 4 a 40 veces superior con respecto al requerido para una simple pasada, utilizando un sistema de modelos de equilibrio sólo a nivel de asignación. En todo caso, no se requiere una cantidad de

MODELOS

DE

TRANSPORTE



datos superior a la necesaria para una modelización de no-equilibrio. Dado que la capacidad de los ordenadores más o menos se duplica cada 18 meses la restricción computacional no debería ser una limitante. La utilización de programas comerciales puede mejorar la eficiencia y ciertamente hace más fácil realizar mayor número de aproximaciones. Por ejemplo, una versión del avanzado modelo ESTRAUS para Santiago se puede transferir sin problemas al paquete de EMME/2, aparentemente con ventajas en términos de velocidad de convergencia y tiempos de cálculo (Florian et al., 1999). En este caso, la aplicación se refiere a un modelo de equilibrio de la red multiclase, multimodal a demanda variable, donde el modelo de elección modal viene dado por una estructura de logit jerárquico agregado con un modelo de distribución de viajes multiproporcional tipo entropía. El tiempo de viaje en los modos de transporte público depende del tiempo de viaje sobre los demás vehículos que usan la red vial; no obstante, no se han tenido en cuenta las restricciones de capacidad en la asignación a transporte público como en la nueva versión desarrollada por De Cea y Fernández (2000). Florian et al. (1999) han desarrollado una formulación de desigualdad variacional que captura todas las componentes del modelo de forma integrada. El algoritmo solución, basado en una descomposición Gauss-Seidel en bloques, unida al método de promedios sucesivos, proporciona un algoritmo eficiente que resuelve, de forma secuencial, los modelos de equilibrio de la red con demanda fija y los modelos multidimensionales de la distribución de los viajes. La implementación, por ejemplo sobre un Pentium II a 450 MHz, requiere un tiempo de cálculo de unos 200 minutos para alcanzar la solución de equilibrio, partiendo de una demanda inicial igual a cero (tiempo de viaje en situación de flujo libre). En muchos casos se puede comenzar a partir de una red previa, cargada de forma más real y, de esta forma, el tiempo de cálculo puede ser reducido en dos tercios. Existe un potencial conflicto entre la formulación del equilibrio del sistema y el realismo del modelo. Nadie pretende que el sistema real de transportes esté siempre en equilibrio: información imperfecta, variaciones diarias y estacionales en la demanda, influencia de variables no introducidas en el modelo, inercias e histéresis, contribuyen a afirmar que es improbable alcanzar el equilibrio. La conveniencia de adoptar el esquema de equilibrio consiste en la posibilidad de obtener una solución única que no dependa del estado inicial de algunos algoritmos o de una elección arbitraria del número de iteraciones. Si tal solución no está garantizada, siempre existe el riesgo de que la valoración



Equilibrio entre oferta y demanda

de algún proyecto o de alguna política de intervención sean espúreas; los resultados (A es mejor que B) pueden depender de elecciones arbitrarias acerca del punto de partida o del número de iteraciones. Naturalmente, como ya se ha visto, la garantía de una solución única para los problemas de equilibrio del sistema impone algunas restricciones sobre las formas funcionales a utilizar en los submodelos. Soluciones con formulaciones logit lineales en los parámetros son más simples de desarrollar que otras formas más ricas desde el punto de vista conductual. La introducción de funciones más realistas (como las asimétricas) para las demoras en las interacciones o para el coste generalizado bajo restricciones de capacidad para el transporte público, generalmente no garantizan la convergencia a una solución única. En estas circunstancias hay muchas formas prácticas para facilitar dicha convergencia o la estabilidad de la solución, pero no hay garantías de que la solución encontrada sea única y correcta (es decir, la que resuelva la formulación del equilibrio del sistema). Es probable que se realicen muchas investigaciones en los próximos años para mejorar la riqueza conductual de los modelos de transporte, asegurando a la vez una buena convergencia y el equilibrio completo del sistema. El equilibrio en el sistema de los transportes y en el mercado no es un fin en sí mismo. Hay buenas razones para sospechar que el equilibrio no existe en la realidad, ni siquiera en el caso de la red más simple. Los sistemas reales están en permanente mutación ya que, entre otros aspectos, los viajeros experimentan nuevos recorridos, nuevos modos y nuevos destinos, familias que cambian de residencia, de trabajo, de comportamientos comerciales, sociales, estilo de vida. Sin embargo, el estado del arte de la modelización dinámica de los fenómenos todavía no alcanza los niveles de progreso de la modelización de equilibrio. La idea que subyace aquí es que para proporcionar criterios objetivos sobre decisiones de planificación de transporte es necesario utilizar modelos y eso requiere comparar alternativas de intervención en el sistema. Por lo tanto, resulta entonces de capital importancia la utilización coherente de modelos para estimar las prestaciones de estas intervenciones y, de esta manera, comparar alternativas bajo los mismos supuestos y condiciones. Encuadrar los esfuerzos de modelización del transporte en el interior de un esquema general de equilibrio parece un prerrequisito para asegurar la consistencia. Ésta no es, naturalmente, una condición suficiente; de hecho, puede suceder en determinados casos que modelizaciones parciales del sistema sean

MODELOS

DE

TRANSPORTE



suficientes para discriminar un proyecto bueno de otro menos bueno. Sin embargo, el estado del arte de la modelización de equilibrio es tal que raramente se tiene que sacrificar demasiado realismo para conseguirlo. El estado del arte en este campo está en constante superación y ofrece ya una base sólida para su uso en la práctica.

11.5. 11.5.1.

ELECCIÓN DEL HORARIO DE PARTIDA Y ASIGNACIÓN Introducción

La prolongación de los períodos punta es un fenómeno ampliamente observado en áreas urbanas extensas. A medida que la congestión aumenta y para evitar más demoras, los usuarios tienden a variar sus horarios de salida prolongando así la duración del período punta. En muchas áreas urbanas congestionadas es común observar períodos punta que cubren buena parte de la mañana y/o de la tarde abarcando horas que previamente eran consideradas valle. En diferentes casos, se ha detectado que el cambio del horario de salida representa la segunda respuesta más probable a las variaciones en las condiciones de viaje; la primera es el cambio de ruta. Ello se debe principalmente al deseo de evitar la congestión pero responde también a la estructura de las tarifas de los peajes viales y a la tarificación del transporte público. Las aproximaciones tradicionales a la modelización de este fenómeno son bastante simples. Siempre se puede establecer una hipótesis pragmática sobre la duración de los períodos punta en el futuro y sobre cómo se repartirá la demanda esperada a lo largo de este período. Por tanto, se requiere sencillamente una descomposición de la demanda en los futuros períodos punta de forma que se generen niveles razonables de congestión y de demoras. Sin embargo, estas aproximaciones prácticas se prestan a decisiones arbitrarias que influyen en la valoración de los proyectos y en las políticas de intervención, y descuidan el hecho de que viajando en un horario deseable se incrementa la desutilidad del viaje. En los párrafos siguientes se exponen las metodologías actuales para la modelización de la elección del horario del día en que comenzar el viaje. Por su estrecha relación con la asignación y las demoras, esta problemática integra tanto la asignación como la elección del modo. En particular se estudiará primeramente el enfoque de la elección del horario de viaje y posteriormente se examinarán los modelos de oferta a ella adjunta. Por fin se expondrá un modelo



Equilibrio entre oferta y demanda

combinado simple de elección del horario de salida y asignación del cual serán citadas las principales limitaciones y algunas indicaciones de mejora futura.

11.5.2. Principios básicos en la elección del horario de partida Un concepto básico en relación a la elección de la hora de salida es que el usuario tiene un horario preferido de viaje y que alejarse de él le resta utilidad, conocida como desutilidad programada. El momento preferido del viaje puede ser definido como el horario preferido de partida o el horario de llegada preferido; este último es más importante para algunas actividades (por ejemplo, trabajo con horario fijo, reuniones de trabajo, visitas al teatro). La desutilidad programada puede añadirse así a la desutilidad del tiempo de viaje para conformar una función de utilidad combinada que incluye el horario de salida variable. El trabajo de Small (1982) es la base de la mayor parte de las aplicaciones de estos conceptos. Si se refiere al horario de llegada, la función de Small adopta la siguiente forma:

U ( )   – C ( )  – SDE ( )  – SDL( ) D – d L ( ) donde τ es el horario de llegada y C es la duración del viaje, expresada como una función del horario de llegada, en cuanto a que las condiciones de tráfico varían según la hora del día. SDE y SDL (Schedule Delay Early y Late) son la antelación y el retraso programado y denotan la diferencia entre el horario de llegada seleccionado y el horario de llegada preferido (Preferred Arrival Time, PAT) en el caso de que se desee adelantar o aplazar la llegada respectivamente. Por tanto SDE y SDL pueden ser definidos como:

SDE  max (PAT  , 0) SDL  max ( PAT, 0) Los parámetros α, β, γ y δ son positivos; α, β y γ miden la desutilidad asociada al incremento de una unidad respectivamente de C, SDE y SDL; δ es un factor fijo de penalización para la llegada anticipada, y dL es una variable dummy para las llegadas atrasadas (igual a 1 si τ > PAT y cero en otro caso). La penalización fija es a menudo omitida en la función e incluida dentro del parámetro de utilidad del retraso γ programado posteriormente. La función de utilidad definida anteriormente se puede tratar como la suma de un término que expresa la duración del viaje y de otro término que expresa la variación de utilidad asociada con el horario de llegada (–β · SDE(τ) – γ ·

MODELOS

DE



TRANSPORTE

SDL(τ) – δ · dL), definido como el término de la utilidad programada. El término de utilidad programada se maximiza cuando los viajeros llegan en el horario preferido de llegada (τ = PAT, que hace la utilidad programada igual a cero). Por tanto, cuando la duración del viaje es constante y no es posible intercambiar duración y utilidad programada, la distribución de los horarios actuales de llegada es idéntica a la distribución de los PATs. Sin embargo, cuando la duración del viaje varía según la hora del día y si la desutilidad programada tiene un peso inferior respecto al beneficio consecuente con la reducción del tiempo de viaje, los viajeros se alejarán de su horario preferido, y eso determina una distribución del horario actual de llegada más amplia con respecto de la distribución de los PATs (horarios preferidos). Los parámetros de estas funciones de utilidad combinada pueden estimarse con técnicas de preferencias declaradas/reveladas; véase por ejemplo Small (1982) y Bates (1966). Obsérvese la figura 11.8 donde en el eje de ordenadas está la desutilidad programada expresada en unidades de tiempo (horas) de duración del viaje y en el de abscisas el horario de llegada anticipada o aplazada con respecto al PAT (horas). Desutilidad programada

Pendiente δ = 2,50 γ = 0,50 Pendiente β = 0,60 Anticipación

Tiempo de llegada Retardo

Figura 11.8. Esquema idealizado de la utilidad (o desutilidad) programada expresada en minutos equivalentes de tiempo de viaje.

Los coeficientes de la figura reflejan una función de desutilidad ideal. La asimetría de la función ha sido observada en muchos estudios de preferencias declaradas/reveladas; 5 minutos de retraso en el horario de llegada generalmente se percibe como peor que 5 minutos de antelación. En este caso ideal, llegar 30 minutos antes del horario preferido (PAT), estaría justificado si el individuo pudiera ahorrar más de 0,30 h ó 18 minutos de tiempo de viaje. Lle-



Equilibrio entre oferta y demanda

gar en cambio 30 minutos más tarde respecto de la PAT daría lugar a una penalización adicional equivalente a 30 minutos de tiempo de viaje más una penalidad adicional de 1,25 h o bien 90 minutos. Por tanto, estos 30 minutos de retraso en el horario de llegada estarían sólo justificados si el individuo pudiera ahorrar más de 2 horas de tiempo de viaje, un acontecimiento bastante improbable. Naturalmente, grupos diferentes de individuos tendrán valores diferentes para α, β y δ y también diferentes PATs. La formulación base (omitiendo el término de penalidad δ) fue extendida por Hyman (1997) para incluir un intervalo de indiferencia alrededor de la PAT, durante el que las llegadas no incurren en una desutilidad programada, por ejemplo llegar a la hora deseada más o menos 5 minutos. Hendrikson y Plank (1984) propusieron una forma cuadrática de la función de utilidad mientras que Polak et al. (1991) formularon un modelo lineal compuesto. Addison y Heydecker (1998) examinaron tres casos de funciones continuas: una hipérbola simple truncada, una hiperbólica y una función no convexa. A pesar de estos esfuerzos, las aplicaciones prácticas generalmente utilizan funciones lineales, con o sin desutilidad fija δ para las llegadas aplazadas.

11.5.3. Modelos simples de equilibrio oferta/demanda Las funciones de utilidad asociadas a la demanda de viaje por hora del día pueden combinarse con las características de la oferta para generar un perfil de demanda de equilibrio en el tiempo que surge de la interacción entre las preferencias y las elecciones de los viajeros. Esto se puede ilustrar en una red simple con un par O-D conectado a un arco con un cuello de botella entre ellos (Figura 11.9). Vickrey (1969) examinó el equilibrio con un número fijo de viajeros idénticos que se desplazaban sobre un arco individual donde la única demora ocurría en el estrechamiento de la calle con capacidad fija. En este caso, las demoras son proporcionales a la longitud de la cola. Aplicando el principio de equilibrio, es decir que ningún viajero puede incrementar su utilidad modificando su horario de salida, Arnott et al. (1993, 1994) extendieron el modelo de Vickrey y calcularon el perfil de salida resultante de los viajeros.

ORIGEN

Cuello de botella

Figura 11.9.

Red simple.

DESTINO

MODELOS

DE



TRANSPORTE

Salidas pendiente q2 Salidas pendiente q1

τ1

Cola máxima

Salidas/llegadas acumuladas

La figura 11.10 ilustra el perfil de salida de equilibrio de un grupo de viajeros con características homogéneas. El perfil está completamente definido por expresiones cerradas para tasas de salida (q1 y q2), del horario de la primera y última llegada τ1 y τ2 y del horario τp en que la tasa de salida varía de q1 a q2 y se realiza la máxima cola. Varios autores han extendido el modelo de Vickrey para tener en cuenta la heterogeneidad de los viajeros con respecto a los PATs y/o a los parámetros asociados a la duración del viaje y al retraso sobre el horario programado. Hendrikson y Kocur (1981) tuvieron en cuenta el problema de Vickrey cuando los viajeros tienen una distribución de PATs. Arnott et al. (1994) han afrontado el problema de la heterogeneidad segmentando la población en subgrupos homogéneos en relación con el valor de sus PATs y de los parámetros de la utilidad.

τp

Llegadas pendiente h (capacidad)

PAT

τ2

Tiempo

Figura 11.10. Perfil de salidas de equilibrio para viajeros homogéneos.

11.5.4.

Asignación de equilibrio con demanda variable

Las aplicaciones prácticas de estos principios implican que el problema debe ser encuadrado en el contexto de la modelización de la asignación de equilibrio con demanda variable, en cuanto a que dicho problema requiere determinar los flujos y los niveles de demanda para cada período de tiempo. Dado el progreso alcanzado en combinar modelos de asignación con modelos de elección tipo logit, parece natural utilizar un enfoque parecido para incluir la elección del horario de viaje. Willumsen et al. (1993) suponen que, para cada par O-D, C(τ) sea variable en el período punta (calculado a través de la asignación de equilibrio) pero constante en los períodos fuera de punta. Esta hipótesis y el uso de



Equilibrio entre oferta y demanda

una función de utilidad lineal en los parámetros como la de Small, permiten encuadrar el problema en una formulación simple que combina un modelo logit de elección de hora y asignación de equilibrio. La elección del horario de viaje es entonces una elección discreta: viajar “ahora” o viajar durante un “período anterior” o durante “un período posterior”. Aproximaciones parecidas han sido propuestas por Hendrikson y Plank (1984) y Caja et al. (1992). Estas aproximaciones, aunque cualitativamente superiores para ignorar el problema presentan algunas limitaciones, entre ellas las siguientes: • Desatienden las interacciones entre períodos de tiempo. Los viajes desplazados de la hora punta a otros períodos aumentan los tiempos de viaje en estos últimos y, en consecuencia, es necesario calcular de nuevo C(τ). Dado que no es posible en general estimar una función para C(τ), la elección del horario del día no se puede tratar completamente y, por tanto, este método constituye un enfoque parcial de la dinámica entre diferentes períodos de tiempo. • El horario de salida debería ser una variable continua y su “discretización” a períodos de tiempo es una aproximación bastante gruesa. El empleo de intervalos de tiempo relativamente pequeños (por ejemplo 15 minutos en lugar de la hora punta/fuera de punta) constituye una mejora pero aun así sigue siendo una aproximación. • Para el caso de elección del horario del día las formulaciones logit lineales en los parámetros pueden ser menos apropiadas. Ello se debe al hecho de que las alternativas en este caso están correlacionadas, en cuanto a que los tiempos de viaje en un cierto período de tiempo dependen de los tiempos de viaje en el resto de los períodos. El problema de la interacción entre intervalos de tiempo utilizando un modelo mejor de elección de horario de salida ha sido acometido de modo práctico por HCG et al. (2000) en el software HADES (Heterogeneous Arrival and Departure times based on Equilibrium Scheduling theory). HADES es un modelo de horario de salida para viajeros heterogéneos que interactúa con un software comercial de asignación. Teniendo en cuenta por un lado los tiempos de viaje en la red y los PATs de los viajeros, y por otro, los parámetros de la utilidad, HADES produce una matriz O-D en función del tiempo. El problema del equilibrio se aborda a través de un proceso iterativo entre la componente de la demanda (HADES modelo de horario de salida) y la de la oferta (modelo de asignación externo) como puede verse en la figura 11.11.

MODELOS

DE



TRANSPORTE

Tiempo de llegada preferido

Características del comportamiento

Modelo de tiempo de salida

Duración del viaje sobre la red

Matriz O/D en función del tiempo Modelo de asignación

Figura 11.11.

Esquema operativo de HADES combinado con un modelo de asignación.

Addison y Heydecker (1999) han examinado el problema del equilibrio dinámico del usuario con un modelo de elección de horario de salida, focalizando la atención en la relación entre el perfil de la demanda de equilibrio (asumiendo como fija la demanda total) y el término de retraso programado de la función de utilidad. La expresión así determinada fue utilizada para calcular los perfiles de demanda de equilibrio utilizando un modelo determinístico de teoría de colas de tráfico, y proponer un operador iterativo para hallar los perfiles de equilibrio de la demanda para modelos de tráfico más realistas. Éste es un campo en el que probablemente se realizarán bastantes progresos en el futuro gracias a desarrollos teóricos y al empleo de mejores modelos de asignación dinámica. El empleo del modelo de elección logit para la elección de horario de salida ha sido criticado por diferentes autores, entre otros Bates (1996). Esta crítica nace de las hipótesis de independencia de las componentes aleatorias de la utilidad de las diferentes alternativas a las que está sometido el logit multinominal. Además, este modelo no puede tratar los problemas de heteroscedasticidad que probablemente se presenten cuando los términos de error sean proporcionales a una potencia del retraso programado (desutilidad no lineal a desplazamientos con respecto de los PATs).



Equilibrio entre oferta y demanda

De hecho, en este caso la hipótesis de independencia de la componente aleatoria de la utilidad es restrictiva y no realista porque es probable que los intervalos adyacentes estén correlacionados, en cuanto a los atributos no observados (componente aleatoria de la utilidad), influyendo de modo similar en las preferencia por alternativas. También Small (1987) subraya el hecho de que estas correlaciones se presentan inevitablemente cuando la variable dependiente es una discretización de una variable continua, como sucede con la variable tiempo en este caso. Sin embargo los modelos de elección tipo logit han sido ampliados y mejorados de diversas formas para tener en cuenta diferentes niveles de correlación estocástica entre alternativas, como se expuso en los Capítulos 7 y 8, relajando así el requerimiento de independencia de las componentes aleatorias entre las alternativas. Muchos investigadores han puesto de manifiesto que se puede realizar una representación más detallada de los comportamientos de elección de horario de viaje teniendo en cuenta todas las actividades que motivan a los viajeros en sus desplazamientos. Ello es ciertamente correcto, pero como indica Mahmassani (2000) el problema no es sencillo y para obtener una solución es probable que se tenga que esperar hasta que existan métodos mejores de adquisición pasiva de datos y lleguen a ser de uso común en la práctica. Nuevas técnicas de medición que utilizan GPS (Global Positioning Systems), teléfonos portátiles (ahora omnipresentes) y PDAs (Personal Digital Assistants) son seguramente las que revolucionarán la adquisición de datos en este campo.

11.5.5. Conclusiones La literatura sobre este tema evidencia la existencia de diversas aproximaciones para modelizar la elección de horario de salida y la correspondiente falta de consenso al respecto. Para lograr integrar este importante aspecto del comportamiento de viaje en la modelización tradicional del transporte se requiere más experiencia e investigación. Las aproximaciones de equilibrio dinámico estudiadas ofrecen la posibilidad de incorporar la elección de horario de salida, posiblemente dentro de un contexto estocástico así como de un submodelo robusto de asignación para estimar el tiempo de viaje sobre una base continua. Sin embargo, tal tratamiento explícito del tiempo requiere una descripción dinámica de los flujos en la red y eso tiene como consecuencia dificultades no sólo analíticas sino también

MODELOS

DE



TRANSPORTE

computacionales. La implementación práctica del problema en esta forma tiene aún que esperar a posteriores desarrollos. Una mejor vía de solución podría ser superar las limitaciones de los modelos disponibles como SATCHMO y HADES, tanto en su consistencia interna como en el tratamiento del tiempo en el modelo de elección (Polak, 1999). Sin embargo, la importancia reconocida de esta respuesta conductual a la congestión (y a precios diferenciados) hace indispensable el estudio de mejores formas prácticas para incorporar estos efectos dentro de la mayor parte de los modelos de transporte para áreas urbanas.

EJERCICIOS 11.1. Una autopista de 12 km conecta dos áreas urbanas. La función de oferta para cada uno de los tres carriles por sentido de marcha del arco vial se puede aproximar por: q t  20 200 donde t es el tiempo de viaje en minutos y q el flujo por carril en unidades de coches equivalentes por hora. La autopista normalmente se utiliza para automóviles y autobuses directos, sin paradas, a lo largo del recorrido: los correspondientes tiempos de viaje de los vehículos son tc y tb. En hora punta el servicio de autobús tiene una frecuencia igual a un autobús por minuto y la función de demanda para los viajes en coche se ha estimado mediante la siguiente función: Vc = 3.480 – 60 tc donde Vc es el flujo total en el coche por hora y sentido. De modo análogo, la función de demanda para los viajes en autobús es: V b = 4.200 – 75 tb donde V b es el número de pasajeros por hora y sentido. Se puede aceptar que tanto tc como tb puedan ser calculados utilizando las funciones de oferta expuestas arriba y que un autobús sea equivalente a 2 automóviles. a) ¿Cuál es el estado inicial de equilibrio? ¿Si cada autobús tiene 60 plazas (asientos), cuál es su factor de carga (ocupación dividida por la capacidad)?



Equilibrio entre oferta y demanda

b) Supóngase ahora que uno de los carriles pueda ser utilizado exclusivamente por autobuses. ¿Cuál es el nuevo estado de equilibrio y el nuevo factor de carga para los autobuses? c) Discutir las hipótesis implícitas en las funciones de demanda utilizadas arriba. 11.2. Dos ciudades distanciadas por 60 kilómetros están conectadas por una carretera de doble sentido en la que los coches circulan todo el día. La demanda en la hora punta, para viajes en coche entre las dos ciudades, viene bien descrita por la siguiente función: q = 6.000 – 1.500t donde q es la demanda en vehículos por hora y t el tiempo de viaje en horas. La relación entre tiempo de viaje y flujo para la carretera es: t = 0,9 exp (0,0003q) a) Estimar cuántos viajes de personas y vehículos se generan cada día en condiciones de equilibrio si cada coche transporta como media 1,5 pasajeros. b) Supóngase que se pone en funcionamiento entre las ciudades un servicio ferroviario frecuente pero lento, en el que cada tren tiene una capacidad nominal de 300 pasajeros. Durante la hora punta la compañía ferroviaria está dispuesta a poner en línea un tren cada 10 minutos con un tiempo de viaje estimado en 90 minutos. Si se supone que los pasajeros utilizan el modo más rápido de transporte disponible ¿es éste un nivel de servicio inteligente? Justificarlo. 11.3. Sea la red y las condiciones descritas en el ejercicio 10.3. a) Expresar la función objetivo del programa matemático correspondiente al equilibrio individual de Wardrop en términos de flujos y las relaciones tiempos de viaje/flujo de la figura. b) Calcular los flujos de equilibrio en cada arco y los tiempos de viaje para cada grupo de viajeros. Hallar el valor de la función objetivo de arriba, en condiciones de equilibrio y el tiempo de viaje total gastado en el sistema. c) Supóngase que los ingenieros de tráfico locales han decidido poner una limitación de velocidad en el arco CD de forma que el nuevo tiempo de viaje en función del flujo sea:

MODELOS

DE



TRANSPORTE

t = 5,2 + 0,001q Calcular las nuevas condiciones de equilibrio en términos de flujos y tiempos de viaje y demostrar que bajo estas condiciones el tiempo de viaje total gastado en el sistema es menor que en el caso b. 11.4. La red en la figura 11.12 representa la carga durante la hora punta con 100 vehículos que viajan de A a D. Las ecuaciones expresan el tiempo de viaje en cada arco en minutos como una función del flujo q en el arco en vehículos por hora. Todos los arcos son unidireccionales. a) Identificar los recorridos de mínimo coste utilizados, sus flujos y los correspondientes costes de equilibrio. ¿Cuál es el tiempo de viaje total gastado en la red? b) Si se acepta que el arco C-B sea peatonalizado y por consiguiente no disponible para el tráfico vehicular, identificar los nuevos flujos de equilibrio, los costes y el tiempo de viaje total gastado en la red. c) Discutir los resultados. B

21 + 0,01 q

4 + 0,02 q A

8 + 0,1 q

C

19 + 0,01 q

6 + 0,1 q

D

Figura 11.12. Red simple para el ejercicio 11.4.

12. Modelos simplificados de demanda de transporte 12.1.

D

INTRODUCCIÓN

urante muchos años, la principal preocupación en la modelización de transportes ha sido el enriquecimiento de su contenido conductual, y el perfeccionamiento de los métodos de toma de datos como formas de mejorar su exactitud y realismo además de reducir los costes. Una línea paralela de investigación ha consistido en intentar mejorar la modelización de transportes prestando mayor atención al uso de datos disponibles y a la comunicabilidad de modelos con características y resultados más simples. Esta corriente de investigación ha tenido un fuerte impacto en la práctica, ya que no solamente supone una reducción de costes, sino también requerimientos menos onerosos de toma de datos y su procesamiento. Es probable que en el futuro se mantenga este interés por las técnicas simplificadas de modelización (ver Ortúzar, 1992). Los modelizadores de las empresas consultoras y de la administración han de estudiar a veces propuestas de transporte en plazos muy cortos. El desarrollo de métodos simplificados cada vez mejores y bien fundamentados para realizar estas tareas será siempre bienvenido. La idea de utilizar modelos de respuesta rápida más sencillos no es nueva. Desafortunadamente la no utilización de modelos formales para la evaluación de proyectos de transporte está mucho más extendida de lo que los documentos oficiales y la literatura técnica pueden hacer pensar. La idea de prescindir de los modelos formales sólo significa que los gestores están utilizando sus propios modelos mentales basados generalmente en la experiencia para tomar las decisiones. Estos modelos pueden ser poderosos y ciertamente más sensibles hacia variables políticas y sociales que cualquier desarrollo matemático formal. Los modelos mentales se forman y perfeccionan mediante observaciones, analogías, discusiones, experimentos y errores. Son esenciales para hacer uso de los modelos formales, interpretar sus resultados y añadir alguna conside-



Modelos simplificados de demanda de transporte

ración que se encuentre fuera del ámbito analítico. Para este fin, la capacidad reducida el del procesamiento numérico de los modelos mentales no es una limitación grave. Sin embargo tienen dos carencias principales: a veces fallan completamente, por ello al considerar las consecuencias de un crecimiento exponencial o las interconexiones entre decisiones aparentemente no relacionadas, como impuestos (tasas) y elección modal. La segunda desventaja de los modelos mentales es que normalmente no están “abiertos” a discusión y carecen de transparencia para calificar las recomendaciones derivadas de su uso. Son por ello difíciles de transferir de un usuario a otro. Existe un amplio rango de metodologías de modelización entre los dos extremos: usar sólo modelos mentales o basarse en técnicas de simulación muy complejas y avanzadas. Una de las dimensiones a considerar es la forma en la que se representa el espacio y por tanto la distancia como elemento clave en el transporte. Algunos modelos ignoran completamente el espacio; por ejemplo aquellos que se concentran en las implicaciones financieras de las subvenciones, impuestos, etc. Pueden ser modelos simples como los de elasticidad los que se emplean a veces para evaluar incrementos tarifarios o cambios en el precio del combustible e impuestos sobre vehículos. En otros casos pueden incluir interacciones más complejas, por ejemplo entre los diferentes impuestos y licencias que afectan a la propiedad y uso del automóvil. Algunos autores han defendido la utilización de técnicas de modelización estructural; ver por ejemplo el interesante trabajo de Roberts (1975) con respecto al consumo de combustible. En este caso se utiliza un gráfico orientado para relacionar los elementos del sistema de transportes, por ejemplo el número de coches, impuestos sobre el combustible, mejora en los consumos de combustible, emisiones y costes. Estas conexiones pueden tener asociados diferentes pesos para representar la fuerza relativa de cada relación. Si se sustituyen estos pesos por ecuaciones, calibradas a partir de observaciones reales, se acaba teniendo un modelo de interacción no espacial. Khan y Willumsen (1986) desarrollaron un modelo de este tipo para el estudio de la motorización en los países menos desarrollados. La filosofía del modelo se basaba en que en los países en desarrollo la tasa de motorización no debe sólo proyectarse sino que debe contemplarse junto con las necesidades de invertir en infraestructura y consumo de combustible. El modelo incluía, además de las variables antes mencionadas, funciones que representaban el consumo de combustible y la necesidad de gastos adicionales para el mantenimiento de carreteras y nueva construcción. Algunas de estas variables, en particular la construcción e im-

MODELOS

DE

TRANSPORTE



portación de vehículos, tienen fuertes consecuencias en la balanza de pagos de estos países y deben analizarse antes de decidir actuaciones que disminuyan las restricciones a la propiedad y uso de los vehículos (ver más detalles en 13.3). Una mejor representación del espacio puede obtenerse con modelos idealizados del tipo propuesto por primera vez por Smeed (1968) y utilizado también por Wardrop (1968) para el estudio, entre otros aspectos de intervención, de las limitaciones del coche para viajes al trabajo en áreas urbanas. Como cada vez más gente utiliza el coche para los viajes al trabajo, se necesita dedicar más espacio a carreteras y aparcamientos, e incluso realizar cambios radicales en la naturaleza del área urbana. Estos modelos se han utilizado raras veces para la toma de decisiones, pero han servido para ilustrar algunos aspectos importantes de la intervención en política de transportes. La siguiente fase en la modelización del espacio implica realizar simplificaciones de las técnicas de modelización más convencionales como las expuestas en este libro. Los modelos de planificación simplificada (o esquemática) han sido específicamente desarrollados para conseguir una respuesta rápida con requerimientos limitados en la toma de datos. Estos modelos se presentan en el apartado 12.2. Aumentando el grado de realismo se llega a la idea de utilizar modelos simplificados de reparto modal, como los expuestos en el apartado 12.3. El epígrafe 12.4 trata de un grupo importante de modelos que hacen uso de datos disponibles, en particular, de aforos de tráfico. Las especiales características de los sistemas de transporte en corredores, permiten realizar otro tipo de simplificación, presentada en el apartado 12.5. Finalmente la interpretación de los resultados de un modelo y la utilización de los mismos se mejoran mediante el uso de técnicas especiales de aprendizaje. Los juegos de simulación se han desarrollado con este fin y se tratan en el último epígrafe de este capítulo.

12.2.

MÉTODOS SIMPLIFICADOS DE MODELIZACIÓN

Varios autores han desarrollado modelos simplificados de planificación como herramientas para planear un amplio rango de aspectos. Como lo señala en OECD (1974) y Sosslau et al. (1978), éstos son modelos que disponen de un mayor nivel de detalle que los métodos de redes idealizadas mencionados en el apartado anterior pero mucho más simples que los programas convencionales. Esta característica facilita el análisis de un amplio conjunto de estrategias sobre transporte y usos del suelo a un nivel limitado de resolución, sin necesitar gran



Modelos simplificados de demanda de transporte

cantidad de datos o las hipótesis rígidas de los modelos espaciales idealizados. Su desarrollo práctico se extiende desde programas de modelización agregada convencional a escala gruesa, hasta técnicas ad hoc desarrolladas a partir de hipótesis e ideas simplificadas. La mayoría de los métodos de planificación simplificada aprovechan la transferencia de los parámetros y de las relaciones de un área a otra o de un país a otro. Sólo se hacen dependientes de la localización ciertos aspectos de los modelos, normalmente las características de la red, población, niveles de renta, etc. En un extremo de los modelos de planificación simplificada se encuentran aquellos que suponen una alta regularidad en el comportamiento humano en el campo de los transportes. Un ejemplo típico de estos últimos es el UMOT (Mecanismo Unificado de Viaje), modelo propuesto por Zahavi (1979). Este modelo se basa en la hipótesis de que las siguientes relaciones son transferibles en el tiempo y el espacio (regiones, países): • Tiempo medio diario de viaje por persona, es decir una hipótesis de presupuestos de tiempo de viaje constantes. • Gasto medio diario de viaje, como función del ingreso y la motorización, es decir una relación de presupuesto en unidades monetarias. • Número medio de viajeros por hogar, como función del tamaño familiar y la motorización. • Coste unitario de posesión y operación de vehículos. • Relación velocidad-intensidad según tipo de vía. • Umbral de distancia diaria de viaje que justifica la posesión de vehículo. Estas relaciones fueron desarrolladas por Zahavi a partir de la recopilación de una amplia base de datos en todo el mundo. UMOT sólo necesita como input específico de localización los siguientes datos: • • • •

Número de hogares y sus tamaños en el área de estudio. Distribución del ingreso de los hogares. Coste unitario de viaje por modo. Longitud de la red viaria del área de estudio.

Una característica interesante del UMOT es que produce los siguientes resultados: • Motorización por hogar según grupo de ingreso. • Reparto modal agregado para todo el área de estudio.

MODELOS

DE

TRANSPORTE



• Tiempos y velocidades medias de viaje. • Otros indicadores de rendimiento como el gasto total y los tiempos de viaje. El modelo UMOT tuvo algún éxito como herramienta para la comprobación de diferentes opciones de intervención en materia de política de transportes, por ejemplo políticas tributarias sobre el combustible y la adquisición de vehículos, políticas de subsidio para transporte público e incluso programas de inversión en infraestructuras. Sin embargo el modelo ha sido examinado por Downs y Emmerson (1983) y Willumsen y Radovanac (1988) entre otros, y se ha encontrado que, en general, no representaba bien situaciones en otros países, pese al gran nivel de agregación utilizado. De hecho, se comprobó que la transferencia de las relaciones y de los gastos medios de tiempo y dinero no era lo suficientemente consistente como para garantizar el uso de UMOT, ni siquiera después de que los mismos autores introdujeran mejoras al modelo original. En el otro extremo, existen programas para microordenadores capaces de ejecutar los modelos clásicos de cuatro etapas utilizando parámetros tomados de otros modelos, en particular generación de viajes con tasas de viaje estándar, distribución de viajes utilizando modelos gravitacionales, reparto modal logit binomial y asignación de tráfico. Estos modelos están restringidos usualmente por el número de zonas, arcos y modos que pueden utilizarse, pero proporcionan un método aproximado para el análisis de problemas de transporte con una respuesta muy rápida (ver Sosslau et al., 1978). Las técnicas de planificación simplificada ofrecen ventajas en términos de simplicidad, rapidez de respuesta y escasos requerimientos de datos. Sin embargo, se apoyan demasiado en la transferencia de relaciones y parámetros de un contexto a otro. Esto puede hacer menos fiable el análisis a menos que se lleve a cabo sólo como un tanteo inicial para la selección de posibles soluciones para una consideración posterior más detallada.

12.3.

MODELOS DE DEMANDA INCREMENTAL

Se han desarrollado un cierto número de métodos para llevar a cabo análisis rápidos del impacto sobre la demanda debidos a cambios en las tarifas, niveles de servicio u otros atributos de un modo de transporte particular. Los métodos más conocidos se encuentran dentro de la denominación de análisis de elasticidad y el modelo de pivoteo (pivot-point). En los dos casos, el objetivo es



Modelos simplificados de demanda de transporte

estimar pequeños cambios en la demanda resultantes de variaciones (pequeñas) en uno de los atributos (raramente en más) de nivel de servicio, en un momento determinado del tiempo.

12.3.1. Análisis de elasticidad Sea una situación inicial en la que el nivel de demanda de un modo determinado es T0, y su nivel de servicio S 0 (normalmente un vector que incluye atributos como el tiempo de viaje, tarifa, tiempo de espera, etc.). La elasticidad de la demanda con respecto al nivel de servicio (para un nivel determinado de demanda y nivel de servicio) viene dada por:

Es 

S0 uT S0 (T T0 ) z T0 uS T0 ( S S0 )

(12.1)

y por tanto:

T T0 

EsT0 ( S S0 ) S0

(12.2)

La parte izquierda de esta ecuación representa la variación de la demanda en el modo analizado y se alcanza como consecuencia de un cambio relativo en el nivel de servicio de tamaño (S – S0) / S0. Este tipo de cálculo se utiliza a menudo para la revisión de tarifas o frecuencias de servicio de transporte público. Esto es, por supuesto, una aproximación que supone que se ha calculado Es de antemano (quizás a partir de una serie temporal de datos), que la elasticidad es constante (o que la función de demanda es lineal, lo cual no es muy probable) y que todo lo demás permanece igual. Este resultado es una aproximación razonable para pequeños cambios en las variables de nivel de servicio (LOS). Ejemplo 12.1: la elasticidad tarifa/demanda del transporte público se toma a menudo como –0,30. Si un sistema de transporte público lleva 200.000 pasajeros en el período punta, a una media de 80 peniques/viaje: • Estimar la pérdida de demanda si la tarifa media se incrementa en un 2,5%. • Analizar la sensibilidad del resultado respecto al valor de la elasticidad.

MODELOS

DE



TRANSPORTE

En este caso T0 = 200.000; Es = –0,30; y (S – S0) / S0 = 0,025. Utilizando la expresión (12.2), se obtiene: T – T0 = –0,30 × 200.000 × 0,025 = –1.500 pasajeros Si Es = –0,2 la reducción esperada en la demanda sería de 1.000 pasajeros. Si fuera 0,4 se obtendría una reducción de 2.000 pasajeros.

12.3.2. Modelos de pivoteo (pivot-point) Este método se ha desarrollado para estimar la demanda futura de viajes en base al conocimiento de los niveles actuales de demanda y a las variaciones en las variables de nivel de servicio para cada alternativa. En este caso se necesita conocer la función de demanda pero no los valores específicos de las variables de nivel de servicio que, se supone, no van a cambiar; por ejemplo el valor de los costes de aparcamiento en las diferentes partes de la ciudad. La única información que se necesita es el reparto de mercado actual de cada modo y los cambios propuestos de las variables de nivel de servicio. Posteriormente se utiliza una forma incremental del modelo de demanda para “pivotar” en torno a la situación actual. La forma incremental de un modelo de elección modal logit multinomial viene dada por (Kumar, 1980):

pka 

pk0 exp (Vk Vk0 ) ¤ p 0j exp (V j V j0 )

(12.3)

j

donde p'k es la nueva proporción de viajes que utilizan el modo k; pk0 en la proporción original de viajes en el modo k y (V k – Vk0) es la variación de utilidad de usar el modo k, variación generada por cambios en los atributos de nivel de servicio del modo k. Hay formas incrementales disponibles para funciones más complejas, como las correspondientes al modelo logit anidado (ver Bates et al., 1987; Martínez, 1987). Ejemplo 12.2: considérese un sistema de transporte con tres modos: coche, autobús y ferrocarril, con proporciones del 0,4, 0,45 y 0,15 respectivamente. Supóngase que la función de utilidad tiene la siguiente forma lineal: V k = – 0,10tk – 0,20wk – 0,05Ck / I+δk



Modelos simplificados de demanda de transporte

donde tk representa el tiempo de viaje a bordo, wk el tiempo de espera y Ck / I el coste dividido por el ingreso; δk es una penalización modal. Supóngase también que se está interesado en los cambios en la frecuencia que reducirían el tiempo de espera del ferrocarril de 10 a 7,5 minutos, e incrementarían los del autobús de 3 a 4 minutos. De aquí se obtendría para el ferrocarril: Vr – Vr0 = –0,2(7,5 – 10) = 0,5 y para el autobús: Vb – Vb0 = –0,2(4 – 3) = –0,2 La variación en el reparto modal sería por lo tanto: p'r = {0,15 exp (0,5)} / {0,15 exp (0,5) + 0,45 exp (–0,2) + 0,4} el lector puede verificar que esta expresión tiene como resultado: p'r = 0,24 y p'b = 0,36 De la misma forma, el modelo de gravedad incremental simplemente acotado puede escribirse como:

Tij 

GiTij0 a j exp ( $GCij )

¤T

0 ij

ij

a j exp ( $GCij ) (12.4)

donde Gi representa los viajes totales generados en la zona i, ΔGCij la diferencia en el coste generalizado entre el año de diseño y base, y aj los factores de crecimiento que reflejan los cambios en los destinos j. Por lo general no es difícil desarrollar formas incrementales para la mayor parte de los modelos de elección de viaje. Por ejemplo, Abraham et al. (1992) desarrollaron un modelo incremental para Londres utilizando modelos de elección modal y gravitacional doblemente acotados para diferentes tipos de usuarios y modos. Este modelo fue implementado en EMME/2 utilizando sus capacidades de elaborar instrucciones macro. De igual forma, SATCHMO tiene módulos para desarrollar modelos logit incrementales de elección de modo, destino y otros (ver Willumsen et al., 1993).

MODELOS

DE

TRANSPORTE



La formulación de modelos incrementales o de pivoteo es muy útil, ya que sólo se necesita tener en cuenta los cambios de los costes generalizados o de las funciones de utilidad y no de cada uno de los valores absolutos. Por ello, si no se están introduciendo nuevos modos, las penalizaciones modales se pueden ignorar ya que se cancelan en ΔGC. Una ventaja adicional es que el modelo conserva la mayor parte de las matrices actuales (o del año base), reteniendo cualquier asociación especial detectada en los datos pero nunca es tenida completamente en cuenta en un modelo. Esto es de interés especial al tratar la elección de destino cuando un modelo de gravedad no haya funcionado suficientemente bien (ver apartado 5.8.7). El modelo incremental de gravedad representará las variaciones en las pautas de viaje que resultan de modificar los costes de viaje, las generaciones y atracciones.

12.4. 12.4.1.

ESTIMACIÓN DE MODELOS A PARTIR DE AFOROS DE TRÁFICO Introducción

Los métodos convencionales de adquisición de información origen-destino, por ejemplo, encuestas domiciliarias o encuestas pantalla son costosas, engorrosas y causan molestias a los usuarios. El problema es aún mayor en los países en desarrollo en los que los rápidos cambios en los usos del suelo y en la demografía acortan la “vida útil” de los datos. La necesidad de desarrollar métodos de bajo coste para la estimación de matrices O-D actuales y futuras es evidente. Los aforos de tráfico pueden contemplarse como el resultado de combinar una matriz de viajes y unas pautas de elección de ruta. Como tales, ofrecen información directa sobre la suma de todos los pares O-D que utilizan los arcos aforados. Los aforos de tráfico son muy atractivos como fuente de datos ya que no son molestos para los viajeros, están generalmente disponibles, son relativamente baratos de llevar a cabo y su realización automática está bastante avanzada. La idea de estimar matrices de viajes o modelos de demanda a partir de aforos de tráfico, merece un serio análisis y se han desarrollado un cierto número de metodologías para ello. Considérese un área de estudio que se divide en N zonas interconectadas por una red viaria que consiste en un conjunto de arcos y nodos. La matriz de viajes para este área de estudio consta de N2 celdas, o (N2 – N) celdas si se pueden desechar los viajes intrazonales. La etapa más importante para la



Modelos simplificados de demanda de transporte

estimación de un modelo de demanda a partir de aforos es la identificación de los caminos seguidos por los viajes desde cada origen hasta cada destino. La variable pija se utiliza para definir la proporción de viajes que van desde la zona i a la zona j atravesando el arco a. De esta forma, el flujo (Va) en un arco concreto a, es la suma de todas las contribuciones de todos los viajes entre zonas a ese arco. Matemáticamente se puede expresar así:

Va  ¤ Tij pija , 0 b pija b 1 ij

(12.5)

La variable p puede obtenerse utilizando distintas técnicas de asignación que van desde una asignación simple todo-o-nada hasta una complicada asignación de equilibrio. A partir de todos los pija y de los aforos de tráfico observados (V̂ a), habrá un número N 2 de incógnitas Tij a estimar desde un conjunto de L ecuaciones lineales simultáneas (12.5), donde L es el número total de aforos de tráfico realizados. En principio, se necesita un total de N 2 aforos consistentes e independientes para determinar unívocamente la matriz de viajes T. En la práctica, el número de conteos de tráfico observados es mucho menor que el número de incógnitas Tij, por ello es imposible obtener una solución única al problema de la estimación de matrices. En general habrá más de una matriz de viajes que, al ser cargada en la red, reproduzca satisfactoriamente los aforos. Existen dos métodos básicos para resolver este problema: método estructurado y no estructurado. En el caso del método estructurado el modelizador restringe el espacio posible de soluciones para la matriz estimada, imponiendo una estructura particular que se obtiene habitualmente de un modelo de demanda de viajes existente, por ejemplo un modelo de gravedad o de demanda directa. El método no estructurado descansa en principios generales como el de máxima verosimilitud o maximización de la entropía para obtener el mínimo de información adicional requerida para la estimación de una matriz. Estos dos métodos generales se verán más adelante pero primero se ha de considerar la relación entre elección de ruta y estimación de modelos. a ij

12.4.2.

Elección de ruta y estimación de matrices

Robillard (1975) clasificó los métodos de asignación para la estimación de matrices de viaje a partir de aforos en dos grandes grupos: asignación proporcional y no proporcional. Los métodos de asignación proporcional consideran que la

MODELOS

DE



TRANSPORTE

proporción de conductores que eligen cada ruta es independiente de los niveles de demanda. El ejemplo más común es la asignación todo-o-nada, y en este caso pija se define como: «1 si los usuarios desde i a j utilizan el arco a pija ¬ ­0 en otro caso

Los métodos de asignación estocástica puros, como los de Burell y Dial, también entran en este grupo pero en estos casos pija puede asimismo tomar valores intermedios entre 0 y 1. Las técnicas de asignación no proporcional tienen en cuenta explícitamente los efectos de la congestión y, por tanto, la proporción de viajeros que utilizan cada arco depende de los flujos en los mismos. Los métodos de asignación en equilibrio y estocástica en equilibrio son miembros de este grupo. Se considera que las técnicas de asignación no proporcional son más realistas para condiciones de congestión. Sin embargo, la ventaja de los métodos de asignación proporcional es que permiten la separación de los problemas de elección de ruta y de estimación de matrices. Se puede suponer que la proporción de viajes que utilizan cada arco pija es independiente de la matriz de viajes que se va a estimar. Por el contrario, la elección de ruta no proporcional requiere la estimación conjunta o iterativa de la elección de ruta y de las matrices de viaje para que ambas sean consistentes. En lo que resta de capítulo se supondrá que los métodos de asignación proporcional son una aproximación razonable a la elección de ruta. Más adelante se señalan las extensiones necesarias para abordar los métodos no proporcionales.

12.4.3.

Estimación de modelos de transporte a partir de aforos

El calibrado de modelos gravitacionales fue uno de los primeros métodos aplicados en la estimación de matrices de viaje a partir de aforos de tráfico. La idea básica es plantear una forma particular del modelo de gravedad y examinar lo que ocurre cuando se asigna a la red. Por ejemplo, en el caso de viajes interurbanos la matriz de viajes podría ser:

Tij 

 PP i j d ij2



Modelos simplificados de demanda de transporte

donde Pj es la población del área urbana j, dij es la distancia entre ambas áreas y α es una constante de calibración, en este caso la única. Si una matriz de este tipo se asigna a la red, se obtiene:

Va  ¤ ij

pija PP i j (d ij ) 2

¤ ij

pija PP i j

(12.6)

(d ij ) 2

Obsérvese que en la expresión derecha de esta ecuación la única incógnita es α. Las otras variables se obtienen de datos externos o de un modelo de elección de ruta. Se puede generalizar algo más este modelo e incluir otros factores de generación/atracción de viajes tales como empleo, producción industrial, superficie comercial, etc. Si se escribe la parte de gravedad del modelo como:

Gij 

Oi D j d ij2

y se permiten k motivos de viaje (o varios tipos de productos si se trata de transporte de mercancías), se puede escribir:

Va  ¤ ¤ pija k Oik D kj / (d ij ) 2  ¤  k ¤ pija Gijk k

ij

k

ij

(12.7)

En este caso hay αk parámetros de calibrado, pero se supone una vez más que el resto de los datos están disponibles. Es relativamente simple observar que las αk pueden estimarse utilizando técnicas de mínimos cuadrados. En este caso se postula que Va' = Va + εa donde εa es un término de error. Si se efectúa cambio de variable, como por ejemplo:

X k  ¤ pija Gijk ij

Se puede escribir:

Vaa   0 ¤  k X k k

(12.8)

donde α0 es el término independiente, que se puede considerar como la parte del flujo no representada por el modelo de gravedad, por ejemplo tráfico local o intrazonal. Este tipo de metodología fue utilizada por los primeros investigadores en este área, Low (1972) para áreas urbanas y Holm et al. (1976) para la planificación de redes interurbanas en Dinamarca.

MODELOS

DE



TRANSPORTE

La ecuación (12.7) tiene una deficiencia obvia. Si un Oi y un Dj específicos doblasen su valor absoluto, entonces el número de viajes entre estas dos zonas se cuadriplicaría cuando obviamente sería más probable que también se duplicase. Para mejorar este hecho, se puede utilizar el siguiente modelo convencional:

Tij  ¤ ¨ªA k Oik D kj Aik B kj f ijk ·¹

(12.9)

k

donde: αk es un parámetro de escala que permite utilizar diferentes unidades de Tij y Oik, Djk. Aik y Bjk son los factores de balanceo que, como se sabe, se expresan por:

Aik 

1 ¤ ( B j D kj fijk ) k

j

B kj 

1 ¤ ( Ai Oik fijk ) k

i

con f ijk como función de resistencia al viaje, por ejemplo, exp (– βk Cij). La estimación de este modelo más convencional a partir de los aforos de tráfico representa un gran esfuerzo ya que los parámetros de calibrado son ahora Aik , Bjk , βk y αk. Esto induce a buscar métodos de calibración alternativos, por ejemplo regresión no lineal, como la utilizada por Högberg (1976) o Robillard (1975). Tamin y Willumsen (1989) generalizaron este método siguiendo las sugerencias de Wills (1986) para combinar en un único modelo las características de los modelos de gravedad y de oportunidades de intervención (OP). Wills ha propuesto un modelo flexible gravedad-oportunidad (GO) para distribución de viajes en el cual las formas estándar de los modelos de gravedad y de oportunidad se obtienen como casos especiales. La elección entre las metodologías de gravedad y de oportunidad se decide empíricamente permitiendo la estimación de los parámetros que controlan la forma funcional global del mecanismo de la distribución de viajes. Se puede definir una transformación δdji tal que δdji sea igual a 1 si el destino j está en la désima posición en orden ascendente de distancia desde i, y cero en



Modelos simplificados de demanda de transporte

el resto de los casos, de forma que la matriz de viajes ordenada (por oportunidades) pueda obtenerse de la siguiente transformación:

Z id  ¤ ¨ªDidjTij ·¹

(12.10)

j

Mientras que la transformación de ordenación δdji produce una matriz de viajes ordenada, su inversa (δdji ) –1 permite recobrar la matriz de viajes observada mediante:

Tij  ¤ ¨ª(Didj ) 1 Z id ·¹

(12.11)

d

Debe observarse que esta clase de transformación es aplicable a cualquier variable basada en la matriz O-D, en particular a la matriz de coste y al factor de proporcionalidad, además de a la matriz de viajes. Se puede definir también una transformación directa Box-Cox sobre la variable “y”, tal como en (8.2), así:

«(y -1)/  x 0 y ¬  =0 ­log y y una transformación Box-Cox inversa como:

«(y +1)1/  x 0 y (1/ ) ¬  =0 ­exp y Ambas transformaciones pueden combinarse en una nueva función que se presenta como una combinación convexa en μ.

y ( ,  )   y ( ) (1  ) y (1/ ) ,

0 b  b1

(12.12)

El modelo propuesto puede finalmente escribirse como:

Tij  ¤ ¨ª k Oik D kj Aik B kj f ijk ·¹

(12.13)

f ijk  ¤ ¨ª( dji ) 1 Fidk ·¹

(12.14)

k

donde: d

MODELOS

DE



TRANSPORTE

¥ d ´ F  ¦ ¤U ipk µ § p ¶

( ,  )

k id

¥ d 1 ´

¦ ¤U ipk µ § p ¶

( ,  )

(12.15)

U ipk  exp ¨ª(1  ) m logDpki  m Cip ·¹

(12.16)

Ddki  ¤ ¨ªDidj D kj ·¹

(12.17)

y j

A partir de esta forma general se pueden obtener varios casos especiales, asignando valores particulares a τ y μ. Se pueden identificar tres casos extremos que generan modelos específicos: el de gravedad (GR), el logarítmico de oportunidad puro (LO) y el exponencial de oportunidad puro (EO). Tamin y Willumsen (1989) desarrollaron tres métodos de estimación para calibrar la forma general a partir de aforos: mínimos cuadrados no lineales (MCNL), mínimos cuadrados no lineales ponderados (MCNLP) y máxima verosimilitud (MV). El modelo general fue comprobado para transporte de mercancías en Bali, Indonesia (Tamin y Willumsen n 11988) y para transporte de viajeros en Ripon, Reino Unido (Tamin y Willumsen, 1989). En ambos casos se contaba con un conjunto de conteos y con una matriz observada obtenida por otros métodos independientes. En el caso de tráfico de mercancías, aunque los aforos de tráfico no estaban clasificados por tipo de camión, fue posible discriminar hasta nueve tipos diferentes de productos, uno de ellos camiones sin carga. Se necesitan datos de aproximación para los valores de Ojk y Djk , por ejemplo los niveles de producción de ciertas mercancías. El parámetro αk juega el doble papel de convertir estas aproximaciones primero en toneladas y después en camiones. Las principales conclusiones de esta investigación fueron: • Los modelos GO y OP son más costosos que los modelos GR, ya que requieren fórmulas más complejas y procedimientos que llevan más tiempo resolver. • Un buen ajuste en base a aforos de tráfico también produce un buen ajuste de la matriz de viajes. • Para la estimación de los pija se utilizó la asignación todo o nada y la estocástica de Burrell; sin embargo, el ajuste obtenido no mejoró al incorporarse el efecto estocástico como podría esperarse.



Modelos simplificados de demanda de transporte

• Aunque el GO fue el mejor modelo respecto al ajuste con los aforos de tráfico observados, no puede garantizarse que produzca también el mejor ajuste a una matriz de viajes observada independientemente. De hecho, el modelo que mejor ajusta a la matriz de viajes es el modelo de gravedad GR con el método MCNL y con asignación Burrell. Holm et al. (1976) han ampliado la metodología del modelo de gravedad para incluir algunas características de la asignación en equilibrio. Utilizaron una carga iterativa con ϕ = 1 / n (ver el apartado 10.5.4) para obtener la proporción de viajes que utilizan cada arco. Sin embargo este enfoque es heurístico, ya que bajo condiciones estrictas de equilibrio, por lo general, las proporciones no son únicas. Otros modelos, como los de demanda directa, también se pueden utilizar en este método de estimación. Una ventaja de este método es que una vez calibrado el modelo de demanda, puede utilizarse también para la prognosis suponiendo que los valores futuros de parámetros como Oi y Dj estén disponibles o sean de fácil estimación.

12.4.4.

Estimación de matrices a partir de aforos de tráfico

Las técnicas de maximización de entropía y minimización de la información han sido utilizadas como herramientas en la construcción de modelos para la planificación del transporte urbano y regional durante muchos años, especialmente después de los trabajos desarrollados por Wilson (1970). En el Capítulo 5 se ha presentado la generación de un modelo de gravedad convencional a partir de una formulación de maximización de la entropía. En este contexto, la maximización de la entropía produce una matriz de viajes sencilla y poco sesgada que es consistente con la información disponible, información que se representa mediante restricciones a un problema de maximización (de una función entrópica). En el caso del modelo de gravedad, las restricciones representan información sobre viajes totales zonales y costes totales. Esta idea fue utilizada por Willumsen (1978) para obtener un modelo que estima matrices de viaje a partir de aforos de tráfico. El problema puede formularse como: Maximizar S (Tij )  ¤ (Tij logTij Tij ) ij

(12.18)

MODELOS

DE

sujeto a:



TRANSPORTE

V̂ a ¤ Tij pija  0

(12.19)

ij

para cada arco a con aforo, y Tij ≥ 0 Las restricciones (12.19) reemplazan a las restricciones de totales zonales (de destino de viaje) y de los costes del modelo de gravedad. El uso del método de Lagrange permite encontrar la solución formal a este problema como: pa

Tij  exp¤ (  a pija )  ” X a ij a

(12.20)

a

donde τa son los multiplicadores Lagrangianos correspondientes a las restricciones (aforos), y:

X a  exp (  a ) La disponibilidad de un matriz antigua o simplemente una matriz estimada (o acotada) de un estudio previo puede proporcionar alguna ventaja. Denominando t a esta matriz, llamada a veces “matriz de referencia”, la función objetivo expandida es: Maximizar S1  (Tij / tij )  ¤ (Tij log Tij / tij Tij tij )

(12.21)

ij

sujeta a las mismas restricciones (12.19) y a la no negatividad. Esta función objetivo es, desde luego, convexa y el término constante tij, puede eliminarse efectuando la derivada del modelo. Utilizando la misma metodología y el mismo cambio de variables, puede comprobarse que la solución formal es: pa

Tij  tij exp¤ (  a pija )  tij ” X a ij a

(12.22)

a

Ejemplo 12.3: sea la red simple esquematizada en la figura 12.1. Esta red tiene dos orígenes (1 y 2) y dos destinos (3 y 4). En ella pueden verse los flujos de todos los arcos. También puede observarse que solamente hay seis matrices de viajes (enteras) que pueden reproducir los flujos observados, como se muestra a continuación.



Modelos simplificados de demanda de transporte

Matriz

Primera

Segunda

Tercera

Cuarta

Quinta

3

4

3

4

3

4

3

4

3

4

3

4

8

0

7

1

6

2

5

3

4

4

3

5

2

2

5

3

4

4

3

5

2

6

1

7

0

S (Tij)

–11,07

–7,46

–5,98

–5,78

–6,84

–9,96

S1 (Tij / tij)

–5,79

–3,69

–3,7

–5,07

–7,22

–12,2

i 1

j

Sexta

La formulación de maximización de la entropía intenta identificar la matriz de viajes más probable que sea consistente con la información disponible, en este caso cinco aforos de tráfico. El lector puede verificar que sólo tres de estos aforos son independientes (ver apartado 12.4.5). Por lo tanto el problema no está especificado. Los valores de la función objetivo S(Tij) se muestran también en esta tabla. A partir de los mismos, la matriz de viajes más probable sería la cuarta, (5, 3, 5, 2), ya que tiene un valor máximo de la entropía. Si se dispone de una matriz de partida, entonces se utilizaría una segunda función objetivo (12.21). 3

3 8

10 5

7 2

15

6 5 4

Figura 12.1. Red simple con aforos de tráfico.

Supóngase que se dispone de la matriz de partida (3, 2, 1, 3). Los nuevos valores de la función de entropía también se señalan en la tabla. La matriz de viajes más probable en estas circunstancias sería la segunda (7, 1, 3, 4). En la mayoría de los problemas prácticos no se pueden calcular directamente los valores de la entropía de todas las matrices posibles. Obsérvese por ejemplo, que la reducción del número de aforos incrementa el número de matrices posibles. Más importante, flujos del orden de cientos o miles incrementan enormemente el número de posibles matrices enteras de viajes. Lo que se necesita es un método de solución que no requiera la enumeración de matrices posibles.

MODELOS

DE



TRANSPORTE

Existen varios posibles métodos para resolver el modelo (12.22). El más ampliamente utilizado es el multiproporcional. Este método, en esencia, es una extensión de los métodos biproporcionales y triproporcionales señalados en el Capítulo 5. En este caso en vez de balancear la matriz de viajes tratando de hacer el ajuste a los totales zonales (y totales de coste en el caso del método triproporcional), se llevan a cabo correcciones sucesivas de la matriz de partida para reproducir los aforos observados. Hay un factor de corrección Xa para cada aforo de tráfico y su cálculo requiere la estimación iterativa de los mismos hasta que los flujos observados en cada arco se reproduzcan dentro de una tolerancia aceptable. Si no se dispone de una matriz de partida se puede tomar t como la matriz unidad. En efecto, una formulación de maximización de la entropía puede considerarse que genera como la matriz de viajes más probable aquella que tiene el mismo número de viajes en cada celda, a menos que las restricciones indiquen otra cosa. En otras palabras, la maximización de la entropía es equivalente a minimizar la diferencia entre una matriz de referencia uniforme y la matriz estimada. El análisis detallado del modelo de estimación de matrices mediante maximización de la entropía (ME2) y el de métodos derivados de éste, basados en los principios de minimización de la información, se desarrolló por Van Zuylen y Willumsen (1980). Ambos modelos son prácticamente equivalentes y comparten la mayoría de sus propiedades. El modelo ME2 reproduce las observaciones Va' dentro de una tolerancia dada siempre que las restricciones definan un espacio razonable, es decir, las ecuaciones (12.19) deben tener al menos una solución con una Tij no negativa. Una condición adicional para la matriz de partida t se señala más adelante. Puede demostrarse quee minimizar el e negativo de la función objetivo (12.21) es aproximadamente equivalente a minimizar la función:

S 2 (Tij / tij ) 

0, 5(Tij tij ) 2 Tij

(12.23)

Ésta es una medida tipo del error de la diferencia entre los valores de tij y Tij. En efecto, el negativo de S1(Tij / tij) es también una medida natural de la diferencia entre los valores de las celdas. Es cero cuando tij = Tij y se incrementa positivamente según aumenta la diferencia. La matriz estimada es aquella que más se asemeja a la matriz de partida y que al cargarse a la red reproduce los aforos de tráfico.



Modelos simplificados de demanda de transporte

El modelo puede recibir otras fuentes de datos siempre que sea posible introducirlas como restricciones lineales. Un ejemplo de este tipo puede ser la información sobre la distribución de la longitud de viajes (LDV) que se espera exista en el área de estudio. Cabe la posibilidad de expresar este tipo de información como restricciones equivalentes a los rangos de coste, como se vio en el Capítulo 5; por ejemplo:

1 ¤ Tij Dijk  Pk T ij

(12.24)

donde T es el número total de viajes, Pk es la proporción de viajes en k rangos de coste (longitud), δijk es 1 si los viajes entre i y j tienen su coste en el rango k y cero en el resto de los casos. Los sistemas de transporte público con un sistema tarifario zonal o basado en otra variable permiten la introducción de restricciones de este tipo para la estimación de las matrices de viajes utilizando conteos de pasajeros y datos de venta de billetes (de Cea y Cruz, 1986). Además el problema matemático puede escribirse también como una combinación de restricciones de igualdad y desigualdad mejorando la aplicación de este tipo de métodos. Por ejemplo, el planificador puede saber que la capacidad de un arco es Qa pero no dispone de un aforo del mismo o que dada la capacidad disponible de un aparcamiento no pueden dirigirse un número mayor de Dj' viajes. Este tipo de información puede incorporarse como restricciones de desigualdad, por ejemplo:

¤T p ij

a ij

b Qa para algún arco a

(12.25)

b Daj para algún destino j

(12.26)

ij

¤T

ij

i

La solución a este programa es también un modelo multiplicativo; Lamond y Stewart (1981) han demostrado cómo se puede aplicar el algoritmo multiproporcional para el uso de restricciones de desigualdad; de aquí que se pueda aplicar el mismo método de resolución para este modelo expandido. Una de las características del modelo ME2 (extendido) es su naturaleza multiplicativa. Esto significa que si una celda de la matriz de referencia es cero, será también cero en la matriz solución, lo que podría causar algún problema si la celda de la matriz de referencia fuera cero al azar (p. ej., debido a la tasa de muestreo adoptada en el estudio) en vez de representar un par O-D sin ningún viaje. Una solución pragmática a este problema para matrices de partida poco densas es “alimentar” las celdas vacías con un valor muy pequeño, por ejemplo 0,5 viajes.

MODELOS

DE



TRANSPORTE

Las restricciones mediante un algoritmo multiproporcional o cualquier otro asegurarán que algunos de estos viajes “crezcan” a uno o más viajes completos mientras que otros acabarán con valor nulo. Ejemplo 12.4: sea la misma red que en el ejemplo 12.3 pero supóngase ahora que sólo se tienen dos aforos en los arcos 5-6 y en el 2-5 (15 y 7 respectivamente). La siguiente tabla 12.1 muestra la aplicación del algoritmo multiproporcional a este problema. En la tabla se señala en primer lugar la solución completa para el caso de una matriz de partida uniforme. Caso A. Tabla 12.1.

Solución multiproporcional para dos conteos de tráfico Aforo

A

B

C

D

Matriz inicial Iteración 1 Iteración 2 Iteración 3 Iteración 4 Iteración 5 Matriz inicial Iteración 5 Matriz inicial

15 7 15 7 15 7 15 7 15 7 15 7

Flujo modelizado

4 7,5 14,5 7,24 14,76 7,11 14,89 7,05 14,95 7,03 15,03 6,98

Ratio

3,75 0,933 1,034 0,967 1,016 0,984 1,008 0,992 1,004 0,996 0,998 1,002

Iteración

15

15,06

0,996

6 Matriz inicial Iteración 6

7

6,97

1,004

15 7

15,04 6,98

0,998 1,002

Viajes por par O-D 1-3

1-4

2-3

2-4

1 3,75

1 3,75

3,88

3,88

3,94

3,94

3,97

3,97

3,99

3,99

3 4,81

2 3,21

3

2

1 3,75 3,5 3,62 3,5 3,56 3,5 3,53 3,5 3,51 3,5 1 1,75 1,75 0

1 3,8 3,5 3,6 3,5 3,6 3,5 3,5 3,5 3,5 3,5 3 5,2 5,3 3

4,82

3,21

0

7

2 3,21

0 0,5 1 1

7 3 6 6

3 4,81



Modelos simplificados de demanda de transporte

Como se puede ver, solamente se realizan cinco iteraciones para llegar a una convergencia del 5% de tolerancia. La solución {3,99; 3,99; 3,5; 3,5} no coincide con la solución de maximización de la entropía del ejemplo 12.3 porque el número de aforos no es el mismo. El Caso B resuelve el problema con una matriz de partida {3; 2; 1; 3} y de nuevo con sólo cinco iteraciones se llega a una convergencia satisfactoria. La solución {4,81; 3,21; 1,75; 5,25} es diferente, demostrándose así cómo puede usarse la información de una matriz de viajes antigua para la actualización de matrices. Respecto a matrices antiguas siempre hay alguna información que se puede utilizar. El caso C ilustra lo que ocurre cuando hay un cero en la matriz de partida. Existe una solución pero el cero se conserva. Finalmente el caso D muestra el efecto de “alimentar” el cero de la matriz de partida con 0,5. La solución esta vez {4,81; 3,21; 1,0; 6,0} afecta sólo a viajes que en origen contenían cero. Tabla 12.2.

Solución multiproporcional para tres conteos de tráfico Aforo

A

B

C

Flujo modelizado

Ratio

Matriz inicial

Viajes por par O-D 1-3

1-4

2-3

2-4

1

1

1

1

3,75

3,75

3,75

3,75

3,5

3,5

Iteración

15

4

3,75

1

7

7,5

0,933

10

7,25

1,379

5,17

Iteración

15

15,05

0,997

5,32

10

7

7

1

10

9,97

1,003

Matriz inicial Iteración

15

15,11

0,992

14

7

6,97

1,004

10

9,94

1,006

Matriz inicial Iteración

15

17,15

0,875

20

7

6,12

1,143

10

8,75

1,143

4,83 2,68

5,33

4,65

2,35

4,65

2,35

4,67

3

2

1

3

6,51

1,51

3,41

3,56

3,42

3,58

6,55

3,45

3

2

0

3

8,75

0,13

0

6,12

0

7

10

0

MODELOS

DE



TRANSPORTE

Tabla 12.2. Solución multiproporcional para tres conteos de tráfico (cont.) Aforo

D

Flujo modelizado

Ratio

Matriz inicial Iteración

15

15,1

0,994

19

7

6,97

1,004

10

9,95

1,005

Viajes por par O-D 1-3

1-4

2-3

2-4

3

2

0,5

3

6,98

1,05

7,01

2,96

4,01

2,97

4,03

2,99

Sea ahora el efecto de incrementar el número de aforos a tres, incluyendo el arco 6-3. Los resultados correspondientes se indican en la tabla 12.2. Obsérvese que el número de iteraciones necesarias se ha incrementado. Este número depende no tanto del número real de aforos utilizado sino de cómo estos aforos pueden eliminar las holguras de la matriz. En este caso se eliminan mediante estos aforos tres de los cuatro grados de libertad. La solución en el caso A {5,33; 2,68; 4,67; 2,35} es la que maximiza S (Tij) y si se redondea a valores enteros coincide con la solución del ejemplo 12.3. La solución para el caso B {6.55; 1,51; 3,45; 3,58} tiene las mismas propiedades respecto a S1(Tij). El caso C es interesante porque demuestra que en esta ocasión la introducción de un cero en la matriz de partida hace que el algoritmo no converja ni siquiera después de 20 iteraciones. El lector puede verificar que el forzar la celda 2-3 a cero hace que el problema no tenga solución: hay siete viajes que salen del nodo 2 pero solamente cinco pueden alcanzar su destino. El caso D ilustra el efecto de alimentar la celda vacía con 0,5 viajes. El algoritmo converge ahora a una solución razonable.

12.4.5.

Aforos de tráfico y estimación de matrices

Llegados a este punto, se puede preguntar si cualquier conjunto de aforos es apropiado para la estimación de una matriz de viajes. Por ejemplo, ¿es posible que ciertas combinaciones de aforos hagan imposible la estimación de una matriz que los satisfaga? Estos problemas serán tratados desde el punto de vista de independencia e inconsistencia de los aforos de tráfico. 12.4.5.1.

Independencia

No todos los aforos contienen la misma cantidad de “información”. Por ejemplo, en la figura 12.2 el tráfico del arco c está constituido por la suma de los



Modelos simplificados de demanda de transporte

tráficos de los arcos a y b. Realizar un aforo en el arco c es redundante y se puede decir que en este caso sólo dos aforos son independientes. Siempre que se pueda plantear una ecuación de continuidad de flujo del tipo “flujos entrantes” a un nodo igual a “flujos salientes” del nodo, sus aforos serán linealmente dependientes. En este caso siempre se puede describir un flujo como una combinación lineal del resto. Obsérvese que un conector de centroide asociado al nodo 5 eliminaría la dependencia en la figura 12.2. Vˆ a = 70 Vˆ c = 150 5 Vˆ b = 80

Figura 12.2. Aforos dependientes.

12.4.5.2.

Inconsistencia

Errores de aforo y el hecho de que a menudo los aforos se obtienen en momentos diferentes (horas, días, semanas) conducen a inconsistencias en las medidas de los flujos. En otras palabras, no se cumplirán las relaciones de continuidad en los flujos. Si el aforo Vc de la figura 12.2 fuera 160 en vez de 150, las ecuaciones correspondientes serían inconsistentes y ninguna matriz de viajes podría reproducir estos flujos. Una forma de reducir este problema es introducir un término de error en las ecuaciones o eliminar las inconsistencias de antemano. Se pueden también identificar dos causas de inconsistencia en los flujos; la primera es simplemente el hecho de que los errores en los aforos pueden llevar a situaciones en las que el “flujo total hacia” un nodo no sea igual al “flujo total desde” el mismo nodo, no cumpliéndose de esta manera las condiciones de continuidad en los flujos. La segunda causa es el desajuste entre el modelo de asignación de tráfico utilizado y los flujos observados. Por ejemplo, un modelo de asignación puede no asociar viajes a un arco que tiene un flujo observado (aunque éste puede ser pequeño). En estas condiciones no habrá

MODELOS

DE



TRANSPORTE

ninguna matriz de viajes capaz de reproducir los flujos observados utilizando el modelo de elección de itinerario. Ejemplo 12.5: es útil distinguir entre estos dos tipos de inconsistencias, la primera a nivel de flujo y la segunda a nivel de itinerario. Supóngase que se tienen observaciones del flujo en cuatro arcos (identificados por los pares de nodos que los delimitan) y que se pretende encontrar las matrices no negativas que satisfagan estos flujos y un modelo de elección de itinerario como se señala en la figura 12.3. Sea primero el caso en el que el aforo x tiene un valor de 8, haciendo así que el flujo total hacia el nodo 6 sea igual a 15 y el flujo desde este nodo igual a 16. (a)

A

5

6

1

B

Figura 12.3.

3

(b)

5

A

3

10

1

8

6 2

C

6

x

C

3 6

4

2 D

B

4 D

Un ejemplo de inconsistencias de itinerarios con aforos: (a) red e intensidades, (b) elecciones de ruta supuestas.

Estos aforos son inconsistentes quizás porque fueron tomados en días diferentes o simplemente por un error de aforo. Se puede eliminar esta inconsistencia incrementando arbitrariamente los flujos en los arcos (1, 6) o (2, 6) en un viaje o reduciendo los flujos de los arcos (6, 3) o (6, 4) en un viaje. Se puede ser algo más sistemático y realizar los ajustes necesarios para conservar las condiciones de continuidad de los flujos. Por ejemplo, si lo que se desea es minimizar la suma de los cuadrados de los incrementos/reducciones, el cambio óptimo sería 0,25 viajes en cada arco. Un método alternativo es buscar una solución de máxima verosimilitud a este problema como señalaron Van Zuylen y Willumsen (1980). Esta solución supone que las intensidades de los arcos tienen una distribución Poisson y que las observaciones disponibles son muestras de esta distribución. Se utiliza la máxima verosimilitud para generar un modelo que produzca estimaciones me-



Modelos simplificados de demanda de transporte

joradas y consistentes de los flujos. Por otra parte, el calibrado del modelo a partir de aforos como se señaló en el apartado anterior, acepta que haya errores en los flujos observados. Estos métodos no están limitados, por tanto, por los problemas de independencia y consistencia. Sea ahora el caso en el que el aforo x sea 7. Puede verse que las condiciones de continuidad de flujo se cumplen en este caso. Sin embargo, la asignación supuesta señalada en la figura 12.3b es incompatible con los flujos mostrados en la figura 12.3a. Ninguna matriz de viajes puede reproducir el aforo de 8 en el arco (6, 3) porque el único camino que lo utiliza, B-C está limitado a un máximo de 5 por el arco (2, 6). El conjunto de ecuaciones lineales que corresponden a este ejemplo viene dado por: arco (1, 5)

TAC

=6

(12.27)

arco (5, 3)

TAC

=6

(12.28)

arco (1, 6)

TAD

= 10

(12.29)

arco (2, 6)

TBC + TBD

=5

(12.30)

arco (6, 3)

TBC

=8

(12.31)

arco (6, 4)

TAD + TBD

=7

(12.32)

Claramente las ecuaciones (12.30) y (12.31) son incompatibles con la no negatividad de TBC. Lo mismo ocurre con las ecuaciones (12.29) y (12.32), haciendo imposible resolver este conjunto de ecuaciones. En problemas tan simples como éste, las inconsistencias pueden detectarse mediante la observación directa pero en redes más complejas solamente se pueden identificar mediante operaciones de filas y columnas en las ecuaciones lineales. Para redes grandes estas operaciones no serán prácticas. En este ejemplo simple no es difícil ver que el problema se origina en el único itinerario supuesto entre A y C. Si se permitieran dos itinerarios, uno por el nodo 5 y otro por el nodo 6, se eliminaría la inconsistencia. Además, los valores de la variable resultante p6AC no podrían elegirse arbitrariamente. En efecto, una solución posible requiere: 0,2 ≤ p6AC ≤ 0,5 El hecho de que las condiciones de continuidad en los itinerarios no se cumplan, parece reflejar errores en la asignación, mientras que las disconti-

MODELOS

DE



TRANSPORTE

nuidades en los flujos son síntomas de errores en los aforos. Parece razonable desarrollar una técnica para eliminar las inconsistencias en los flujos de los aforos y así asegurar que se cumplen las condiciones de continuidad de los flujos. Por otra parte, un método razonable para tratar la falta de consistencia a nivel de itinerarios puede ser la adopción de un mejor modelo de asignación. En términos generales, la consistencia a nivel de flujos es una condición necesaria pero no suficiente para la consistencia de itinerarios. La condición de consistencia de itinerarios es, sin embargo, condición suficiente para la consistencia de los flujos. El lector interesado puede verificar que hay solamente siete matrices de viajes enteras diferentes que pueden satisfacer los flujos observados en el ejemplo anterior.

12.4.6.

Limitaciones del ME2

El programa ME2, debido a su simplicidad, eficiencia relativa y facilidad de programación, ha sido instalado y utilizado ampliamente, especialmente en el Reino Unido. El modelo tiene algunas limitaciones conocidas y merece la pena mencionarlas antes de señalar las oportunidades de mejora. Una de las limitaciones aparece cuando el tráfico ha crecido (o disminuido) fuertemente entre la matriz de viajes de referencia (o matriz antigua) y la actual. Esto puede ocasionar distorsiones, ya que el modelo estima la matriz más cercana a la de referencia de forma que, al cargarse a la red, reproduzca los aforos. En estos casos, es mejor probablemente considerar la estructura de la matriz de referencia, por ejemplo la proporción del total de viajes que aparecen en cada celda y no el número absoluto de viajes en cada par O-D. Se trataría entonces de encontrar la matriz con la estructura más parecida a la de la matriz de partida que reproduzca los aforos al ser asignada a la red. Esto puede tratarse en primer lugar mediante un factor de crecimiento global, por ejemplo:

¤V̂  ¤¤t p a

a

ij

a

a ij

(12.33)

ij

que se aplica a la matriz de partida antes de utilizar el modelo ME2. De esta forma la estructura de la matriz de partida se conserva lo más posible. La estimación anterior de τ es únicamente una aproximación. Para una metodología más rigurosa, ver Bell (1983).



Modelos simplificados de demanda de transporte

Una segunda limitación del ME2 es el hecho de que considera los aforos de tráfico como observaciones sin error sobre variables no estocásticas. En efecto, el modelo da completa credibilidad a los aforos, y utiliza la matriz de partida sólo para compensar el hecho de que los aforos no contienen suficiente información para la estimación. Sin embargo, esto puede no ser apropiado en la práctica. Para empezar, se debe tener en cuenta que los aforos no están libres de error. Además de los errores de conteo, existe el problema de las variaciones temporales (horarias, estacionales) como ya se ha citado anteriormente. Los aforos obtenidos en diferentes días o a diferentes horas difícilmente pueden considerarse observaciones sobre una variable no estocástica. Willumsen (1984) ha sugerido un método para compensar esta segunda dificultad. Parte de la idea de que las funciones del tipo {X log X / Y – X + Y} pueden tomarse como medidas útiles de la diferencia entre X e Y. A partir de aquí, se construye una función objetivo compuesta para satisfacer la siguiente expresión: Minimizar S3  ¤ (Tij log Tij / tij Tij Tij ) ¤ a (Va log Va / va Va va ) ij

(12.34)

a

donde: Va es el valor “real” del aforo de tráfico en a. va es el valor de una observación del flujo realizada en a. ϕa es un factor de ponderación que depende de la confianza depositada en la observación va. El uso del método de Lagrange conduce a la siguiente solución: pa

Tij  tij ” X a ij

(12.22)

Va  va X a1/a

(12.35)

a

Este modelo puede resolverse utilizando de nuevo el algoritmo multiproporcional, pero en este caso se necesita también corregir las observaciones para obtener una estimación mejor de los verdaderos valores de los flujos. Obsérvese que si ϕa es muy grande, es decir, si se asigna un peso alto a los aforos que se cree son muy precisos, Va tenderá hacia νa. En el límite con ϕa = ∞ se vuelve al modelo original en el que Va = va. Por otra parte, cuanto más pequeño sea ϕa más grande será la credibilidad dada a la matriz de partida t.

MODELOS

DE



TRANSPORTE

Se podría esperar que los pesos ϕa dependiesen de la variabilidad de las observaciones. Brenninger-Gothe et al. (1989) han examinado el modelo en detalle. Han demostrado que un valor natural para los pesos ϕa es la varianza (o desviación típica) asociada a las observaciones. Si estos datos no están disponibles pueden estimarse utilizando algunas hipótesis sobre la distribución de los términos de error. Estos autores han ampliado el modelo considerando pesos asociados tanto a la matriz de partida (μij) como a los aforos (ϕa). De esta forma, la nueva función objetivo se convierte en: Minimizar S3  ¤ ij (Tij log Tij / tij Tij tij ) ¤ a (Va log Va / va Va va ) ij

(12.36)

a

Las principales limitaciones del ME2 pueden reducirse utilizando métodos razonablemente simples. Sin embargo, otros autores han propuesto enfoques alternativos para resolver el problema de la estimación de matrices, algunos de los cuales parten de bases diferentes.

12.4.7.

Modelos mejorados de estimación de matrices

Bell (1983) ha formulado un modelo que trata de conservar la estructura de la matriz de partida, en el sentido descrito en el apartado anterior, añadiendo una nueva restricción y modificando de esta forma la formulación matemática así: Minimizar – S2 sujeto a:

V̂ a ¤ Tij pija  0 para cada conteo del arco a

(12.19)

  ¤ Tij / ¤ tij

(12.37)

ij

ij

ij

y Tij ≥ 0 Además de esto, Bell sugiere el uso del método de Newton-Raphson para resolver el modelo con una estimación iterativa de τ. Alternativamente se puede aceptar un valor inicial de τ, resolver el modelo estándar utilizando un método multiproporcional y posteriormente comprobar si es consistente con la ecuación (12.37). Se debe repetir el ciclo hasta que el valor de τ converja.



Modelos simplificados de demanda de transporte

La utilización del algoritmo de Newton-Raphson ofrece ventajas en términos de tiempo de cálculo y es también útil para conocer el efecto de los errores en los aforos sobre la matriz de viajes estimada (Bell, 1983). Este tipo de análisis de sensibilidad es alternativo al tratamiento de los errores de los aforos mencionado anteriormente. Sin embargo, el método de Newton-Raphson requiere una gran cantidad de memoria y por ello está restringido a redes de tamaño medio. Una variante a la función objetivo estándar (S1) es linealizarla utilizando el desarrollo en serie de Taylor, o construir una formulación de mínimos cuadrados generalizada. En ambos casos se trata también de minimizar la diferencia entre las matrices de partida y estimada, sujetas a la misma restricción (12.19). Bell (1984) sugirió la solución de expansión de series de Taylor, mientras que McNeil y Hendrickson (1985) y Cascetta (1984) han desarrollado versiones en las que se utilizan métodos de mínimos cuadrados generalizados. Un problema es que bajo determinadas circunstancias estos modelos producen celdas negativas en la matriz de viajes estimada, especialmente cuando la matriz de referencia tiene originalmente valores pequeños. Éste no es un caso poco frecuente y por tanto esta característica del método lo hace poco deseable. Maher (1983) ha propuesto el empleo de un método bayesiano al problema de la estimación de la matriz de viajes que en su forma funcional es equivalente al método de los mínimos cuadrados generalizados. Se actualiza una estimación inicial de la matriz de viajes a partir de los aforos. Se supone que ambos son variables con distribución normal multivariada con covarianzas conocidas. Spiess (1987) ha desarrollado un modelo de máxima verosimilitud para la resolución de este problema. Considera una formulación específica donde para cada par O-D se obtiene tij mediante un proceso independiente de Poisson de media ΩijTij. Esto se corresponde con el problema de tomar una muestra de una matriz de viajes existente con una tasa de muestreo de Ωij < 1. La probabilidad de observar tij es: tij

Prob ¨ª Poisson (7ijTij )  tij ·¹   7ijTij exp ( 7ijTij ) / tij !

(12.38)

La probabilidad conjunta de observar la matriz de la muestra {tij} es por lo tanto: tij

Prob ¨ª[tij ]·¹  ” Prob ¨ªtij ·¹  ”  7ijTij exp ( 7ijTij ) / tij ! ij

ij

(12.39)

MODELOS

DE



TRANSPORTE

La aplicación de las técnicas de máxima verosimilitud a este problema requiere encontrar la matriz {Tij*} que satisfaga las restricciones y ofrezca la máxima probabilidad (12.39) de observar {tij}. Tomando logaritmos en la ecuación (12.39) y adoptando la convención habitual de que 0 log 0 = 0, se puede formular el modelo de máxima verosimilitud como:

Max ¤ ij (tij log (7ijTij ) 7ijTij log tij !)

(12.40)

sujeto a las restricciones habituales de no negatividad y a la ecuación (12.19). Separando el logaritmo en sumas y prescindiendo de las constantes, se puede reescribir la ecuación (12.40) como:

Min¤ ij (7ijTij tij log Tij )

(12.41)

Esta función objetivo es convexa en Tij; si el conjunto de constantes es consistente y los flujos son admisibles se asegura la existencia de una solución óptima. Esta solución puede obtenerse mediante cualquier método estándar de resolución de problemas de programación convexa. Sin embargo, Spiess (1987) ha desarrollado un algoritmo que aprovecha algunas de las propiedades específicas de este problema. Para profundizar más en este tema y las posibilidades de su ampliación, ver Cascetta y Nguyen (1988) y Willumsen (1991).

12.4.8.

Tratamiento de la asignación no proporcional

El modelo ME2 examinado en los apartados anteriores se basa en la hipótesis de que se pueden obtener las proporciones de elección de ruta pija independientemente del proceso de estimación de matrices. En el momento en el que la congestión tiene importancia en la elección de ruta, esta hipótesis es cuestionable ya que dichas proporciones de elección de ruta y la matriz de viajes son interdependientes. El principal problema para incorporar el equilibrio de Wardrop en la estimación de la matriz de viajes es que ahora las proporciones de elección de ruta y la matriz de viajes que han de estimarse están relacionadas. Una forma de abordar este problema es adoptar un método iterativo: suponer un conjunto de proporciones de la elección de ruta pija, estimar una matriz T, cargarla a la red y obtener un nuevo conjunto de proporciones de elección de ruta; repetir



Modelos simplificados de demanda de transporte

el proceso hasta que dichas proporciones de elección de ruta y las matrices estimadas sean consistentes entre sí. Este esquema general puede desarrollarse de diferentes formas. Por ejemplo, en el software SATURN (Hall et al., 1980) las proporciones de elección de ruta se estiman utilizando el valor ϕ del algoritmo Frank-Wolfe en cada iteración (la combinación lineal óptima de los flujos acumulados y auxiliares. Ver apartado 11.2.2). En general es sabido que las rutas en condiciones de equilibrio no son únicas. Sin embargo, este método les supone únicos. Una aproximación o enfoque alternativo requiere replantear el problema inicial en términos de una matriz tridimensional (origen, destino, itinerario) de la siguiente manera: Maximizar S4  ¤ Tijr (log Tijr / tijr 1)

(12.42)

ijr

sujeto a:

¤T

ijr

Dijra V̂ a  0

(12.43)

ijr

y a:

Tijr ≥ 0

donde el índice r indica la ruta o camino elegido, δijra es 1 si el itinerario r entre i y j utiliza el arco a y cero en cualquier otro caso. Siempre se puede reconstruir la matriz O-D {Tij} por agregación de matrices de flujos {Tijr}. De nuevo, la solución a este problema es: Da

Tijr  tijr ” X a ijr

(12.44)

Tij  ¤ Tijr

(12.45)

a

y:

r

Los flujos de la matriz de partida pueden calcularse a partir de la matriz de viajes de partida como t ijr = t ij / Rij, donde Rij es el número de itinerarios entre i y j. En este caso, las rutas pueden tomar cualquier valor ya que no se suponen únicas. Se utiliza el algoritmo de Frank-Wolfe para la asignación en equilibrio, para identificar los caminos atractivos (los seleccionados en cada paso del todo o nada) pero no para definir proporciones estrictas de la matriz de viajes con ellos. Este esquema es heurístico y es recomendable un algoritmo para su resolución como el siguiente:

MODELOS

DE



TRANSPORTE

1. Asignar, utilizando métodos de asignación en equilibrio, una matriz {tij} del año base a la red y almacenar las rutas (árboles de caminos) correspondientes. Poner el contador del ciclo a 1. 2. Estimar una matriz de viajes {Tij}n para la iteración n, utilizando rutas independientes {δijra } y flujos observados {V̂ a }. 3. Asignar {Tij}n al equilibrio, guardando las rutas (árboles) utilizadas en el proceso. 4. Incrementar n en 1 y volver al paso 2 a menos que los cambios en las rutas {δijra } o en las matrices estimadas sean pequeños. Para una comprobación de este método y para una comparación con las técnicas de asignación proporcional en el caso de un conjunto de datos para Reading en el Reino Unido, ver Willumsen (1982). Un método más general ha sido desarrollado por Fisk (1988), método en el cual se combina la estimación de matrices por maximización de entropía con la asignación en equilibrio del usuario en una sola formulación matemática. Otro método similar ha sido propuesto por Oh (1989). Las necesidades informáticas de estos métodos son muy elevadas, reduciéndose así su valor práctico.

12.4.9.

Estimación de matrices de viaje y elección modal

La idea de ampliar este tipo de metodologías a la estimación de matrices y a la elección modal es muy atractiva. Considérese un modelo de elección de modo/destino con una única restricción con la siguiente forma logit:

Tij  Oi

S j ¤ k exp (¤ p  p X ijkp )

¤

d

S d ¤ k exp (¤ p  p X idkp )

(12.46)

donde la componente de elección modal del modelo viene dada por: k ij

P

¤  ¤

p

exp (¤ p  p X ijkp )

m

exp (¤ p  p X ijmp )

(12.47)

Tij son los viajes entre las zonas i y j, Oi es el número total de viajes que se originan en la zona i, Sj, una medida de la capacidad de atracción de la zona j, pijk la proporción de viajes que utilizan el modo k entre las zonas i y j, Xijkp la



Modelos simplificados de demanda de transporte

variable explicativa de orden p para el modo k (por ejemplo, tiempo de viaje en vehículo) y θ son los parámetros del modelo. Aunque los desarrollos que se presentan a continuación son para el caso logit multinominal más sencillo, pueden ampliarse fácilmente a la estimación simultánea de formas logit anidadas más generales (Ortúzar y Willumsen, 1991). 12.4.9.1.

Caso unimodal simple

Sea en primer lugar el caso de un único modo con un parámetro de escala μ a estimar, que multiplica a una variable de “coste generalizado” Xij. En este sencillo ejemplo, la ecuación (12.46) se reduce a:

Tij  Oi

S j exp (  X ij )

¤

d

S d exp (  X id )

(12.48)

Ahora, supóngase que se dispone de observaciones de flujos sobre un conjunto de arcos V̂ a y también que se conocen, del modelo de asignación, las proporciones pija para todos los arcos con flujos observados. En tal caso, se puede afirmar que la ecuación (12.19) se cumple y para estimar el valor de μ se puede, por ejemplo, intentar minimizar la siguiente función normalizada no lineal (generalizada) por mínimos cuadrados:

¨¥ ̂ · a ´ © ¦ Va ¤ Tij pij µ ¸ ij ¶¸ S  ¤ ©§ ¸ V̂ a a © © ¸ ª ¹

2

(12.49)

Para hallar el mínimo se necesita realizar la primera y segunda derivada de S respecto a μ. Estas derivadas se incluyen en Ortúzar y Willumsen (1991). Desafortunadamente, incluso en este caso tan sencillo, las derivadas son intratables por lo que puede ser difícil establecer una solución única a este problema. 12.4.9.2.

Actualización con repartos modales agregados

Sea la transferencia del modelo (12.46)-(12.47) estimado con parámetros θ a otro contexto. Se ignoran las constantes específicas de cada modo, ya que éstas aseguran la reproducción de los repartos modales agregados para ese contexto. Defínase la función de utilidad de transferencia como:

MODELOS

DE



TRANSPORTE

¥ ´ Vijk   ¦ ¤ p X ijkp µ M k § p ¶

(12.50)

donde Xijkp son los valores zonales de nivel de servicio y variables socioeconómicas en el nuevo contexto, μ y M son parámetros de escala en el sentido antes señalado y (K – 1) un conjunto de constantes específicas a estimar para cada modo; K es el número total de modos. En este caso se pueden encontrar estimadores de máxima verosimilitud para μ y M pero sólo es posible garantizar un óptimo único cuando se fija μ, es decir, cuando sólo se actualizan las constantes. 12.4.9.3.

Actualización con aforos de tráfico

Los principales problemas surgirían si interesase realizar combinaciones mixtas de modos y solamente se dispusiese de aforos para los modos “puros”. Por ejemplo, sea el caso de elección entre coche, autobús y metro y combinaciones de éste último con los dos primeros. Es obvio que incluso si se dispusiera de aforos separados para cada modo puro, incluirían observaciones correspondientes a los movimientos mixtos. Si se reduce el problema a una agregación modal y se está interesado en la estimación del parámetro de escala μ y de un conjunto de constantes para los modos puros, el problema puede resolverse utilizando una formulación de mínimos cuadrados generalizada similar a la indicada en (12.49), como quedó demostrado por Ortúzar y Willumsen (1991). 12.4.9.4.

Actualización con información combinada

Supóngase que se desea actualizar μ y M de (12.50) y hay disponibles observaciones de repartos modales agregados Pk y conjuntos de aforos de pasajeros observados V para cada modo en competencia. El problema puede formularse como de máxima verosimilitud o como de mínimos cuadrados generalizado. En el primer caso, se tendrán diferentes funciones a maximizar y por tanto diferentes condiciones de primer orden y óptimos, dependiendo de las hipótesis adoptadas sobre la distribución de los errores de aforo. Las hipótesis más habituales han sido las de distribución multinomial, distribución Poisson independiente y Normal independiente (ver Tamin y Willumsen, 1992). Como se puede suponer que los datos de aforos son independientes de los datos de los repartos modales agregados, la función del logaritmo de la verosimilitud toma



Modelos simplificados de demanda de transporte

la forma de suma de dos expresiones. Si se supone que los aforos no tienen errores, resulta un caso final que requiere maximizar una función mucho más sencilla sujeta a (12.19). Hay expresiones para cada uno de estos dos casos en Ortúzar y Willumsen (1991). No existe garantía sin embargo, de que alguna de las dos conduzca a un óptimo único. La formulación de mínimos cuadrados tiene dos ventajas. La primera es que no se necesitan hipótesis de distribución del conjunto de datos. La segunda es la posibilidad de incorporar diferencias explícitas en la precisión de cada elemento del conjunto de datos antes de la estimación. La necesidad de normalización, que también es una característica de esta metodología, es aquí muy evidente dado el distinto orden de magnitud de las diferencias entre los valores observados y modelizados para ambos tipos de datos. Por ejemplo, la diferencia máxima en el caso de repartos modales es justamente 1, mientras que las diferencias en los datos de aforo pueden fácilmente elevarse a centenas o miles. El rango de metodologías disponibles en principio para resolver este importante problema es difícil de evaluar sin recurrir a la experimentación.

12.5. 12.5.1.

MODELOS MARGINALES Y DE CORREDOR Introducción

Se ha visto anteriormente cómo los enfoques convencionales de modelización requieren a menudo grandes cantidades de recursos (especialmente tiempo de cálculo y experiencia técnica), tienen una tasa de respuesta muy lenta y pueden no ser sensibles a algunas opciones de intervención política que necesiten analizarse así como que pueden estar basados en marcos teóricos poco potentes (ver por ejemplo, Supernak, 1983). Asimismo, en los capítulos anteriores se ha expuesto cómo evitar la mayor parte de los problemas más usuales al respecto. En este apartado se exploran algunas simplificaciones que pueden adoptarse para acelerar el tiempo de respuesta de los ejercicios de modelización. Los métodos simplificados expuestos en los apartados anteriores raramente satisfacen, por sí solos, todas las necesidades de un proyecto a gran escala o un cambio de política de transportes de importancia. La utilización de las técnicas de estimación de matrices de viaje a partir de aforos puede ser aceptable para situaciones en las que sea razonable una hipótesis de matriz fija, por ejemplo, en el diseño de esquemas de gestión de tráfico. Sin embargo, la adopción de

MODELOS

DE

TRANSPORTE



métodos de estimación de matrices a partir de aforos es todavía muy débil en términos de elección modal, la cual constituye un elemento importante en la mayor parte de los análisis de proyectos. Los métodos de planificación esquemática o simplificada ofrecen una respuesta rápida, pero con un riesgo más elevado en términos de imprecisión en el análisis. Es interesante explorar si estos enfoques pueden combinarse para utilizar sus ventajas y evitar sus carencias. La idea básica es adoptar una metodología que utilice modelos más sencillos como marco de modelización y que los modelos de última generación se apliquen selectivamente a los elementos de decisión más importantes. Las revistas técnicas dedican poco espacio a informar sistemáticamente sobre las simplificaciones que los planificadores y consultores adoptan en la práctica por necesidad (Leamer, 1978). A veces, algunos artículos ilustran mejor estos aspectos. Ver por ejemplo Ashley et al. (1985) y Clancy et al. (1985). El primer elemento en el desarrollo de métodos prácticos simplificados es reconocer que siempre hay algún contexto de planificación explícito o implícito que ofrece experiencia local y datos. Cómo utilizar estos dos elementos eficientemente debería ser siempre el primer paso. La buena asesoría a quienes toman decisiones bajo restricciones temporales, debe tratar aspectos como los siguientes: • ¿cómo simplificar o seleccionar los modelos de la mejor manera posible para que representen adecuadamente los impactos del proyecto a analizar? • ¿cómo hacer uso adecuado de los datos existentes y de la experiencia local? • ¿cómo aprovechar algunas de las características especiales del problema a tratar? • ¿cómo tratar con los inevitables sesgos que aparecen con las respuestas simplificadoras adoptadas en las preguntas anteriores?

12.5.2. Modelos de corredor En los estudios de corredores surge una oportunidad típica para simplificar las tareas de modelización sin comprometer demasiado el realismo. Los corredores son grupos simplificados de infraestructuras de transporte, básicamente lineales, que a veces combinan carreteras de alta capacidad y arterias con restricción de accesos, con servicios de ferrocarril y de autobús. La naturaleza lineal de estas infraestructuras puede ayudar a simplificar la modelización. Puede ser suficiente modelizar el corredor lineal y considerar únicamente los puntos de



Modelos simplificados de demanda de transporte

entrada y salida al mismo como orígenes y destinos. Es posible que exista un destino principal en un extremo del corredor (por ejemplo el CBD) o que se distribuyan a lo largo de toda su longitud. En cualquier caso los problemas de asignación serán siempre mínimos y el esfuerzo de modelización puede concentrarse en aspectos tales como la elección modal y, en algunos casos, la elección de destino. La información básica necesaria está constituida por los niveles actuales de demanda por modo y tramo del corredor, datos sobre las variables de nivel de servicio para cada modo y tramo y las características más importantes de los viajeros Una buena parte de estos datos se obtiene mediante entrevistas basadas en el modo, a bordo (tren) o en los destinos principales (lugar de trabajo). La simplificación extrema de la estructura de la red genera ahorros considerables en la toma de datos y codificación. La transferencia de modelos de elección discreta desde otros contextos puede llevarse a cabo utilizando las técnicas descritas en el apartado 9.4. Si es necesario, la transferencia de la generación de viajes puede llevarse a cabo mediante los métodos señalados en el apartado 4.5. Sin embargo, en la mayoría de los casos se supone una matriz de viajes multimodal fija para estos estudios. Si el estudio cubre varios años en el futuro, cabe la posibilidad de que sea necesario emplear técnicas de actualización de matrices basadas en factores de crecimiento, como se indicó en el epígrafe 5.2. Los modelos de corredor con restricciones de capacidad importantes requieren algún cuidado especial. Los efectos de los cuellos de botella en el corredor deben tratarse específicamente y a veces se pueden aplicar modelos de micro-asignación a los mismos. Los modelos de demanda directa son también elecciones recomendables para este tipo de problemas.

12.5.3. Modelos de demanda marginal Al enfrentarse con problemas que no pueden ser tratados mediante un estudio de transporte a gran escala por limitaciones de recursos y de disponibilidad de tiempo, es deseable concentrar los esfuerzos en aquella parte de la demanda de transportes que probablemente sea afectada por el proyecto o la actuación en cuestión. Si el proyecto no está basado en un corredor se requiere algo más de cuidado y atención. Sin embargo, las características especiales del problema pueden utilizarse a menudo para simplificar las tareas a realizar. Una metodología generalizada para este problema fue propuesta por De Cea et al. (1986). Esta metodología se resume a continuación y se muestra en la figura 12.4.

MODELOS

DE

TRANSPORTE



1. Definición del problema. Los pliegos de condiciones del estudio, si estuvieran disponibles, deberían facilitar la identificación de los principales elementos del problema, ya sea un proyecto de inversión concreto o ya sea la consideración de una nueva actuación de política en transportes. Los pliegos de condiciones, sin embargo, no eximen al analista de identificar consecuencias más amplias de las alternativas a considerar. 2. Identificación de la población relevante y del impacto potencial del proyecto. En esta etapa se trata de identificar los impactos más probables de un proyecto o actuación y los segmentos de población que probablemente se verían afectados. En principio cualquier cosa puede afectar a cualquier otra, pero se deben tratar de identificar los efectos de primer orden y aquellos que más probablemente perciban (pérdidas o ganancias) los costes y beneficios del proyecto. 3. Identificación de los recursos técnicos disponibles para analizar los principales impactos del proyecto en la población relevante. La existencia de datos, quizás no actualizados, de otros estudios y modelos y, especialmente la experiencia local, pueden jugar un papel importante para ofrecer asesoramiento rápido y sólido a los gestores. La actualización de los conjuntos de datos y el ajuste de los modelos existentes requiere normalmente menos recursos que empezar desde cero. El conocimiento local puede ser crucial en esta fase. 4. Selección de modelos generales y de demanda marginal. Un elemento clave de este método es el uso de un modelo más agregado y tosco para estimar el nivel general de demanda y un modelo más detallado de demanda marginal para identificar los impactos específicos del proyecto sobre la demanda general antes hallada. La elección de los modelos generales y de demanda marginal depende de la naturaleza del problema y de los recursos técnicos disponibles. El modelo de demanda marginal se aplica a la población relevante solamente y debería, por supuesto, ser capaz de discriminar los impactos del proyecto y/o de las actuaciones sobre esa población. Al seleccionar estos modelos es importante contemplar la viabilidad de su implementación y utilización dentro del marco temporal y de recursos del estudio. Las hipótesis de simplificación adoptadas en esta fase deben estar convenientemente documentadas. 5. Implementación de los modelos y conjuntos de datos. Los modelos generales y de demanda marginal se instalan en un ordenador junto con los conjuntos de datos a utilizar y actualizar como parte del estudio. En muchos



Modelos simplificados de demanda de transporte

Términos de referencia Identificación de la población e impacto potencial Recursos técnicos disponibles Selección de antecedentes (BM) y modelos de demanda marginal (MDM) Implementación de modelos y conjuntos de datos Aplicación de BM al año base

Aplicación de BM al año de previsión

Aplicación de MDM al año base

Aplicación de MDM al año de previsión

Evaluación e indicadores Análisis de sensibilidad de variables clave

Figura 12.4. Fases en la evaluación de proyectos utilizando métodos de estimación de la demanda marginal.

casos será necesario desarrollar programas cortos para pasar los datos a formatos adecuados y realizar las comprobaciones necesarias y la producción de informes. 6. Aplicación de los modelos generales y de demanda marginal al año base y su validación. Esto puede requerir alguna toma de datos adicional, idealmente a pequeña escala. 7. Aplicación de los modelos generales y de demanda marginal para la prognosis en años futuros. Esto requerirá, en primer lugar, proyectar los valores de las variables de planificación para esos años y después aplicar los modelos con y sin proyecto o bajo diferentes opciones de actuación en política de transportes.

MODELOS

DE

TRANSPORTE



8. Evaluación. Los modelos ejecutados en los dos pasos anteriores deben producir los indicadores necesarios para una evaluación de las opciones abierta a los gestores. Debe ponerse especial atención para enmarcar esta evaluación respecto a la práctica local y producir los indicadores que los gestores consideren más significativos. 9. Análisis de sensibilidad. Las hipótesis simplificadoras adoptadas en las fases anteriores y la incertidumbre sobre el futuro hacen necesario comprobar la sensibilidad de los resultados obtenidos a las variaciones en los valores de entrada y pesos adoptados en el estudio. El presupuesto y las restricciones temporales limitan habitualmente la cantidad de tests de sensibilidad que pueden efectuarse. Sin embargo, se pueden obtener las preferencias de los gestores sobre los elementos que consideran que han de examinarse en estos tests. Estos elementos pueden tomar la forma de preguntas como: El proyecto sería aún viable si… se duplicase el precio del combustible o la tasa de interés se incrementase en un 2%. Estas preferencias podrían utilizarse para seleccionar tests de sensibilidad complementarios a los requeridos por las hipótesis simplificadoras adoptadas anteriormente. Ésta es una metodología pragmática cuyas virtudes y limitaciones sólo pueden confirmarse en la práctica. De Cea et al. (1986) han seguido este enfoque para el estudio de una ampliación posible de la red de metro de Santiago (Chile). En resumen su metodología incluía: • Identificación de la población de interés como aquella que se encuentra en zonas con acceso peatonal al metro antes y después de la ampliación potencial, incluyendo viajes multimodales. • Utilización de técnicas de estimación de matrices de viaje basadas en aforos de tráfico para la obtención de matrices generales para coche y transporte público. Se hizo uso de un amplio conjunto de aforos complementado con encuestas ad hoc en paradas de autobús y estaciones de metro. • Transferencia de un modelo desagregado de elección modal basado en el corredor al área de estudio mediante recalibrado de las constantes específicas de los modos. La disponibilidad del modelo de corredor y datos adecuados sobre nivel de ingreso hizo posible esta transferencia. • Evaluación económica, financiera y medioambiental del proyecto, complementada con análisis de sensibilidad de los parámetros más importantes.



Modelos simplificados de demanda de transporte

El estudio completo fue realizado en cuatro meses. El análisis coste-beneficio predijo una rentabilidad razonable de la inversión. La ampliación del metro se llevó a cabo más tarde y los resultados confirman lo apropiado del estudio.

12.6.

JUEGOS DE SIMULACIÓN

Los modelos matemáticos no resuelven cualquier problema de transportes de la vida real. La interpretación de las soluciones matemáticas es la que proporciona utilidad para tomar decisiones sobre problemas de transporte. Los modelos simplificados pueden ayudar a reducir el esfuerzo necesario para encontrar una respuesta analítica y para facilitar la interpretación sucesiva de esta solución en relación con el problema real. Se utilizan modelos conceptuales o mentales para entender, interpretar y actuar en la vida profesional. Los modelos mentales son, en efecto, un requisito previo para el desarrollo y aplicación de los modelos matemáticos que se ejecutan en ordenador. A pesar de su importancia los modelos mentales son difíciles de examinar debido a su carácter, lo cual conduce a menudo a problemas de comunicación bastante intratables. Si se desea mejorar la planificación de transportes, los mejores y más ricos modelos en la mente de los planificadores y gestores son, probablemente, tan importantes como el uso en ordenador de modelos de comportamiento rigurosos y bien fundados. Dado el importante papel de los modelos mentales en el uso y la aplicación de modelos matemáticos, parece adecuado investigar técnicas para mejorar los primeros con objeto de obtener mejores soluciones con los segundos. Pero ¿cómo se adquieren, revisan, rechazan y mejoran los modelos mentales? Los factores principales parecen ser la educación formal e informal, las discusiones y debates, y, sobre todo, la experiencia práctica. Uno de los problemas principales a los que se enfrenta la educación y adiestramiento en el planeamiento es cómo adquirir una experiencia realista. Esto es especialmente importante en el campo de los transportes, donde las consecuencias más importantes de una intervención en transportes pueden darse después de un tiempo considerable. Además, es sorprendentemente sencillo prestar demasiada atención a detalles de técnicas concretas, y perder de vista el proceso más amplio en el que estas técnicas deben encajar. La necesidad de métodos para desarrollar una comprensión general del sistema en vez de información detallada sobre sus partes ha sido reconocida

MODELOS

DE

TRANSPORTE



en varias disciplinas, especialmente en el aprendizaje de la gestión y de los negocios. Se han desarrollado algunas técnicas de educación con este fin: estudio de casos, juegos de rol y diferentes tipos de ejercicios. Los juegos de simulación (gaming simulation) son una técnica particularmente atractiva en este campo. Fueron desarrollados originalmente con propósitos militares en forma de juegos de guerra, pero desde que los ordenadores personales están disponibles se han extendido a las ciencias empresariales, políticas, sociológicas y a la planificación regional y de transportes. Los juegos educativos son ejercicios de toma de decisiones secuenciales estructurados respecto a un entorno artificial que representa el mundo real. Este entorno artificial puede ser solamente un conjunto de instrucciones y material gráfico o puede contener un ejercicio elaborado de simulación utilizando programas de ordenador, modelos físicos y presentaciones animadas. Como en la vida real, los juegos tienen habitualmente una dimensión competitiva. Esta característica puede incorporarse al menos mediante dos formas: dividiendo a los jugadores en equipos con objetivos parcialmente en conflicto (p. ej., propietarios de vehículos, oficiales de protección ambiental, residentes, etc.) o enfrentando a cada jugador con un modelo informático de un sistema complejo más un conjunto común de condiciones iniciales y objetivos finales. Se pueden utilizar indicadores clave para medir los logros de cada jugador en el cumplimiento de estos objetivos. El primer método refuerza la necesidad de negociación y compromiso, mientras que el segundo enfatiza la eficiencia en los objetivos buscados. Ambos métodos mejoran la comprensión de sistemas complejos y apoyan el desarrollo de las aptitudes de aprendizaje. En ambos casos el éxito de los jugadores depende de su habilidad para aprender de las consecuencias de sus propias decisiones y de las de los demás y del efecto de fenómenos inesperados como huelgas o incrementos en el precio de los combustibles. El objetivo final de cualquier ejercicio de juegos de simulación es aumentar la capacidad de aprendizaje mediante el enriquecimiento del modelo conceptual que cada jugador tiene del sistema. Para una buena base sobre juegos de simulación, su diseño y las experiencias existentes, el lector puede consultar los trabajos de Greenblat y Duke (1975) o Taylor (1971) y en el campo de los transportes, Ortúzar y Willumsen (1978). Varios juegos de simulación han sido desarrollados específicamente para los transportes. Algunos de estos juegos abarcan problemas como la negociación del trazado de una nueva carretera o el planeamiento de nuevos servicios de transporte público. Probablemente el juego más ampliamente utilizado en el



Modelos simplificados de demanda de transporte

campo de los transportes es GUTS (Willumsen y Ortúzar, 1985). Los objetivos originales de este juego basado en ordenador son: • El juego debe tratar el sector transporte de un área urbana como un sistema, es decir, debe destacar las interrelaciones entre los modos, la gestión de tráfico y las decisiones de inversión, así como las restricciones financieras. De ahí que el programa de ordenador contenga relaciones que reflejan estas interacciones. • El juego debe ser realista pero manejable. Se deben incluir los tipos más comunes de decisiones de inversión y de gestión de tráfico y simular las restricciones financieras y de recursos más importantes. • El modelo ha de permitir un rango de alternativas e incluso intereses en conflicto para ser alcanzados y, consecuentemente, el programa debe producir no un único sino varios indicadores de rendimiento. Al mismo tiempo, la información disponible para los jugadores no debe ser demasiado diferente de la disponible habitualmente para quienes toman decisiones. • El juego debe realzar la importancia del seguimiento continuo del funcionamiento de un sistema de transportes. • El modelo debe permitir la representación de diferentes tipos de áreas urbanas respecto a distribuciones de áreas de residencia, empleo, motorización y renta, así como tasas de crecimiento, usuarios de transporte público e indicadores relacionados. GUTS está desarrollado como un programa interactivo para ordenadores con modestos requerimientos de memoria. El modelo se basa en un área urbana simplificada con simetría circular. Dos modos de transporte, coche y autobús, operan libremente y en competencia. El usuario puede tomar decisiones sobre las tarifas y niveles de servicio del transporte público, la introducción de carriles bus, esquemas de licencia suplementaria, dotación de aparcamientos y costes de los mismos, así como grandes proyectos de infraestructura. El programa comprueba estas decisiones y ejecuta el modelo para representar un año de operación del sistema de transportes. Al final de la ejecución se obtienen indicadores sobre las intensidades de tráfico, velocidades, reparto modal y tiempo de viaje y gasto según tipo de persona, además de informes del funcionamiento financiero de la empresa de autobuses. También se simulan cambios en los niveles de accesibilidad y el impacto de nuevas inversiones así como fenómenos inesperados que provocan cambios en la estructura de costes de los modos de transporte que operan en la ciudad. La condición de

MODELOS

DE

TRANSPORTE



simetría que se impone a la ciudad simplifica el modelo acelerando el aprendizaje del usuario y mejorando el tiempo de ejecución en el ordenador. Juegos como GUTS pueden mejorar la planificación de transportes de varias formas. En primer lugar, en su modo habitual como herramienta de aprendizaje, pueden utilizarse para la educación de nuevos miembros de un equipo y para desarrollar un lenguaje común en toda la organización. En segundo lugar, un modelo de este tipo puede contemplarse como una herramienta simple de “planificación simplificada” con gran valor para la discusión de amplias opciones de política de transportes y concepciones particulares de los gestores. GUTS y programas similares no son sustitutos de los modelos a gran escala pero pueden contribuir a llenar la brecha existente entre estrategias de alto nivel de agregación y estudios específicos de modelización. Un tercer elemento a considerar es el uso de herramientas de esta clase como demostración de las ventajas y limitaciones de los modelos matemáticos. Los dos extremos de rechazo total de los modelos de transporte o de su aceptación a ciegas están todavía presentes en gran parte de las organizaciones políticas y de planificación. La simplicidad evidente de un juego de simulación combinada con su capacidad para representar las interacciones entre los modelos y las decisiones, ofrece un buen ejemplo de lo que puede obtenerse con un enfoque de modelización formal. La utilización y posterior crítica del juego por parte de los políticos y planificadores les ayudaría a comprender mejor las actividades e intereses correspondientes. El desarrollo y distribución extendida de juegos de esta clase puede jugar un importante papel en la mejora de la conciencia pública sobre los problemas de transporte, el papel de estrategias alternativas para resolverlos, sus implicaciones para la localización de recursos y la calidad de vida. El Gobierno Holandés ha sido pionero de estos métodos mediante el desarrollo y la distribución de un programa, “Oráculo de Tráfico”, para microordenadores que permite la simulación y discusión de diferentes escenarios futuros y políticas de planificación y gestión de transporte en Holanda.

EJERCICIOS 12.1. La red de la figura 12.5 representa un área pequeña con dos orígenes, A y B y dos destinos, Y y Z. Se han realizado aforos de tráfico de los volúmenes de coches que utilizan la red con los siguientes resultados:



Modelos simplificados de demanda de transporte

Arco

Volumen

M-N N-P P-Q

400 700 500

a) Utilizar un modelo de maximización de la entropía para estimar una matriz de viajes a partir de la información anterior. Suponer que se necesita una matriz de referencia adecuada para este problema. Se considera aceptable un error en el flujo modelizado del 3%. b) Repetir los cálculos anteriores suponiendo que la matriz de referencia viene dada por:

A B

Y

Z

100 80

50 200

B

M

N

Q

Y

R

Z

P

A

Figura 12.5. Red simple para el ejercicio 12.1.

12.2. La red de la figura 12.6 representa los arcos que conectan dos orígenes, A y B y dos destinos, C y D en un país en desarrollo. Las poblaciones de los dos orígenes son 10.000 y 20.000 habitantes respectivamente y los mercados que se encuentran en C y D son igual de atractivos en términos de tamaño y precio. Las distancias de los arcos (en km) están indicadas en la figura. A 10 8

X

11

C 1 Y

7

B

Figura 12.6. Red simple del ejercicio 12.2.

D

MODELOS

DE



TRANSPORTE

Se han obtenido los siguientes aforos de personas en arcos: Arco

Personas/día

A-X X-Y Y-D

3.400 11.900 4.100

Calibrar un modelo del tipo:

Tij 

bPD d n i j ij

¤D d j

n ij

j

donde Pi es la población de la zona i, Dj es el índice de atracción para el mercado de la zona j y dij es la distancia de viaje entre i y j. Pruébense al menos dos valores de la potencia n, incluyendo n = 2 y n = 2,5. 12.3. Tres pueblos A, B y C están conectados por un río navegable en un país subdesarrollado. El pueblo A tiene una población de 1.000 habitantes, el B está a 30 km río abajo y tiene una población de 2.000 habitantes; el pueblo C está a 10 km del B con una población de 300 habitantes. El valor de las mercancías vendidas en cada pueblo al día es de 500, 600 y 600 pesos respectivamente. Dos observadores han pasado un tiempo tomando aforos direccionales de los pasajeros que viajan en barco por el río, con los siguientes resultados: Sección del río

Pasajeros por 1/2 día

A-B B-A B-C C-B

45 60 360 560

a) Calibrar un modelo de gravedad de la forma sugerida en el ejercicio 12.2, donde se sustituya Dj por la población de j. Utilizar n = 2,0. b) Calibrar un modelo similar, pero reemplazando Dj por el valor de las mercancías intercambiadas en cada pueblo diariamente. c) ¿Cuál es el mejor modelo? Justificar la respuesta.



Modelos simplificados de demanda de transporte

12.4. La elasticidad de la demanda de autobuses a la tarifa en una determinada región toma un valor típico de –0,3. El viajero medio entre la zona A y el centro de la ciudad (CBD) tiene que pagar normalmente una tarifa de $2 por viaje. La participación del autobús respecto al total de viajes entre A y el CBD es del 60%, utilizando el resto de los viajes el vehículo privado o el metro. Si el número total de viajes entre ambas zonas es de 2.000, estimar la pérdida de clientes de los autobuses, utilizando el método logit incremental, si la tarifa se eleva a $3 por viaje, siendo iguales el resto de parámetros. Comparar los resultados con el cálculo más elemental a partir de elasticidades. Discutir los resultados. (Sugerencia: dada la expresión simple para la elasticidad logit directa, estimar el parámetro θc a partir de los datos).

13. Otros tópicos de interés

E

ste capítulo abarca cuatro aspectos importantes de la modelización del transporte. El primero es la modelización del transporte de mercancías, destacando en el epígrafe 13.1 las principales diferencias con la modelización de la demanda de transporte de viajeros y diseñando los métodos más aptos para mercancías. La sección 13.2 se dedica a la previsión de variables de planificación. Variables tales como la población futura, el empleo, las plazas de colegio, las áreas de compras y la distribución de la venta son necesarias para realizar previsiones utilizando modelos de planificación de transporte. A veces estas variables se obtienen exógenamente al estudio; en otros casos deben estimarse como parte del propio ejercicio de planificación. En cualquier caso, juegan un papel clave a la hora de determinar la capacidad de prognosis de los modelos tratados en este libro. Una de las variables de planificación más importantes es la posesión de coche, la cual se trata en el epígrafe 13.3, en el que se exponen modelos de series temporales y econométricos para realizar prognosis respecto a la posesión de coche. Además se discuten otros enfoques más recientes al respecto. Los temas relacionados con el concepto, estimación y aplicación del valor del tiempo se presentan en el epígrafe 13.4. Finalmente, en el apartado 13.5 se tratan el concepto y los métodos utilizados en la evaluación de los efectos externos del transporte, como son los accidentes y la contaminación. El libro no estaría completo sin tratar estos temas.

13.1.

MODELOS DE DEMANDA DE MERCANCÍAS

13.1.1. Importancia La mayor parte de este libro se ha concentrado en la modelización de la demanda de viajeros con especial énfasis en los problemas urbanos. Sin embargo,



Otros tópicos de interés

los movimientos de mercancías, especialmente en carretera, son una fuente de congestión importante y de otros problemas de tráfico. Los ruidos y la irritación provocados por los camiones pesados, los problemas causados por la carga y descarga en la calle para los comercios y otros locales y la queja típica de que los camiones ocupan una gran parte de la capacidad de las carreteras interurbanas son solamente algunos ejemplos de los problemas asociados con este tipo de tráfico. Desafortunadamente, en las zonas urbanas las alternativas disponibles para influir en el transporte de mercancías por carretera son muy limitadas. Principalmente dichas limitaciones son: controles sobre la carga y descarga, límites y dimensiones de los vehículos permitidos en ciertas zonas (ruteo de camiones), la provisión de centros importantes de intercambio de mercancías, la promoción de accesos posteriores a locales y mejoras en la configuración de nuevos desarrollos urbanos. La modelización de la demanda del transporte de mercancías por carretera puede jugar un papel de especial importancia en países en proceso de desarrollo, donde son aún más urgentes los esfuerzos para incrementar las exportaciones y ganar acceso a regiones subdesarrolladas. En estos casos, facilitar el transporte de mercancías por carretera probablemente tendrá un impacto importante sobre el desarrollo económico. Además, la competencia entre la carretera y el ferrocarril en algunos de estos países, es clave en la distribución de los recursos de inversión y mantenimiento. En el caso de los desplazamientos interurbanos las políticas de intervención tienen mayores posibilidades de influir en la elección del modo de transporte de mercancías y en regular la competencia entre la carretera y el ferrocarril. Mejorar la asignación de los costes de los usuarios de la vía pública y dirigir las subvenciones a servicios viales o ferroviarios son también opciones de política importantes. El diseño de estas herramientas claves puede requerir esfuerzos de modelización más finos que los utilizados en estudios urbanos. Dados todos estos aspectos, parece sorprendente la limitada investigación desarrollada para modelizar este tipo de movimiento en comparación con los esfuerzos realizados en demanda de viajeros. ¿Por qué ha sucedido esto? Existen múltiples razones: • Hay muchos aspectos en la demanda de transporte de mercancías que la hacen más difícil de modelizar que los desplazamientos de pasajeros; más adelante se discuten algunos de ellos.

MODELOS

DE

TRANSPORTE



• Durante bastante tiempo la congestión urbana ha tenido prioridad en la agenda política de la mayoría de los países industrializados y en este tema los movimientos de pasajeros juegan un papel mucho más importante que los movimientos de mercancías. • El movimiento de mercancías implica más actores que el movimiento de viajeros; existen empresas industriales que envían y reciben mercancías, los agentes que organizan las entregas y los modos de transporte, transportistas que transportan las mercancías, y muchos otros operadores que organizan el transbordo, almacenamiento y servicios de aduana. En algunos casos coinciden dos o más de ellos, por ejemplo los operadores por cuenta propia, aunque siempre existen objetivos contrapuestos que son realmente difíciles de modelizar en detalle en la práctica. • Las tendencias recientes en la investigación del transporte de mercancías se han concentrado en enfatizar el papel que juega el control de inventarios y gestión de stock en el proceso general de producción. Estas tendencias se alejan de las técnicas más tradicionales de modelización de viajeros y poco tienen que ver con ellas (véase Regan y Garrido, 2002). En este apartado se resumirán los métodos existentes en la literatura actual para modelizar la demanda de transporte de mercancías. Se comienza con un análisis de las principales dificultades asociadas con este tipo de modelización. A continuación se estudia lo que probablemente es el método más tradicional para tratar el problema, es decir, la adaptación del modelo convencional de demanda agregada de cuatro etapas al caso de las mercancías. También se tratan algunas extensiones de la metodología desagregada, cerrándose este epígrafe con algunas consideraciones prácticas para la implementación de estos conceptos. Para más detalles véase el interesante libro de Harker (1987).

13.1.2. Factores que influyen en el movimiento de mercancías Tal y como en el caso de la demanda de viajeros, es útil en primer lugar considerar los factores que deberían influir en el movimiento de mercancías. La lista que se muestra a continuación no es exhaustiva, pero cubre los más importantes: • Factores de localización. El transporte de mercancías es siempre una demanda derivada y normalmente forma parte de un proceso industrial. Por lo tanto, la localización de las fuentes de materia prima y de otros componentes









• •



Otros tópicos de interés

del proceso industrial, así como la localización de los mercados intermedios y finales para sus productos, determinarán los niveles de movimientos de mercancía involucrados y sus orígenes y destinos. La gama de productos requeridos y producidos es muy alta, mucho mayor que incluso la segmentación más detallada o exagerada de la demanda por tipo de persona y propósito de viaje. Una demanda dada de tornillos no se puede satisfacer con cacahuetes. En cualquier estudio de demanda de transporte de mercancías existirán muchas matrices de bienes. Factores físicos. Las características y la naturaleza de las materias primas y de los productos finales influyen en la forma en que pueden transportarse: a granel, embalados en camionetas ligeras, en vehículos acorazados cuando son mercancías de alto valor, en contenedores refrigerados si son productos perecederos, etc. Por lo tanto, existe una mayor variedad de tipos de vehículos para transportar diferentes clases de mercancías que en el caso del transporte de viajeros. Factores operativos. El tamaño de la empresa, su política de distribución, su dispersión geográfica, etc. tienen fuerte influencia en el posible uso de diferentes modos y estrategias de transporte. Factores geográficos. La localización y la densidad de la población pueden influir en la distribución de los productos finales. Factores dinámicos. Las variaciones estacionales en la demanda y en los gustos de los consumidores juegan un papel importante en el cambio de los patrones de movimiento de mercancías. Factores tarifarios. Al contrario que en el caso de la demanda de viajeros, las tarifas normalmente no se publican (aunque sí las de referencia) porque son mucho más flexibles y sujetas a negociaciones y regateos.

13.1.3. Tarificación de transporte de mercancías Normalmente es muy difícil conseguir datos fiables sobre los precios del transporte de mercancías. Por ejemplo, en Europa, tanto el transportista como su cliente procuran mantenerlos confidenciales para mejorar su posición al llegar el momento de negociarlos. Los factores que afectan a las tarifas o a las imputaciones del coste, y por lo tanto, a la elección del modo, pueden ser los siguientes: • La duración de los contratos de suministro. Puede obtenerse mejor precio si el agente garantiza una demanda por uno o más años en lugar de un solo

MODELOS











DE

TRANSPORTE



viaje. La existencia de cláusulas de revisión de precios ayuda a alargar los contratos. Los descuentos por volumen transportado. Siguiendo el argumento anterior, un contrato que garantice viajes regulares con mayor volumen de mercancías a transportar, probablemente se beneficiará de una tarifa más baja. La importancia de instalaciones terminales. La disponibilidad de una estación de ferrocarril cercana, o incluso en la propia empresa, reduciría ciertamente el coste de transporte por ferrocarril; su ausencia incrementaría la probabilidad de utilizar el transporte carretero en todo el trayecto sin tener en cuenta el ferrocarril o el transporte marino. El uso de sistemas de transporte propios, especialmente en carretera. Algunas empresas prefieren hacerlo de esta forma por razones no asociadas al transporte (imagen, fiabilidad, integración). Estas empresas van a tender a extender el uso del transporte propio para los productos marginales en lugar de pensar en un modo completamente nuevo. Algunos modos son más idóneos para transportar determinadas mercancías. Por ejemplo, las tuberías de distribución son ideales para líquidos en masa y para algunas suspensiones y los trenes calesita (que no paran) son ideales para los movimientos desde minas de carbón a centros térmicos. Este encaje entre las características del suministro y la demanda definitivamente influirá en las tarifas cargadas por estos productos. Cadenas de transporte jerarquizadas. Por ejemplo, en el caso de los productos derivados del petróleo, la utilización de grandes buques petroleros hasta las refinerías para después usar barcos más pequeños u oleoductos hasta las principales terminales, y luego ferrocarril hasta otras terminales y camiones hasta las gasolineras y otros usuarios finales. Estas estructuras son difíciles de modificar a corto plazo ya que han evolucionado durante un largo período y están bien establecidas; por lo tanto, su mecanismo tarifario sería difícil de cambiar.

13.1.4.

Modelización agregada de la demanda de mercancías

La gran mayoría de los modelos de demanda de mercancías que se han aplicado en la práctica son del tipo agregado (véase por ejemplo Van Es, 1982; Friesz et al., 1983; Harker, 1985). Estas aplicaciones siguen el modelo clásico de cuatro etapas con algunas adaptaciones específicas para este tipo de transporte. Un ejemplo muy típico de este enfoque es el trabajo realizado por Kim



Otros tópicos de interés

y Hinkle (1982), los cuales utilizaban el American Urban Transport Planning Suite (UTPS) con algunas modificaciones para modelizar los movimientos de mercancías estatales. En resumen, este enfoque implica: • La estimación de la generación y atracción de mercancías por zonas. • La distribución de los volúmenes generados a fin de satisfacer las restricciones de generación y atracción. Los métodos usuales para esta tarea son la programación lineal o los modelos gravitacionales. • La asignación de los movimientos origen-destino a modos y rutas. A continuación se examinarán con más detalle éstos y otros factores. 13.1.4.1.

Generación y atracción de mercancías

Las técnicas utilizadas para obtener la suma de los viajes generados dependen del nivel de agregación originalmente previsto y del tipo de productos en cuestión: • Para algunos productos homogéneos como son el azúcar, los productos derivados del petróleo, el mineral de hierro, el carbón, el cemento, los fertilizantes, el grano, etc., se pueden realizar encuestas directas sobre la oferta y la demanda. Éstas pueden pronosticarse con los estudios de la propia industria o sector. Este método es útil para los movimientos interurbanos pero no se recomienda para problemas urbanos. • El uso de modelos macroeconómicos, por ejemplo, utilizando tablas inputoutput basadas en datos regionales en lugar de nacionales. • Los métodos de factor de crecimiento, tal y como los que se estudian en el Capítulo 4, se han utilizado frecuentemente en la prognosis de atracciones y generaciones. • A menudo se utiliza la regresión lineal múltiple a nivel zonal para obtener medidas más agregadas de la generación y atracción de mercancías, especialmente en áreas urbanas. • La demanda puede asociarse con la capacidad de los almacenes o con la superficie total de las áreas comerciales en cada zona (estudios urbanos) en lugar de asociarla con los desarrollos industriales. 13.1.4.2.

Modelos de distribución

Diversos estudios a nivel urbano aplican sencillamente métodos de factor de crecimiento para observar las matrices relativas a los flujos de mercancías,

MODELOS

DE



TRANSPORTE

tal y como se estudió en el Capítulo 5. Sin embargo, muchos estudios sobre el transporte de mercancías interurbanas han utilizado modelos sintéticos agregados incluso del tipo de demanda directa. A continuación se analizarán brevemente las dos técnicas agregadas más utilizadas en este ámbito: el modelo gravitacional y el enfoque de programación lineal. En el caso del modelo gravitacional es relativamente sencillo reinterpretar su fórmula como:

Tijk  Aik B kj Oik D kj exp (  k Cijk )

(13.1)

donde k es un índice del tipo de mercancía; Tijk son las toneladas del producto k transportado desde i hasta j; Aik, Bjk son factores de balanceo con su típica interpretación; Oik, Djk son la oferta y la demanda del producto k en la zona i y j; βk son parámetros de calibración, uno por cada producto k; y Cijk son los costes generalizados de transporte por tonelada del producto k entre las zonas i y j. La idea de utilizar una fórmula de función de costes generalizados para la demanda del transporte de mercancías se debe, aparentemente, a Kresge y Roberts (1971). Ésta se puede interpretar de la siguiente forma (quitando el superíndice k para simplificarla):

Cij  f ij b1 sij b2 sij b3 wij b4 pij

(13.2)

en la que: ƒij es la tarifa asociada a la utilización de un servicio desde i hasta j; sij es el tiempo para viajar “puerta a puerta” entre i y j; σsij es la variabilidad del tiempo de viaje s; wij es el tiempo de espera o retraso desde el momento de pedir el servicio hasta recibirlo; puede ser grande para el transporte marítimo por ejemplo; pij es la probabilidad de pérdidas o daño de la mercancía durante el tránsito. Todos estos factores dependen también del modo a utilizar y hasta cierto punto del producto que se transporta. Las constantes bn son, en general, pro-



Otros tópicos de interés

porcionales al valor de la mercancía. En el caso de la probabilidad de pérdida, el coste es por lo menos igual al valor de los bienes, aunque generalmente es mayor debido a las penalizaciones que se imponen por retrasar la entrega. En el caso de los retrasos, la variabilidad de los retrasos en los tiempos de transporte, los valores de bn son, por lo menos, proporcionales a los valores de los bienes, esencialmente debido al incremento en los costes de inventario. Las técnicas modernas de producción industrial, tales como las que enfatizan entregas “just in time” procuran minimizar estos factores así como los costes de stock. El mínimo para b1 hasta b3 es el coste de la tasa de interés aplicada al valor de los bienes durante el período de tiempo considerado. En términos generales, es importante considerar la contribución relativa de los costes de transporte (generalizados) al coste final del producto. Por ejemplo, en el caso del trigo, el carbón, el cemento y los ladrillos, los costes de transporte representan un elemento importante en su precio final; sin embargo, en el caso de las comidas rápidas, bienes de consumo, chocolatinas o la electrónica, los costes de transporte contribuyen poco (directamente) al precio final. Otro enfoque para modelizar la distribución es la programación lineal (PL). Normalmente toma la forma de un programa de minimización: minimizar los costes totales de transporte (en términos de dinero, raramente en términos de costes generalizados), sujetos a las restricciones de oferta y demanda. Minimizar Z  ¤ Tij Cij

(13.3)

ij

s.a.

¤T

ij

 Dj

(13.4)

 Oi

(13.5)

i

¤T

ij

j

Éste es el conocido problema de transporte de Hitchcock, que se puede resolver muy fácilmente. Las formulaciones más avanzadas pueden implicar costes no lineales y quizás restricciones más elaboradas que impliquen un elemento de tiempo y tamaños mínimos de envío. Este problema de minimización tiene sentido desde el punto de vista de una empresa grande que intenta satisfacer a sus clientes a un coste mínimo. Alternativamente, si una industria tiene varias fábricas con diferentes capacidades de producción y costes, la función objetivo puede ser la de maximizar

MODELOS

DE

TRANSPORTE



las ganancias o minimizar los costes totales en el mercado. Desde el punto de vista de la modelización, el enfoque PL tiene más posibilidades de ser realista cuando: • la industria se concentra en pocas empresas; • existen bienes de bajo valor y de relativamente altos costes de transporte; • existen pocos puntos (zonas) de demanda, quizás un monopsomio (un único comprador). Sin embargo, hay que reconocer que aunque la PL pueda ser un modelo bueno para el comportamiento de un único cliente o empresa industrial, no puede representar el comportamiento agregado de diversos productos. La solución PL tendería a ser demasiado dispersa, con destinos particulares servidos solamente por algunos orígenes. Por otra parte, el modelo gravitacional es bastante flexible. Cambiando el valor de β se puede variar la importancia relativa del coste en comparación con las restricciones de oferta y demanda. La relación formal entre PL y el modelo gravitacional ha sido explorada por Evans (1973). Ella ha mostrado que en el límite, β = 0 en (13.1) producirá una matriz de flujos en la que los costes de transporte no juegan ningún papel (de hecho, ésta es la solución de Furness para el problema del factor de crecimiento); mientras que un valor de β muy grande generará una solución más cercana a la de un modelo PL, es decir, donde son dominantes los costes de transporte (en el límite β = ∞ se reproduce la solución PL). Por lo tanto, se puede utilizar la formulación de un modelo gravitacional para representar toda la gama de comportamiento del cliente en su elección de destino, tanto cuando los costes de transporte son casi indiferentes (electrónica) como para bienes a granel de bajo coste como cemento, arena, etc., donde los costes de transporte son primordiales. 13.1.4.3.

Elección del modo

Esencialmente, es decisión del agente qué transporte se va a utilizar para entregar los bienes en su destino. Cuando se modeliza a este nivel tan agregado, la elección del modo frecuentemente se trata utilizando una formulación de logit multinominal basada en los costes generalizados, tal y como se ha descrito anteriormente. Esto puede resultar muy aproximado porque la información sólo captura aquellos elementos de la elección de modo que se han incorporado en el concepto de costes generalizados visto anteriormente.



Otros tópicos de interés

Las decisiones que toma el agente dependen, por supuesto, de las tarifas aplicadas por los transportistas, las cuales también dependen de los volúmenes que mueven entre cada par O-D. Ya que el tamaño de muchos de los envíos es significativo en términos de cómo influyen en las tarifas de los transportistas, existen ciertas interacciones dentro de la elección del modo que van más allá de las que se dan entre los pasajeros y las empresas de transporte público. Este problema a menudo se ignora en los niveles altos de agregación. En el caso de los flujos de mercancías dentro de un área urbana la elección del modo es trivial, ya que la cobertura de los modos que no son de carretera es extremadamente limitada. 13.1.4.4.

Asignación

Es problema del transportista decidir la mejor ruta para llevar los bienes desde su origen hasta su destino. En cierta medida éste es el problema menos difícil de resolver. La utilización de restricciones de capacidad es probablemente relevante en la mayoría de las situaciones urbanas. Por otra parte, en el caso del transporte interurbano puede ser suficiente usar un modelo de asignación estocástico. Sin embargo, es posible argumentar que diferentes tipos de vehículos deben modelizarse de formas diferentes; por ejemplo, las furgonetas ligeras pueden ser menos sensibles a la orografía de una ruta que los camiones pesados; también, los vehículos que llevan bienes perecederos pueden dar más prioridad a la reducción del tiempo de viaje que los que llevan, por ejemplo, carbón a granel. Por lo tanto, se puede justificar el uso de métodos de asignación de clases múltiples para trabajar con esta diversidad de conceptos de coste. 13.1.4.5.

Equilibrio

Tal y como en el caso de la demanda de viajeros, el problema del equilibrio del sistema o del mercado afecta a todo el ejercicio de modelización, pero las técnicas para conseguirlo aún están desarrollándose. Una de las primeras formulaciones para este problema es la de Friesz et al. (1983), quienes desarrollaron un modelo de equilibrio para una red de transporte de mercancías (MERTM). Este modelo considera de forma explícita las decisiones tanto de los agentes como de los transportistas para una red intermodal de mercancías con costes no lineales y unas funciones de demora que varían con los volúmenes de mercancías. El MERTM trata a los agentes y transportistas de forma secuencial; se supone que los agentes son optimizadores a nivel de usuarios que intentan mi-

MODELOS

DE

TRANSPORTE



nimizar el precio de entrega de los bienes enviados, y, por lo tanto, se usa el primer principio de Wardrop para replicar su comportamiento. Este submodelo es un modelo elástico de demanda de transporte expresado como un problema de programación matemática que puede resolverse mediante la típica extensión del algoritmo Frank-Wolfe, tal y como se trata en el Capítulo 11. La asignación de los transportistas se lleva a cabo mediante el uso de una red “percibida” que incluye solamente los pares O-D, los nodos de transbordo y los enlaces asociados considerados por los agentes cuando toman sus decisiones. El submodelo de los transportistas utiliza una descripción completa de las redes reales de transporte. Se supone que los transportistas minimizan sus costes de operación y se modelizan utilizando el segundo principio de Wardrop. Los diagramas de flujo de los transportistas individuales se agregan para obtener los flujos globales en la red. Un enfoque similar fue formulado por Moavenzadeh et al. (1983) para planificar la demanda de transporte entre ciudades en Egipto. En este caso el método se basó en el modelo de equilibrio de transporte simultáneo (METS) (Safwat y Magnanti, 1988), tal y como se trató en el Capítulo 11. A un nivel de análisis superior, puede ser que los modelos macroeconómicos utilizados para generar los niveles totales de oferta y demanda y, en algunos casos la matriz de flujos, utilicen costes de transporte que son inconsistentes con los generados en otras partes del modelo. Consiguientemente, cuando se emplean estos modelos de forma secuencial con un modelo detallado de red de mercancías, es posible que los dos no converjan a soluciones estables. Harker (1985) ha formulado un modelo denominado de equilibrio de precio espacial generalizado (MEPEG) que enlaza los conceptos de los procesos espaciales y el equilibrio entre agentes y transportistas para predecir simultáneamente: • • • •

la producción y el consumo de los bienes; la ruta elegida por los agentes de la carga; la tarifa de transporte, y la ruta elegida por el transportista.

Se ha desarrollado una variante del algoritmo de Frank-Wolfe para resolver una implementación particular de este problema y se ha aplicado a un problema a gran escala (con aproximadamente 3.560 nodos y 14.600 arcos) que concierne a la economía del carbón en Estados Unidos.



Otros tópicos de interés

13.1.5. Enfoques desagregados Desde que se desarrollaron los modelos de elección discreta y su aplicación para modelizar la demanda de viajeros, la idea de ampliarlos para incluir los movimientos de mercancías ha ganado en importancia; véase por ejemplo, Gray (1982) y Van Es (1982). En el caso de las mercancías, la demanda de transporte se analiza bajo la óptica de realizar un número de envíos individuales, cada uno con sus propias características, para los cuales el agente que organiza el transporte tiene que tomar un número determinado de decisiones. Cada decisión se contempla como una elección entre un conjunto discreto de alternativas. En cada caso existen un número de elecciones relacionadas, por ejemplo: transportar x toneladas en el tiempo t del bien k mediante el modo de transporte m desde el origen i hasta el destino j. Posteriormente el transportista tiene que elegir la ruta para llevar a cabo esta tarea. La flexibilidad general de los modelos de elección discreta permite la construcción de funciones de utilidad muy generales para este tipo de elecciones. Pueden incluir, por ejemplo: • las características de los servicios de transporte: tarifas, tiempos, fiabilidad, daños y pérdidas, pedidos mínimos, etcétera; • los atributos de los bienes transportados: tipo de producto, relación volumen/peso, relación valor/peso, si son perecederos o no, sistema de inventario y propiedad; • las características del mercado: precios relativos, tamaño de empresas, disponibilidad de instalaciones de carga y descarga, infraestructura general; • los atributos de la empresa agente de carga, esto es, su nivel de producción, precios de venta, localización, instalaciones de infraestructura disponibles, política de almacenamiento, etcétera. Se ha encontrado que este tipo de enfoque tiene poca aplicación a escala nacional. Las principales razones son el conocimiento más limitado de todos los elementos implicados en el desarrollo de estas funciones de utilidades y los grandes esfuerzos necesarios en la recogida de datos para estimar esta clase de modelos. Sin embargo, su aplicación a submercados o mercancías particulares puede proporcionar ideas muy valiosas para la formulación de políticas. Por ejemplo, Ortúzar (1989) utilizó datos de preferencias declaradas para examinar la cuestión de ofrecer un nuevo servicio (contenedores refrigerados) para el transporte

MODELOS

DE

TRANSPORTE



marítimo internacional de carga. Fowkes y Tweddle (2000) también han empleado este tipo de enfoque. Los esfuerzos futuros en esta dirección probablemente serán fructíferos tanto desde el punto de vista de la investigación como en la práctica.

13.1.6.

Algunos aspectos prácticos

A pesar de los esfuerzos realizados en los últimos años, la modelización del transporte de mercancías se ha desarrollado menos que la modelización de la demanda de pasajeros. La vanguardia en investigación y desarrollo parece estar en la prognosis de la demanda de viajeros, y el transporte de carga sigue sus pasos intentando adaptar los modelos a sus necesidades particulares. Los problemas de recopilación de datos pueden agravarse en el caso del transporte de mercancías. Por ejemplo, para el enfoque desagregado la recogida de datos sufre problemas de confidencialidad y fiabilidad. Incluso, para el enfoque agregado la recolección de datos representa un esfuerzo mucho mayor que en el caso de pasajeros debido a la gran dispersión de empresas y a las importantes variaciones diarias y estacionales. Asimismo, son limitadas las oportunidades de realizar entrevistas a la orilla de la carretera, excepto en lugares donde sean inevitables demoras significativas (esperando un ferry, por ejemplo). En algunos casos, como en los viajes internacionales, puede ser ventajoso recoger datos en aduanas o utilizar la información de las hojas de ruta de los conductores. Ejemplo 13.1: Tamin y Willumsen (1988) estimaron tres tipos de modelos agregados para la isla de Bali, Indonesia: un modelo gravitacional (GR), uno de oportunidades intervinientes (OP) y uno combinado (GO). Todos ellos fueron estimados para cinco tipos diferentes de bienes pero sólo se utilizaron conteos de tráfico. Las matrices de mercancías resultantes se compararon posteriormente con las observadas en una gran encuesta efectuada en la isla. Se descubrió que aunque el modelo GO funcionó un poco mejor que el gravitacional, la ganancia de exactitud no compensaba el mayor esfuerzo computacional. El modelo GR calibrado de esta forma fue capaz de discriminar entre los cinco grupos de bienes, obteniendo un valor de β diferente para cada uno. Este modelo resultó muy superior a la simple aplicación del método de factor de crecimiento de Furness. Para más detalles véase Tamin y Willumsen (1992). Dado que los modelos simplificados utilizan datos a bajo coste recogidos de forma regular (conteos de tráfico), puede ser posible hacerlos funcionar lo



Otros tópicos de interés

suficientemente a menudo como para actualizar pronósticos y sugerir medidas correctoras para los planes, es decir, ofrecen la posibilidad de implantar un sistema de planificación continuada. En el caso de modelizar mercancías en el ámbito urbano lo normal es utilizar métodos muy sencillos. Normalmente se basan en modelos de movimientos de vehículos ignorando los bienes transportados, el tipo de localidad servida y las actividades económicas subyacentes que originan esta demanda. A menudo se considera suficiente obtener una matriz de vehículos comerciales usando entrevistas realizadas a la orilla de la carretera (en puntos cordón y líneas pantalla) y después expandirla hasta el horizonte de planificación mediante métodos de factor de crecimiento.

13.2. 13.2.1.

PREVISIÓN DE VARIABLES DE PLANIFICACIÓN Introducción

Tal y como se trató en el Capítulo 1, los modelizadores siempre distinguen entre variables endógenas, es decir, las que deben pronosticarse como parte del ejercicio de modelización, como por ejemplo los flujos, y las exógenas o variables independientes. Estas últimas son necesarias para ejecutar los modelos pero se supone que se originan de forma externa a los propios modelos. Algunos ejemplos típicos de dichas variables en el campo del transporte son, la población, el empleo, la posesión de coche y los ingresos. Los valores de estas variables deben proporcionarse para el año base y para cada uno de los años en los que se requiera realizar prognosis a partir de modelos de transporte. El nivel de detalle y de desagregación necesario para estas variables depende del tipo de modelo utilizado. En términos generales, un modelo de demanda agregado tiene menos requisitos en este sentido que un modelo desagregado. Por ejemplo, al nivel de la generación de viajes un modelo agregado de regresión lineal, basado en zonas, podría solamente necesitar datos de población, posesión de coches e ingresos medios por zona; sin embargo, un modelo de clasificación múltiple o de análisis de categorías necesitaría el número de hogares en cada categoría, siendo lo típico 108 por zona, tal y como se analizó en el Capítulo 4, cuando el modelo se estratifica por ingresos (6 niveles), estructura de hogares (6 niveles) y posesión de coche (3 niveles). La importancia de estas variables en relación a cómo influyen en la exactitud de todo el ejercicio de modelización es muy elevada, tal y como compro-

MODELOS

DE

TRANSPORTE



baron Mackinder y Evans (1981) en un ensayo sobre 44 estudios de transporte urbano en Gran Bretaña. Se descubrió que todos los modelos sobreestimaban algunos indicadores clave de rendimiento, pero el aspecto más importante en la explicación de esta sobreestimación eran los errores en los valores empleados para las variables de planificación. De hecho, los errores de especificación jugaban un papel de bastante menor relevancia en las inexactitudes globales. Es interesante resaltar que las variables de planificación eran frecuentemente erróneas porque se basaban en las previsiones globales oficiales que también estaban equivocadas. Llegados a este punto, cabe preguntarse: ¿cómo se pueden reducir al máximo posible los errores en estas variables de planificación? Éste es un problema difícil que no tiene una respuesta única o sencilla. Queda fuera del alcance de este libro una discusión completa de las técnicas disponibles para realizar previsiones de estas variables, pero se recomienda que el lector consulte a England et al. (1985) para métodos prácticos. No obstante, a continuación se procede a discutir algunas de las ideas que subyacen a estas técnicas para evaluar sus ventajas y desventajas.

13.2.2.

Utilización de previsiones oficiales

La alternativa aparentemente más simple para tratar con variables de planificación es utilizar previsiones oficiales. En el Reino Unido, por ejemplo, existen estimaciones a nivel de ayuntamiento local de: • población, hogares, empleados residentes y empleos; • número de viviendas que disponen de 0, 1 y 2 o más coches; • destinos de viajes en vehículo privado según motivo de viaje. A veces el Departamento de Transporte también produce previsiones de la demanda futura expresada como vehículos-kilómetro esperados según tipo de vehículo. Otras instituciones oficiales proporcionarían otros tipos de previsiones para las variables de planificación, por lo menos a un nivel altamente agregado. Por supuesto, estas previsiones normalmente no están a un nivel lo suficientemente desagregado como para ser útiles directamente en un ejercicio de modelización detallado; sin embargo, reducen la cantidad de trabajo necesario para generar los valores requeridos de las variables de planificación a nivel zonal. En el epígrafe siguiente se discuten algunas de las técnicas para lograr esto.



Otros tópicos de interés

Hasta cierto punto, el problema de utilizar previsiones oficiales es que a veces reflejan el efecto esperado de políticas económicas y regionales cuyo éxito puede depender de otros factores incontrolables como el comercio y la cooperación internacional. Mackinder y Evans (1981) encontraron que los errores en las previsiones de esos indicadores globales estaban detrás del problema de los errores en las variables de planificación a nivel local. Se volverá a este problema más adelante. ¿Cómo se pueden realizar previsiones de actividad de transporte con exactitud si hay errores significativos en algunos de los datos clave utilizados en nuestros modelos de transporte?

13.2.3. Previsiones de la población y el empleo Siempre y cuando no se proporcionen estas variables de planificación para las ciudades o distritos, el equipo de planificación tendrá que desarrollar métodos para estimarlas. Existen varios métodos disponibles, algunos más apropiados que otros para cada aplicación particular. 13.2.3.1.

Extrapolación mediante tendencias

La extrapolación directa de las tendencias actuales es el procedimiento más sencillo pero menos satisfactorio, incluso cuando sólo se aplica a nivel del área de estudio completa. No tiene en cuenta las decisiones ya tomadas acerca de la disponibilidad de suelo para desarrollos futuros; no evalúa las nuevas políticas de desarrollo regional ni tampoco considera el crecimiento esperado en el empleo en la zona del estudio. Además, no proporciona ninguna información acerca de la estructura etérea de la población y ello es un elemento importante en la modelización de la generación de viajes. 13.2.3.2.

Supervivencia de cohorte

Una técnica de análisis más detallada considera los fallecimientos, nacimientos y la migración dentro y fuera del área del estudio, Pt1 = Pt0 + Bt0t1 – Dt0t1 + NIt0t1 donde Pt1 es la población en el momento t1; Pt0 es la población en el momento t0; Bt0t1 son los nacidos que han sobrevivido en el período t0 a t1;

(13.6)

MODELOS

DE

TRANSPORTE



Dt0t1 son los fallecimientos en el mismo período; NIt0t1 es la inmigración neta en el mismo período. Utilizada de esta forma tan agregada, la ecuación (13.6) ignora la estructura etaria de la población y puede subestimar o sobreestimar, por ejemplo, las correspondientes tasas de fertilidad. Por esta razón este método normalmente se aplica a subgrupos de población o cohortes, convirtiéndose en el enfoque de supervivencia de cohortes. Esto implica los siguientes pasos: 1. La población se separa en cohortes; los hombres se separan de las mujeres y cada grupo sexual se divide en estratos de edades (normalmente de 5 años); esto determina la estructura de la población en el año base. 2. A continuación se aplican las tasas de fertilidad a las mujeres en edad de tener niños. 3. Los recién nacidos de distinto sexo conforman la primera cohorte para la siguiente ronda de cálculos. 4. Se aplican las tasas de supervivencia por sexo a todas las cohortes comenzando con la generación más joven; los supervivientes envejecen y se mueven hacia la siguiente cohorte. 5. El proceso se repite desde la etapa 2 hasta alcanzar el período de previsión. Si se incluye la migración de la población en las previsiones, se requiere información adicional sobre la estructura etaria y sexual de los inmigrantes. Es fácil adaptar el método para incluir estos nuevos datos. La información que demanda esta técnica incluye el número inicial de personas, la estructura de sexo/edad de la población y sus tasas de supervivencia, fertilidad y migración. 13.2.3.3. Probabilidades de transición Una interesante alternativa a los métodos de supervivencia de cohortes es seguir ciclos familiares y emplear probabilidades de transición que reflejen las posibilidades de movimiento de una etapa en el ciclo a otra; por ejemplo, desde pareja casada sin niños a pareja casada con un niño menor en edad escolar, y desde entonces a pareja casada con dos niños, etc. Entonces se construye una matriz completa de probabilidades de transición que se puede procesar para obtener la población en hogares que estén en diferentes etapas del ciclo familiar en los años de prognosis. Este enfoque ofrece el potencial de proporcionar una



Otros tópicos de interés

cuenta bastante detallada del crecimiento de la población al nivel requerido para modelizar la generación de viajes. Sin embargo, la inseguridad acerca de la estimación y estabilidad de las probabilidades de transición probablemente sea mayor que la asociada a las tasas de fertilidad y migración en los métodos de supervivencia de cohortes. Tanto el método de supervivencia de cohortes como las probabilidades de transición pueden adaptarse de forma útil a un marco de planificación continua, en el que los datos recogidos periódicamente sobre tasas de fertilidad, migración y supervivencia y/o las probabilidades de cambios de estatus en el ciclo familiar, permitan poner al día las estimaciones previas de la futura población y de esta forma los cambios en las tasas de generación de viajes, etcétera. Los problemas encontrados cuando se pronostican cambios en el empleo son similares. Las tendencias generales de empleo dependen de la política económica, del comercio internacional y de los incentivos regionales. A un nivel más local toman un papel importante aspectos como la disponibilidad del terreno y de mano de obra cualificada en el área de estudio, así como el tipo de actividad económica prevaleciente. Además, el tipo y los niveles de empleo también juegan un papel clave a la hora de determinar los niveles de ingreso disponible en los hogares del área de estudio, lo cual influye en la posesión de coche y en el comportamiento respecto a viajes. 13.2.3.4.

Base económica

En la prognosis del empleo es preciso distinguir entre actividades básicas y no básicas. Las últimas son aquellas que se crean en respuesta a las demandas locales mientras que las actividades básicas son aquellas que requieren algún tipo de estímulo externo; éstas producen bienes o servicios que son exportados a otras áreas o regiones. Las no básicas producen bienes y servicios que atienden a las necesidades de la población local. Se sostiene que el crecimiento de las actividades básicas crea actividades adicionales no básicas (tiendas, bancos, servicios, etc.) para satisfacer las necesidades de población adicional. Las actividades básicas de una región constituyen su base económica y si se hacen más fuertes darán lugar al crecimiento económico, del empleo y de la población. 13.2.3.5. Análisis insumo-producto Finalmente, en la prognosis del crecimiento de una actividad en particular debe observarse el crecimiento concomitante que genera en otras industrias que le provean insumos. Algunas tendrán su base fuera del área de estudio mientras

MODELOS

DE

TRANSPORTE



que otras se localizarán dentro. El uso de una matriz insumo-producto es el método tradicional para seguir estos enlaces a nivel nacional o regional. Tal matriz muestra la cantidad de insumos desde otros sectores de la economía que son necesarios para incrementar la producción de una actividad en particular. Es cuestionable la disponibilidad de estas matrices a nivel local; el nivel más bajo de desagregación parece ser el regional.

13.2.4.

Localización espacial de población y empleo

Una vez estimados la población y el empleo (en diferentes subgrupos) para el área de estudio, hace falta localizarlos en zonas específicas para aplicar los modelos de transporte. Este trabajo normalmente se lleva a cabo en conjunción con las autoridades locales de planificación, quienes han establecido planes para el desarrollo futuro y la re-asignación de usos del suelo para las zonas del área de estudio. En este proceso son útiles los pronósticos específicos de edad o ciclo de vida, ya que diferentes tipos de urbanizaciones van a atraer a diferentes tipos de familias. La localización del empleo depende de su propia naturaleza; por ejemplo, desarrollos industriales, servicios comerciales, etc. Los cambios importantes en la localización de actividades probablemente deberían discutirse con los organismos encargados de llevarlos a cabo. Los desarrollos industriales pueden necesitar lugares especiales, un buen suministro de agua y acceso a importantes carreteras, terminales de ferrocarril o puertos. En ausencia de controles restrictivos de planificación, el empleo en oficinas tiende a localizarse cerca de buenas instalaciones de comunicación y lo más cerca posible de otros desarrollos de oficinas. Estos dos ejemplos muestran que en el análisis final la localización de población y empleo no es independiente del sistema de transportes. Los cambios de accesibilidad probablemente afectarán al potencial de desarrollo en diferentes partes del área de estudio. Esto puede tenerse en cuenta durante las discusiones con las autoridades de planificación o, de manera más formal, en un modelo más completo, tal y como se esboza en el epígrafe siguiente. En resumen, la asignación de población y empleo a zonas, normalmente requiere una combinación de modelos formales y discusiones con las autoridades de planificación. Las formas prácticas en que se llevan a cabo estas tareas son básicamente aproximaciones heurísticas y elecciones contexto-dependientes. Parece difícil eliminar la falta de precisión actual acerca de los pronósticos na-



Otros tópicos de interés

cionales, regionales y locales para estas variables de planificación y esto tiene importantes implicaciones para todo el proceso de planificación.

13.2.5. Uso de suelo y modelización del transporte Un método interesante para la prognosis de la población y el empleo y su asignación a zonas, consiste en internalizar las variables de planificación exógenas en un modelo integrado de uso del suelo y transporte. Éste ha sido un campo de investigación muy activo desde principios de los años sesenta; ver por ejemplo MacLoughlin (1969), Wilson et al. (1977) y Foot (1981). No obstante, después de un período inicial de declarado optimismo acerca del éxito de estos modelos, los investigadores se han vuelto más modestos en sus aspiraciones al respecto (véase Mackett, 1985). La interacción entre transporte y uso del suelo tiene doble importancia; en primer lugar, si las estrategias de transporte cambian la accesibilidad de forma significativa, cambiará la demanda por suelo generando nuevos desarrollos en algunos lugares; posteriormente, esto afectará a los patrones de viajes (matrices de viajes) y, por lo tanto, tendrá un impacto sobre el rendimiento del sistema de transportes. En segundo lugar, los cambios en el atractivo de algunos lugares afectarán al valor de su suelo; esto se puede interpretar como la capitalización de beneficios a usuario en los precios de suelo e implicará una transferencia de beneficios a los propietarios. El tema de la capitalización plantea la pregunta de quién gana y quién pierde como consecuencia de un plan de transporte, y cómo las autoridades locales pueden recuperar, de los propietarios, una parte del incremento en los precios del suelo. 13.2.5.1.

Modelo de Lowry

Muchas de las aplicaciones prácticas utilizadas en el pasado han seguido las líneas adelantadas por Lowry (1965) en los años sesenta. Su modelo considera las características espaciales de un área urbana de acuerdo a tres sectores de actividad: empleo en industrias básicas, empleo en industrias que sirven a la población y el sector de hogares o población. El modelo de Lowry comienza con la asignación a zonas del empleo básico que es especificado de forma exógena; a continuación, la distribución espacial de los hogares y el empleo no básico se asignan utilizando relaciones endógenas. Además, existen restricciones en el número máximo de hogares de cada zona (según las normativas locales) y en los umbrales de empleo en el sector

MODELOS

DE



TRANSPORTE

servicios para cada zona; se supone que los diferentes tipos de empleo en el sector de los servicios tienen diferentes umbrales mínimos de viabilidad en cualquiera de las zonas. Las ecuaciones básicas del modelo de Lowry pueden escribirse así: P = EA

(13.7)

ES = PB

(13.8)

E = Eb + ES

(13.9)

donde P es un vector de población en cada zona i. E es un vector de filas para el empleo total en cada zona i. Eb y ES son vectores de fila para el empleo básico y no básico (servicios) en cada zona i. A y B son matrices zona-a-zona de accesibilidad lugar de trabajo-vivienda y vivienda-centro de servicios. Las variables de accesibilidad tienen dos componentes, la primera corresponde a la tasa de participación en cada zona (hogares por empleado para A y empleo en servicios por hogar para B) y la segunda corresponde a índices adecuados de accesibilidad. Normalmente se calculan como:

Aija 

E j exp(  Cij )

¤ E exp(  C ) j

(13.10)

ij

ij

B'ij  E Sj exp (  Cij )¤ E Sj exp (  Cij )

(13.11)

ij

las cuales son índices de accesibilidad derivadas directamente del modelo gravitacional; véase el Capítulo 5. Lowry (1965) propuso una solución secuencial a este problema que incluye las restricciones y los umbrales mencionados anteriormente. Esfuerzos de investigación más recientes han enfatizado la solución simultánea del modelo y sus extensiones. La mayoría de estas últimas tienen que ver con una desagregación adicional en función de diferentes tipos de personas y hogares y su tratamiento espacial. Por ejemplo, ciertos tipos de personas estarán más dispuestos a pagar



Otros tópicos de interés

que otros por un incremento de accesibilidad, lo cual influye en los precios del terreno y en el tipo de desarrollo que se lleve a cabo en diferentes zonas. El modelo integrado de uso del suelo y transporte ha sido informatizado en diversos programas disponibles en el mercado. Para asegurarse de que el modelo sea tratable, se requiere cierto compromiso en el nivel de detalle de la parte correspondiente al modelo de transporte; la esperanza es que lo que se pierde en riqueza de la representación del transporte se compense ampliamente por las ganancias en la prognosis del empleo, población y localización de hogares en el área del estudio. Sin embargo, un inconveniente importante de estos modelos es que pueden sufrir gravemente de problemas de convergencia debido a sus mecanismos de equilibrio extremadamente complejos. Para comparar las diferentes implantaciones y extensiones de este enfoque, se dirige al lector a Webster et al. (1988). 13.2.5.2.

El modelo puja-elección (bid-choice)

Un enfoque más contemporáneo ha sido el adelantado por Martínez (1991), el cual sigue dos líneas de modelización. La primera, propuesta originalmente por Alonso (1964), es un modelo de oferta: el terreno se asigna al que presenta la mayor puja. La proporción Ph/i de clientes tipo h que hacen una puja ganadora para un lugar i dado, depende de si la disponibilidad a pagar de h DAPhi, es la más alta entre los pujadores g ū H. La suposición de que DAPhi es una función de los atributos de la parcela y el pujador, más un término de error distribuido IID Gumbel, lleva a una expresión tipo MNL:

Ph / i 

H h exp (  DAPhi ) ¤ g H g exp ( DAPgi )

(13.12)

donde μ es el parámetro de escala usual de la distribución del error. El precio de mercado esperado pi es igual a la puja mínima esperada de los compradores potenciales, dado por

« º pi  (1 /  ) log ¬¤ H g exp (  DAPgi ) » ­ g ¼

(13.13)

La segunda línea de modelización es un modelo de maximización de los excedentes del consumidor, o modelo de elección, derivado de la teoría de maximización de la utilidad siguiendo a Anas (1982). Los excedentes del con-

MODELOS

DE



TRANSPORTE

sumidor CShi del individuo h al elegir el lugar i corresponden a la diferencia entre su disponibilidad a pagar y el precio del lote:

CShi =DAPhi pi Bajo algunas suposiciones simplificadoras la proporción Ph/i de consumidores h que eligen el lugar i viene dada por:

Ph / i 

Si exp ¨ª   DAPhi pi ·¹ ¤ S j exp ¨ª   DAPhj p j ·¹

(13.14)

j

Martínez (1991) posteriormente comprobó que la distribución de hogares y empresas obtenida del modelo de pujas en las ecuaciones (13.12) y (13.13) es idéntica a la que se obtiene de la versión de elección en la ecuación (13.14). Su modelo de puja-elección se resume en estas ecuaciones que pueden simplificarse aún más cuando se utilizan a nivel agregado. El sistema de transporte se representa en este modelo mediante funciones idóneas de accesibilidad (a destinos) y de atracción (respeto a los orígenes). La tarea siguiente es la de especificar las funciones DAP; esto debe hacerse más o menos caso a caso, ya que la mejor función dependerá de la disponibilidad de datos. Estos modelos son potentes y flexibles. Responden a una necesidad urgente de observar más de cerca temas como la interacción del transporte con el uso del suelo, la recuperación de excedentes y la redistribución de los beneficios, además de los cambios en las formas de realizar viajes. La amplia disponibilidad de programas generales de estimación ha permitido el desarrollo de estos modelos y su aplicación creciente a problemas prácticos. Se ha discutido que este tipo de modelos probablemente funcionaría mejor si existiesen menos restricciones en el mercado del suelo y en el tipo de desarrollos permitidos por las autoridades locales. Probablemente es el caso de varios países en vías de desarrollo, tal y como informa Chadwick (1987). Sin embargo, como se ha analizado en este apartado, la prognosis de las variables de planificación no es nada exacta y su internalización en un modelo integrado del uso del suelo y el transporte probablemente no va a hacerlo más fiable ni robusto. A juicio de los autores de este libro, el grado de comprensión acerca de este tema es probablemente incluso más limitado que el del sector únicamente de transporte. Este problema resalta de nuevo las ventajas de un



Otros tópicos de interés

enfoque de planificación continua, donde la puesta al día de forma regular de las previsiones y planes reduce el riesgo de prognosis inexactas.

13.3. PREDICCIÓN DE LA TASA DE MOTORIZACIÓN 13.3.1.

Introducción

Aunque el número total de coches privados activos en las carreteras de los países industrializados casi se dobló entre 1970 y 1986 (véase, por ejemplo, de Jong, 1989), la tasa de crecimiento fue, en este período, dramáticamente más alta en los países en proceso de desarrollo. Por ejemplo, la caída en los impuestos a la importación para los coches pequeños por debajo de 850 cc en Chile (desde 120 a sólo el 10%) en 1977, implicó que la tasa de motorización promedio en Santiago subiera en más del 100% en sólo 5 años (véase Fernández et al., 1983). Aun si el kilometraje anual por vehículo hubiera permanecido constante durante este período, debe apreciarse que el incremento total en pasajeros-kilómetro en coche representó un alto coste a la sociedad en términos de accidentes, combustible, contaminación, congestión de tráfico así como costes adicionales en construcción de carreteras y su mantenimiento. Un problema al que tienen que enfrentarse los planificadores de diferentes naciones es que las previsiones sobre el número de coches y/o vehículoskilómetros para, por ejemplo, el año 2010, implican que estos efectos adversos puedan adquirir proporciones catastróficas. De hecho a finales de los 80 ya había ciudades como Atenas, Los Ángeles, Méjico, Santiago, Seúl y Tokio que tenían pésima fama por sus problemas de congestión y contaminación. Los modelos que pronostican cambios en la tasa de motorización, constituyen un insumo esencial de la planificación del transporte y se han venido desarrollando desde principios de los años 40. Por lo general, se puede decir que estos esfuerzos se han realizado con los tres motivos diferentes que se muestran a continuación: • Estudios de mercado para fabricantes de vehículos y empresas de combustible, que no son de interés directo para los modelizadores de transporte, ya que se preocupan más de los atributos del vehículo tales como tamaño, capacidad de motor, etcétera. • Estudios promocionados por los gobiernos con el objetivo de determinar las necesidades de nuevas infraestructuras (principalmente, carreteras) a nivel nacional; hasta finales de los 70 se utilizaban modelos simples de seriestemporales para este fin.

MODELOS

DE

TRANSPORTE



• Estudios locales, que normalmente forman parte de estudios de transporte estratégicos y que han utilizado métodos econométricos más avanzados con datos de corte transversal y/o longitudinales. No se va a intentar abarcar aquí todos los aspectos del problema de previsión de la tasa de motorización, ya que se han dedicado libros completos al tema (véase, por ejemplo, Mogridge, 1983; Train, 1986). En este epígrafe se van a tratar, de forma breve, los dos métodos básicos siguientes: • Extrapolaciones de series-temporales que emplean datos agregados a niveles nacional y regional (básicamente, el trabajo de John Tanner en el Transport and Road Research Laboratory, del gobierno británico). • Métodos econométricos que utilizan datos desagregados a nivel de hogar, ya que se ha razonado que la decisión de adquirir un coche no puede modelizarse de forma correcta estrictamente a un nivel individual ni a un nivel zonal (véase, por ejemplo, Bates et al., 1978). Los métodos modernos a veces incorporan parte de ambos enfoques y extienden sus estimaciones también al uso de coches. Críticas a éstos y otros métodos han sido realizadas por Button et al. (1982) y de Jong (1989).

13.3.2.

Extrapolaciones mediante series-temporales

Parece claro que la tasa de motorización (por ejemplo, coches/individuo) no debería incrementarse de forma indefinida con el tiempo (es decir, por lo general la gente que posee carnet de conducir no tiene varios coches por persona); por esta razón las curvas de incremento normalmente presentadas para modelizar este fenómeno tienen forma de S. Si el número de coches/persona en EE.UU. y en el Reino Unido se grafican contra el tiempo, se consiguen aproximadamente las formas mostradas en la figura 13.1. Una curva que ha resultado popular en este campo ha sido la logística, promovida por Tanner (1978). Para ajustarla se necesitan los tres parámetros siguientes: C0, tasa de motorización en el año base (coches/persona); g0, tasa de incremento en la tasa de motorización en el año base, dada por 1 dc evaluada en t = 0; C dt S, nivel de saturación de la tasa de motorización.



Otros tópicos de interés

EE.UU. Coches por persona

0,5 0,4

Reino Unido

0,3 0,2 0,1 0 1950

1960

1970

1980 85 1988

Año

Figura 13.1.

Curva del incremento en la posesión de coches.

En curvas logísticas se tiene que:

dC  aCt ( S Ct ) dt

(13.15)

donde a es una constante. Solucionando esta ecuación diferencial se obtiene:

Ct 

S 1 b exp ( aSt )

(13.16)

donde b es una constante de integración. Para encontrar los valores de a y b se puede recurrir a las condiciones de borde para t = 0; a partir de (13.15) y (13.16) se obtiene respectivamente:

g 0  a ( S C 0 ) y C0 

S 1 b

y sustituyendo estos valores en (13.16) finalmente se obtiene:

Ct 

S ¨ S C0 · ¨ g 0 St · 1 © ¸ exp © ¸ ª C0 ¹ ª S C0 ¹

(13.17)

Por lo tanto, el conocimiento de C0 y g0 para un año tomado como base permite extrapolar Ct para cualquier año futuro si se conoce S; sin embargo, S no se conoce y ha de estimarse. El método de Tanner consiste en ajustar la siguiente recta de regresión (véase la figura 13.2):

MODELOS

DE



TRANSPORTE

g = α + βCt

% incremento coches/persona (g)

Por definición, la saturación corresponde al momento en el que la tasa de cambio en el número de coches por persona (g) es cero: en este caso se obtiene S = –α/β, y como se espera que α sea positivo y β menor que cero, se puede deducir que S > 0.

* * * *

* *

*

* * **

*

*

* **

*

*

* S

Coches/persona

Figura 13.2. Determinación del nivel de saturación.

Desafortunadamente si se construye el gráfico de la figura 13.2 con datos de EE.UU. y el Reino Unido se obtiene lo que se muestra en la figura 13.3; esto implica que el método podría funcionar en el segundo caso pero es mucho más dudoso en el primero. Este método ha sido muy criticado por Button et al. (1982). Con estos datos, Tanner (1974) calculó S = 0,45 para Gran Bretaña. En la tabla 13.1 se comparan las previsiones para 1975 realizadas en años diferentes, con el número realmente observado de 0,25 coches/persona en aquel año. Tal y como se puede observar, el método no es muy fiable. En resumen, las principales objeciones al método de extrapolación logística son las siguientes: 1. El modelo no es sensible a las variables políticas. Por ejemplo es imposible estudiar los efectos que tienen los cambios en los precios de coches, el



Incremento porcentual

Otros tópicos de interés

14 12 10 8 6 4 2 0

EE.UU.

*

* Reino Unido * ************ ** * * ** 0

0,1

0,2

0,3

0,4

0,5

0,6

Coches/persona

Figura 13.3. Tasas de saturación para EE.UU. y Reino Unido.

Tabla 13.1. Año base

Errores de previsión utilizando extrapolación Coches por persona

Crecimiento previsto

En el año base

Previsto para 1975

Crecimiento actual

1960

0,11

0,28

1,14

1964 1966 1968 1969 1971 1972

0,16 0,18 0,20 0,21 0,22 0,23

0,32 0,31 0,30 0,28 0,27 0,26

1,57 1,67 1,84 1,66 1,62 1,48

impuesto de circulación, los impuestos de importación, el precio del combustible, etc. sobre la propiedad de coches. El método tampoco considera la influencia de variables económicas; por lo tanto, si la correlación entre estas variables cambia con el tiempo pueden obtenerse resultados perversos (por ejemplo, considérese el efecto del incremento en la propiedad de coches producido por la crisis del petróleo en 1973, o el efecto mencionado anteriormente de la reducción de impuestos en Chile). 2. S se supone constante; sin embargo, puede que esto en la práctica no sea así, ya que las actitudes suelen cambiar con el tiempo. 3. El modelo no produce información sobre diferentes tipos de coches o, aún más importante para la planificación, sobre la proporción de personas que pertenecen a hogares con 0, 1, y 2 o más coches.

MODELOS

DE



TRANSPORTE

13.3.3. Métodos econométricos Estos métodos intentan explicar el comportamiento de los viajeros de forma directa en vez de observar las tendencias generales, y normalmente utilizan datos para un instante de tiempo. Se procede a examinar solamente dos métodos; para una revisión más amplia, véase de Jong (1989). 13.3.3.1.

Método de Quarmby y Bates (1970)

Este método utiliza solamente dos variables independientes, los ingresos y la densidad residencial, aunque reconoce la existencia de otros factores de interés como el tamaño del hogar y el precio de los vehículos. Las relaciones básicas del modelo son:

P0 1 P0 P2 P1

 A0 I

bo

D

c0

 a1 exp ( b1 I ) D

(13.18)

c1

P0 P1 P2  1

(13.19) (13.20)

donde I es el ingreso anual por hogar (miles de $), D es el número de residentes por acre y Pi la probabilidad de tener 0, 1, y 2 o más coches; ai, bi y ci son parámetros a estimar. Sustituyendo P1 de (13.20) en (13.19) y tomando logaritmos se obtiene:

log

P2  log a1 b1 I c1 log D 1 P0 P2

(13.21)

entonces, ya que D es una variable discreta para cualquier segmento dado, se puede considerar como constante y (13.21) se reduce a:

log

P2  b1 I constante 1 P0 P2

Es instructivo tener en cuenta que mientras suben los ingresos (I), también sube el lado izquierdo de la ecuación (13.21); por tanto se puede deducir que (1 – P0 – P2) tiende a cero o lo que es lo mismo, P2 tiende a (1 – P0). Sin embar-



Otros tópicos de interés

go, ya que P0 es casi cero para los ingresos altos, significaría que P2 tendería a 1 y obviamente esto no es correcto ya que se esperaría un límite menor. Este nivel superior o nivel de saturación (S) de P2, puede incorporarse al modelo mediante el ajuste de (13.21), resultando:

log

P2  log a1 b1 I c1 log D S (1 P0 ) P2

(13.22)

donde S debe determinarse de forma empírica; ahora, como esto es complicado en la práctica, el procedimiento normal implica la prueba de diferentes valores mediante un análisis de sensibilidad. En la figura 13.4 se ilustran los tipos de curva que produce este método. Pi 1 P2

S

P1 P0 Ingreso

Figura 13.4. Tasa de motorización respecto a ingresos.

Ejemplo 13.2: teniendo en cuenta los datos de la siguiente tabla y suponiendo un valor de S = 0,78, calcular los parámetros de los modelos de Quarmby y Bates para un valor fijo de densidad residencial. Ingreso

P0

P1

P2

1 2 3 4 5 6

0,61 0,35 0,22 0,16 0,10 0,08

0,34 0,47 0,44 0,37 0,30 0,24

0,05 0,18 0,34 0,47 0,60 0,68

MODELOS

DE



TRANSPORTE

Si se toma el logaritmo de (13.18) para D fijo (ya que c0 no tiene interés) se obtiene:

log

P0  log a0 b0 log I 1 P0

y ajustando una recta de regresión a los datos se obtiene a0 = 1,74 y b0 = 1,60. Por otra parte, si se sustituye S en la ecuación (13.22) para la constante D, se consigue:

log

P2  loga1 b1 I 0, 78(1 P0 ) P2

y ajustando otra recta de regresión a los datos, finalmente se obtiene a1 = 0,10 y b1 = 0,84. 13.3.3.2.

Método del modelo regional de transporte por carreteras (MRTC) (Bates et al., 1978)

Este método combina las mejores propiedades y características de los dos enfoques anteriores. En primer lugar, es necesario definir las siguientes variables: P(1+) = % de hogares con uno o más coches, con un nivel de saturación de S(1+); P(2+) = % de hogares con dos o más coches, con un nivel de saturación de S(2+). Por lo tanto, las ecuaciones del método anterior pueden derivarse como:

P0  1 P (1 ) P1  P (1 ) P (2 ) P2  P (2 ) pero debe destacarse que los niveles de saturación son diferentes a los de Tanner. El modelo entonces presenta la siguiente forma:

Pt (1 ) 

S (1 ) «® ¥ I ´ b1 º® 1 exp ¬ a1 ¦ t µ » ®­ § pt ¶ ®¼

(13.23)



Otros tópicos de interés

Pt (2 ) 

S ( 2 ) «® ¥ I ´ º® 1 exp ¬ a2 b2 ¦ t µ » § pt ¶ ®¼ ­®

(13.24)

donde (It / pt) es el ingreso anual del hogar (€/semana) deflactado por un índice de precios de coches. El modelo se estimó utilizando datos británicos correspondientes al período 1969-75, dando los siguientes valores para los parámetros:

a1  7, 76 b1  2, 26

S (1 )  0, 95

a2  3, 76 b2  0, 04 S (2 )  0, 60 Para realizar estimaciones a futuro es necesario suponer una cierta distribución de ingreso (por ejemplo, del tipo Gamma); también, para convertir los resultados modelizados en coches/persona (Cp) es necesario emplear datos censales. Por ejemplo, Bates et al. (1978) propusieron la siguiente regla de conversión:

C p  P (1 ) 2,17 P (2 ) Finalmente para obtener coches/hogar se requiere información acerca del número medio futuro de personas por hogar. 13.3.3.3.

Modelos de posesión y utilización de coche

Khan y Willumsen (1986) argumentaron que en los países en proceso de desarrollo, el crecimiento de la tasa de motorización (y uso de coches) compromete los futuros recursos en inversiones adicionales en carreteras y su mantenimiento. Insistieron en que la posesión de coche debe considerarse como una variable política más que como un factor exógeno; para apoyar estas ideas, desarrollaron modelos de posesión y uso de coche sensibles a políticas y los estimaron utilizando datos de diferentes países y períodos de tiempo. Estudiaron diversas formas funcionales, de las cuales uno de los modelos más útiles es: log C1.000 = –361 + 70,5 log GNPH – 0,373 log PURTAX – 2,58 log OWNTAX –0,682 log IMPDUTY – 29,4 log FUELPR – 2,04 log POPDEN R2 = 0,86 donde C1.000 es el número de coches por 1.000 habitantes, GNPH es el producto interior bruto por persona, PURTAX es el impuesto de compra asociado a los coches; OWNTAX el impuesto asociado a la propiedad de coche, IMPDUTY

MODELOS

DE



TRANSPORTE

el impuesto de importación de los coches, FUELPR el precio por litro de combustible y POPDEN es la densidad de la población. Se desarrolló un segundo modelo para estimar el kilometraje anual medio por coche, KM/C: log KM/C = 5,76 – 0,434 log GNPH – 0,368 log FUELPR – 0,67 log ROADPOP donde ROADPOP es la longitud de carretera pavimentada per cápita. Finalmente, Khan y Willumsen (1986) desarrollaron también un modelo de “análisis” donde el número total de coches, los coches-km, consumo de combustible, ingresos por impuestos, y costes de inversión en carreteras y su mantenimiento, se calcularon para uno o más años en el futuro. Esto permite comparar políticas alternativas respecto de impuestos de compra-venta e importación y de construcción de carreteras, en términos de los costes implicados para el país. En la figura 13.5 se muestra la estructura general de estos modelos. Costes impuestos

Otros insumos PNB población Modelo de previsión

Uso coche coche-km

Flota de vehículos Otros insumos Modelo de análisis

Gastos en carreteras

Ingresos

Gastos en carreteras Importaciones de combustible

Figura 13.5. Modelo de “análisis” de Khan y Willumsen.

Estos modelos se desarrollaron esencialmente como una herramienta de investigación y análisis de políticas; se necesita añadir más elaboración al modelo para aplicarlo a países específicos. Aunque los modelos se escribieron en FORTRAN son lo suficientemente sencillos como para permitir su uso en cualquier hoja de cálculo.



Otros tópicos de interés

13.3.4.

Comparaciones internacionales

El uso de energía en el sector transporte crece más que en cualquier otro sector de la economía global. De este crecimiento, una proporción importante se origina en los países emergentes. Esto refleja los bajos niveles de tasa de motorización en dichos países y los niveles casi saturados en naciones como EE.UU. Por lo tanto, es importante comprender mejor cómo los incrementos en la riqueza afectan a la posesión y uso del coche y cómo éstos afectarían al consumo de energía y (hasta que el hidrógeno pase a ser el combustible más común) a las emisiones y a la formación de gases invernadero. Dargay y Gatley (1999) han realizado estudios globales sobre el efecto del nivel de ingreso sobre la tasa de motorización, incluyendo comparaciones internacionales como parte de este proceso. Utilizaron datos de ingreso y tasa de motorización para el período 1960 a 1992 de 26 países, desde EE.UU. hasta India y China (pese a que los datos no estuvieron disponibles para todos estos años en todos los países). Posteriormente, investigaron formas funcionales aptas para modelizar la tasa de motorización como función del nivel de ingreso. Después de experimentar con varias formas funcionales, eligieron el modelo Gompertz. La ecuación de Gompertz para la tasa de motorización a largo plazo V * como función del ingreso per cápita I, puede escribirse como:

V *   exp ( e  I )

(13.25)

donde α y β son valores negativos. El parámetro γ define el nivel de saturación, ya que para β < 0:

lim V*  I md El parámetro α especifica el valor de la función en I = 0, es decir:

VI* 0   e Ya que el nivel de saturación γ no puede ser 0, el valor de la función de Gompertz se aproxima a 0 mientras α crece negativamente. La función de Gompertz tiene una elasticidad a largo plazo que puede calcularse mediante la correspondiente diferenciación:

 LR   Ie  I

(13.26)

MODELOS

DE



TRANSPORTE

El nivel de ingreso que produce la máxima elasticidad se obtiene fijando la derivada de la elasticidad en 0:

I ME 

1 

(13.27)

y la máxima elasticidad se define por:

 M   e 1  0, 3678

(13.28)

Dargay y Gatley (1999) reconocen que la tasa de motorización no puede variar instantáneamente; existen efectos de retraso e inercia que deben ser considerados. Ellos postularon un mecanismo simple de ajuste parcial que tendría en cuenta estos retrasos:

Vt  Vt 1  (Vt Vt 1 ) donde θ es la velocidad de ajuste (0 < θ < 1) y Vi es la posesión de coche en el tiempo t. Esto se convierte en:

Vt   exp( e  It ) (1  )Vt 1

(13.29)

Debido a una serie de razones teóricas y prácticas, los autores restringen los valores de α, θ, y γ al mismo valor para todos los países pero permiten que β sea específico para cada país. Entonces el modelo se convierte en:

V jt   exp ( e

 j I jt

) (1  ) V jt 1

(13.30)

donde el subíndice j representa un país determinado. Utilizando sus propias series de datos, encontraron un nivel de saturación común γ = 0,85 vehículos por persona (y 0,65 coches por persona) y un valor de α = –5,9. También encontraron el valor de θ = 0,09, indicando que el 9% de la respuesta total al ingreso se produce en el plazo de un año. Los valores de β varían desde –0,3 hasta –0,2 en diferentes países. A partir del modelo, se puede estimar la máxima elasticidad del ingreso como aproximadamente 2,4 para coches; esto se consigue para niveles de ingreso per cápita de unos $5.000 (dólares de EE.UU. al valor de 1985) para países con β = –0,02.



Otros tópicos de interés

Dado el rango de países en su base de datos, los modelos desarrollados por Dargay y Gately (1999) son bastantes útiles para su aplicación en países diferentes donde se disponga sólo de series temporales limitadas para la previsión de la tasa de motorización.

13.4. 13.4.1.

EL VALOR DEL TIEMPO DE VIAJE Introducción

La pregunta “¿tiene valor el tiempo?” es respondida afirmativamente por casi todo el mundo. Un problema más serio es “¿qué valor?” y bajo qué circunstancias se puede o se debe medir. Este tema ha generado un enorme debate en la literatura (véase, por ejemplo Bruzelius, 1979) sencillamente porque los ahorros de tiempo representan el beneficio más importante en la evaluación de proyectos de mejora del transporte en todo el mundo. Sin embargo y a pesar de su importancia, no se ha logrado un consenso acerca del tamaño y la naturaleza de los valores utilizados en evaluación de los proyectos. No se intentará aquí revisar esta materia en gran detalle, por lo que se remite al lector a los trabajos presentados en Gunn (1985a) para un estudio más amplio. Por ejemplo, en Gran Bretaña (y otros países como Chile) se recomiendan valores de tiempo que corresponden a una proporción fija del salario horario medio. Por otra parte, en EE.UU., se han recomendado valores crecientes en función del intervalo de tiempo ahorrado: 0-5 min., 5-15 min. y 15 o más minutos (AASHTO, 1977). Claramente el uso de funciones de valoración lineal o no lineal debería llevar a diferentes beneficios y, por lo tanto, a diferentes prioridades de inversión. Por ejemplo, la normativa británica tiende a favorecer esquemas que generan pequeños ahorros en el tiempo mientras la normativa norteamericana favorece esquemas que generan más ahorros de tiempo substanciales. La mayoría de los estudios distingue entre valores de tiempo subjetivos (o de comportamiento) y de evaluación. Los primeros corresponden a, por ejemplo, el valor del parámetro asociado con el tiempo de viaje en vehículo en las funciones de coste generalizado que se estudiaron en el Capítulo 5 y que deberían haberse derivado estimando un modelo de demanda con datos empíricos. El valor para evaluación es aquel que se utiliza, como indica su propio nombre, para comparar esquemas alternativos que producen diferentes niveles

MODELOS

DE

TRANSPORTE



de ahorro de tiempo y otros recursos. Se argumenta, entonces, que el valor del tiempo en el comportamiento refleja en mayor medida la disponibilidad a pagar del viajero y no el valor intrínseco de un ahorro de tiempo en particular. Por esta razón, a menudo el valor del tiempo utilizado en evaluación de proyectos es un valor de equidad, que se considera igual para todos los viajeros, independientemente de su edad o grupo socioeconómico, tal y como se verá a continuación. Por otra parte, se puede argumentar que el uso de diferentes “valores del tiempo” para los diferentes propósitos de evaluación y modelización de demanda, introduce inconsistencias en el enfoque en distintas etapas del mismo ejercicio. Sin embargo, prácticamente no se discute que los valores subjetivos del tiempo dependen fuertemente de la especificación del modelo y de los datos (véase Gaudry et al., 1989); esto es una propiedad no deseada, ya que lo que interesa es realizar una evaluación de proyectos consistente en una amplia gama de modelos y áreas. 13.4.1.1. Valores subjetivos y valores sociales del tiempo La función de utilidad estimada mediante los modelos de elección discreta de viaje puede utilizarse para calcular el valor subjetivo de ahorrar tiempo (Subjective Value of Time o SVT) o de forma equivalente, la disponibilidad a pagar para reducir el tiempo de viaje (en el vehículo, a pie o esperando) en una unidad. Como se demostró en Jara-Díaz (2000), ya que la utilidad del viaje es realmente una función de utilidad indirecta condicional, la interpretación microeconómica SVT depende de los argumentos que se suponga entren en la función de utilidad así como del tipo de restricciones consideradas; véase también Bates (1987). El análisis de la valoración del tiempo proviene de tres fuentes: las teorías puras de asignación del tiempo, el enfoque de producción del hogar y la literatura sobre demanda de viajes. Todo comenzó con el enfoque de Becker (1965), basado en la idea de que la utilidad depende de la cantidad de “bienes finales” consumidos (por ejemplo, una comida preparada), cada uno de los cuales requiere bienes de mercado y tiempo como insumos; éste fue el origen de un valor del tiempo igual al salario horario, ya que “el tiempo puede convertirse en dinero” dedicando más tiempo al trabajo y menos a consumir. Después de sucesivos análisis realizados por Johnson (1966), Oort (1969), De Serpa (1971) y Evans (1972), este resultado elemental pronto se demostró limitado, pues el tiempo en el trabajo debería entrar como argumento en la función de utilidad.



Otros tópicos de interés

Posteriormente los modelos de elección modal para ingresos fijos introducidos inicialmente como enfoque de la tasa de gastos (Jara-Díaz y Farra, 1987; Jara-Díaz y Ortúzar, 1989), corroboraron también un valor del tiempo de viaje no necesariamente relacionado con la tasa salarial. El resultado de este grupo de artículos fue un marco en el que las acciones económicas del individuo se observaban como si maximizaran una función de utilidad que dependía de todas las actividades llevadas a cabo y de todos los bienes consumidos, sujeto a tres tipos de restricciones: un presupuesto económico, una restricción de tiempo y una serie de relaciones técnicas entre bienes y tiempo (Jara-Díaz, 1988). Hasta ahora, se ha demostrado que el SVT refleja el valor de relajar el requisito de tiempo mínimo de viaje. Analíticamente esto es el ratio entre el multiplicador correspondiente a esa restricción y la utilidad marginal del ingreso (Marginal Utility of Income o MUI) y se puede demostrar que es igual al valor del tiempo como recurso (o, de forma equivalente, el valor del ocio) menos el valor de la utilidad marginal de viajar. El primero representa el valor de reasignar el tiempo de viaje ahorrado a otras actividades y viene dado de forma analítica como el ratio entre el multiplicador de la restricción de tiempo y la MUI. El segundo, en cambio, es el valor perdido, en términos de utilidad directa, debido a que se viaja menos, y debería ser negativo. El SVT, por tanto, es la suma del valor del tiempo libre ganado y el valor de la reducción de una actividad no placentera. Es importante destacar que si el individuo elige su horario del trabajo (horas trabajando) a una determinada tasa salarial, ajustará dicho horario hasta que el valor del ocio iguale al valor del trabajo; éste es igual a la suma del dinero ganado (la tasa salarial) y el valor de la utilidad marginal del trabajo (que puede ser positivo o negativo). Jara-Díaz y Guevara (2000) consiguieron estimar modelos simultáneos de viajes y actividades, y obtuvieron no solamente el SVT sino también los elementos que lo componen. Finalmente, comentemos el precio del tiempo de viaje que debería emplearse en evaluación social de proyectos (valor social del tiempo). La sociedad no tiene por qué valorar la reasignación del tiempo de viaje individual al SVT del individuo. Para el análisis de viajes discrecionales, el estado del arte es el trabajo de Gálvez y Jara-Díaz (1988), que muestra que un precio social del tiempo apropiado (Social Price of Time o SPT), consistente con un marco de evaluación social dentro del campo de la economía del bienestar, debería ser igual a la razón entre la utilidad marginal del tiempo y lo que ellos llaman “’la utilidad social del dinero”. Ésta es dada por una suma ponderada de los MUI

MODELOS

DE

TRANSPORTE



individuales en la que los pesos corresponden a la proporción de impuestos marginales pagada por su grupo social. Este enfoque propone SPTs potencialmente diferentes para cada grupo, los cuales normalmente son diferentes de los SVT de cada grupo. Es importante destacar que estos autores demuestran analíticamente que si se aceptan los SVT como SPT, ello es equivalente a asignar a cada grupo un peso social que crece con el ingreso. Aunque esto tiene implicaciones importantes de política y generalmente no deseadas, tristemente refleja el enfoque normalmente utilizado en la práctica. 13.4.1.2.

Algunos resultados prácticos

Heggie (1983) sostenía que el debate sobre el valor del tiempo era más empírico que teórico. Las enormes dificultades prácticas asociadas con la medición de los valores de tiempo incentivaron la utilización de métodos indirectos como es el enfoque de elección discreta mencionado anteriormente. Sin embargo, este método genera los usuales problemas empíricos, tales como: • Cómo elegir una muestra apropiada, es decir, una muestra que básicamente contenga gente con una verdadera elección entre alternativas definidas claramente en términos de tiempo y coste de viaje. • Cómo medir los atributos del viaje, es decir, evitando la agregación, percepción y otras fuentes de sesgo. • Qué función de demanda se va a utilizar que sea consistente con la situación en estudio. Todos estos problemas sugieren que los valores derivados a partir de modelos estimados con datos de preferencias reveladas (la gran mayoría de los casos) pueden ser sospechosos. Quizás el estudio más completo realizado sobre el valor de ahorros de tiempo de viaje en los últimos años fue hecho entre 1981 y 1986 por un consorcio de consultores y expertos académicos en el Reino Unido, utilizando una serie de modelos estimados con datos de preferencias reveladas y declaradas para diversos escenarios de elección en varias áreas del Reino Unido (Bates y Roberts, 1986). Sus principales recomendaciones (Department of Transport, 1987) fueron: 1. El valor del tiempo de trabajo (es decir, viajes hechos durante o como parte del trabajo) es igual al ingreso bruto por hora del viajero, incluyendo todos los costes adicionales para el empresario.



Otros tópicos de interés

2. Los viajes realizados por cualquier otra razón, incluyendo los viajes al trabajo, subieron en su valoración desde un 27 a un 43% del ingreso medio por hora de los adultos empleados a jornada completa (esto es, un incremento del 85%). 3. Para la mayoría de los casos ha de utilizarse un valor del tiempo único y equitativo; sin embargo, en los casos en los que se considere que la proporción de niños, pensionistas o adultos empleados difiere de forma significativa de la media nacional, debería estimarse un valor equitativo del tiempo ad hoc utilizando los valores individuales de cada uno de estos grupos. 4. Para actualizar estos valores, debería utilizarse información acerca de los ingresos reales por hora para cada año; en el caso de previsiones, tales ingresos deberían estimarse como funciones del producto interior bruto per cápita. 5. Los valores del tiempo andando y esperando tendrían que tomarse como el doble del valor del tiempo dentro del vehículo; los que viajen en bicicleta deberían ser tratados como peatones en este sentido. 6. Los pequeños ahorros de tiempo deberían ser evaluados de forma igual que los ahorros de tiempo más significativos. En 1994 el Departamento de Transporte del Reino Unido encargó un nuevo estudio sobre el valor del tiempo (ACCENT y HCG, 1996). A continuación se resumen algunas de sus conclusiones más interesantes, que en términos generales están de acuerdo con un estudio anterior realizado en Holanda (HCG, 1990) con la misma metodología: 1. Para cualquier nivel de variación alrededor del tiempo de viaje original, las ganancias de tiempo se valoran más que las pérdidas. Para los viajes no relacionados con el trabajo, generalmente se deberían ignorar variaciones de hasta 5 minutos en el tiempo de viaje. Los viajeros de negocios son más sensibles a las ganancias y pérdidas de tiempo que los que viajan diariamente al trabajo; estos últimos, a su vez, son más sensibles que los que realizan viajes no relacionados con el trabajo. 2. Existe una relación clara entre ingresos y SVT (tal y como se encontró en 1986) que es monótonamente creciente pero no directamente proporcional. Para los mismos niveles de ingreso los SVT de 1994 son significativamente menores que los registrados en 1986. Este hecho puede deberse a cambios en la composición de la población que utiliza el coche (los que tenían mayores SVT fueron los que primero compraron y utilizaron coches) de tal

MODELOS

DE



TRANSPORTE

forma que el crecimiento en su utilización está sesgado hacia los segmentos del mercado con SVT más bajos. 3. Los SVT bajo condiciones de congestión son significativamente más altos que los que se realizan en viajes bajo condiciones de flujo libre. Sin embargo, los tipos de combinaciones de caminos (es decir, porcentaje del tiempo en autopista, carreteras nacionales y otras) no eran significativamente diferentes. Finalmente, los que usan autopistas de forma regular son relativamente indiferentes al número de carriles, pero parecen ser muy sensibles a viajar junto a camiones y claramente no les gustaban las carreteras sin arcén (el efecto más fuerte de todos). 4. En relación a los cambios en la hora punta, se encontró que la desutilidad de salir más temprano se incrementa de forma lineal con la diferencia de tiempo. También es cierto esto para las salidas aplazadas hasta una hora en cuanto a que, curiosamente, encontraron que la molestia no aumentaba mucho pasada dicha hora; véase la discusión en Bianchi et al. (1988).

13.4.2. Métodos de análisis 13.4.2.1.

Enfoque de preferencias reveladas

Para estimar la disponibilidad a pagar por ahorros en el tiempo de viaje (es decir, el SVT) en la literatura clásica de microeconomía del transporte, los modelizadores necesitan medir los compromisos entre tiempo de viaje y coste para una población representada por una muestra estadística (por ejemplo, individuos viajando desde algunos suburbios hasta el centro de la ciudad). El SVT corresponde a la tasa marginal de sustitución entre tiempos percibidos ti (en el vehículo, a pie o esperando) y costes ci de viajar a utilidad constante (Gaudry et al., 1989), dando lugar a la siguiente expresión:

SVT 

dCi dti

v

uVi ut  i uVi uci

(13.31)

Como la función de utilidad representativa tradicionalmente se supone lineal y aditiva en los parámetros (fijos) de utilidad marginal, bajo esta hipótesis el SVT corresponde al ratio entre los parámetros estimados, θt y θc, de



Otros tópicos de interés

los atributos tiempo de viaje y coste; para la especificación de la tasa salarial (w) (Train y McFaden, 1978), esto da simplemente que:

SVT 

w t c

(13.32)

A partir de (13.32) se puede ver fácilmente que el ratio θt / θc representa al SVT como porcentaje del ingreso. Para la especificación lineal en los parámetros de tasa de gastos (g) (JaraDíaz y Farah, 1987), donde g es dado por (8.7), la ecuación (13.31) da lugar a:

SVT 

g t c

(13.33)

Finalmente para el caso Box-Cox (8.3) se obtiene:

SVT  w

i ti i 1 tc 1 ¥C ´ c ¦ i µ §w¶

(13.34)

la cual claramente varía entre alternativas si τk no es igual a 1. Esta última fórmula implica que si ambos τ son iguales y menores que uno, el modelo necesariamente producirá estimaciones de tiempo mayores para los modos que sean más caros por unidad de tiempo; sin embargo, este podría no ser el caso si los τ son diferentes (Gaudry et al., 1989). Ahora, como θt y θc son estimaciones de los parámetros “verdaderos” del modelo, realmente no son constantes sino variables aleatorias con una cierta función de densidad de probabilidad (FDP). Por esta razón la “estimación puntual del SVT” (es decir, θt / θc) es también una variable aleatoria con una FDP desconocida, y parece apropiado examinar las consecuencias de sustituir este valor único por la construcción de un intervalo de confianza dado un cierto nivel de confianza. Una salida más sencilla pero menos apropiada consiste en intentar juzgar la significancia del SVT mediante un pseudo-ensayo de la razón t. Jara-Díaz et al. (1988) demuestran que si se realiza una expansión de primer orden del desarrollo en serie de Taylor de la variable aleatoria θt / θc alrededor de su valor medio (la razón entre los coeficientes estimados), se puede construir la siguiente razón t:

MODELOS

DE



TRANSPORTE

¥  2  2 2Cov(t , c ) ´ ttc  ¦ t2 c2 µ  t c § t c ¶

1 2

(13.35)

donde σt y σc son los errores estándar de los coeficientes estimados. Se sabe que los parámetros de máxima verosimilitud distribuyen asintóticamente según una normal multivariada. Por lo tanto, la estimación puntual del SVT es una variable aleatoria gobernada por una FDP desconocida (la distribución de probabilidad de la razón entre dos variables distribuidas Normal es desconocida a priori); solamente se conocen algunos aspectos en casos especiales. Por ejemplo, se sabe que la razón entre dos variables estándar Normales distribuidas de forma independiente sigue una FDP de Cauchy (Arnold y Brockett, 1992), aunque esta distribución es inestable ya que tiene una varianza indefinida y su media no tiene expresión analítica. También se sabe que la razón entre dos variables Normales bivariadas con una correlación distinta de cero sigue otra FDP inestable, que incluso es más difícil de tratar que la función de Cauchy (Fieller, 1933). Dados estos hechos, es muy probable que la razón entre los parámetros θt y θc, que forman parte de una población Normal multivariada, esté gobernada por una FDP inestable. Por lo tanto, es necesario encontrar un procedimiento econométrico para poder realizar inferencias estadísticas sobre esta razón sin recurrir al uso directo de la FDP asociada. Para solucionar este problema, recientemente se han propuesto varios métodos en la literatura. Por ejemplo, Ettema et al. (1977) estudian un método general para construir intervalos de confianza para el SVT en casos en los que se permite que los parámetros del tiempo de viaje y del coste permitan interactuar con otras variables de segmentación. Se utiliza simulación para calcular simultáneamente los parámetros a partir de una distribución Normal multivariada, definida por la matriz de covarianza de los parámetros del tiempo de viaje estimado y del coste de viaje. Sus valores son generados una cantidad de veces lo suficientemente alta (lo ideal es 1.000), construyendo el intervalo de confianza en base a las estimaciones de la media y la varianza de la muestra generada; se pueden simular simultáneamente valores para los parámetros del tiempo de viaje, tiempo de espera, tiempo andando y coste. Finalmente, calculando los percentiles 0,025 y 0,975, se obtienen los límites del intervalo de confianza a un nivel del 95%. Una de las ventajas de este método es que no requiere introducir suposiciones adicionales (aparte de la normalidad para los estimadores de máxima



Otros tópicos de interés

verosimilitud). Además de ser aplicable a cualquier especificación de función de utilidad, considera la varianza de los parámetros y las correlaciones entre ellos. Los resultados de Ettema et al. (1977) sugieren que cuando crece la correlación, decrece el tamaño de los intervalos, indicando que si no se considera la correlación se pueden obtener resultados extremos. Armstrong et al. (2001) estudian dos métodos. El primero se llama el método asintótico del test-t y se basa en la siguiente hipótesis nula: (13.36)

H 0 :  t VT c  0

donde VT representa la estimación puntual del SVT. El intervalo de confianza viene dado por la serie de valores VT para los cuales no se puede rechazar H0 a un nivel de significatividad dado. El estadígrafo correspondiente es (Garrido y Ortúzar, 1993):

t

t VT c Var  t VT c

Esta expresión distribuye Normal para modelos lineales y de forma asintótica Normal para los modelos no lineales como el logit multinominal (Ben Akiva y Lerman, 1985). Garrido y Ortúzar (1993) también derivaron los límites superiores e inferiores para el intervalo, de la forma siguiente: VU , L

2 ¥ t c ´  tt t c  t ¥t ´  VT ¦ µ 2 2 p VT ¦ c µ § tt ¶  t c t § tt ¶

 t

2

2

tt tc  tt2 t 2  tc2 t 2

t

2 c

t2

(13.37)

donde tt y tc corresponden a los estadísticos t para θt y θc respectivamente y ρ es el coeficiente de correlación entre ambas estimaciones de parámetros. La ecuación (13.37) es un número real solamente si el argumento bajo la raíz es no-negativo; se puede demostrar que esta condición se cumple cuando los parámetros θt y θc son estadísticamente significativos (de modo que tc y tt sean mayores que t). Esta condición asegura límites superiores e inferiores positivos. Se puede observar que el intervalo de confianza derivado de esta formulación no es simétrico respecto a la estimación puntual de SVT (VT), y también que el punto medio del intervalo es mayor que VT. Otro rasgo importante es que el valor de ρ tiene una fuerte influencia sobre el tamaño del intervalo. Además, cuanto más significativo es el valor del estadístico-t menor es el intervalo.

MODELOS

DE



TRANSPORTE

También hay que resaltar que para muestras grandes se mantiene la siguiente identidad:

lim VU , L  VT

(13.38)

N md t t , tc md

la cual está de acuerdo con la percepción de que cuanto mayor es la muestra, menor debería ser el tamaño del intervalo. El segundo enfoque propuesto por Armstrong et al. (2001) se denomina el método del test de la razón de máxima verosimilitud. Se basa en imponer la restricción lineal (13.36) al proceso de estimación de la máxima verosimilitud y comparar la eficacia estadística de la estimación respecto al caso no restringido. El procedimiento consiste en la búsqueda de valores de VT para los cuales es válida la restricción lineal dado un cierto nivel de significatividad. La hipótesis nula sigue siendo la misma que en el caso anterior, pero el test se lleva a cabo según el siguiente estadístico:

LR  2 ;l ( r ) l ( ) =

(13.39)

donde l(θr) y l(θ) representan el logaritmo de la función de verosimilitud para los modelos restringido y no restringido respectivamente. LR distribuye χ2 con un grado de libertad (correspondiendo a la única restricción impuesta). Ejemplo 13.3: se desea estimar la siguiente función de utilidad sistemática:

Viq   t tiq  C Ciq ¤ k Z kiq k

(13.40)

donde tiq y Ciq son el tiempo de viaje y el coste por individuo q; Zkiq son atributos (diferentes del tiempo de viaje y el coste) para el individuo q, y θk son sus parámetros. Sustituyendo la razón entre θt y θC por VT en (13.40) se obtiene la siguiente función de utilidad:

Viq   C (VTtiq Ciq ) ¤ k Z kiq k

(13.41)

Las ecuaciones (13.40) y (13.41) permiten calcular las funciones de logverosimilitud no restringida y restringida, l(θ) y l(θr/VT). Claramente, si SVT es igual a VT entonces l(θ) = l(θ r /VT), pero diferentes valores de VT darán lugar a diferentes valores de la función de log-verosimilitud restringida. Este



Otros tópicos de interés

método requiere la búsqueda de los valores máximo y mínimo de VT para los cuales se mantiene la siguiente desigualdad:

2 ;l ( r / VT ) l ( ) = b 12, 1  Una ventaja de este método sobre el anterior es que no se restringe solamente a funciones de utilidad lineales. Sin embargo, el proceso de construir los intervalos es más lento que en el caso anterior, ya que requiere un procedimiento iterativo para obtener cada límite. Armstrong et al. (2001) presentan los resultados de usar todos los métodos anteriores para diversos casos de interés. Los valores subjetivos del tiempo y sus intervalos de confianza (tanto límites como tamaño) varían mucho con la especificación del modelo (es decir, tienen una fuerte dependencia de la forma funcional supuesta para la utilidad representativa y de la estructura del modelo). Pero con datos de corte transversal no es fácil rechazar claramente ninguna forma razonable de modelo; véase la discusión en Jara-Díaz y Ortúzar (1989). 13.4.2.2.

Enfoque de tarificación de transferencia (transfer pricing)

En el contexto del análisis de la demanda de viajes, el precio de transferencia se entiende como la cantidad en la que el coste de una alternativa debería ser variado para igualar su atracción global con la de otra alternativa predefinida (véase Bonsall, 1983). Una aplicación típica del método implica preguntar a individuos, por ejemplo, hasta qué nivel tiene que subir el precio o la tarifa de su alternativa preferida para convencerles de cambiar a otra alternativa. Está claro que un problema importante de esta técnica (común en muchas técnicas del análisis de preferencias declaradas) tiene que ver con la fiabilidad que el analista pueda asociar a tal serie de datos. Por otra parte, una fuerte ventaja de este método, si funciona, es que posibilita conocer no solamente la dirección de las preferencias individuales sino también la diferencia (en términos de preferencia) entre las diversas alternativas disponibles. Por lo tanto, en teoría y en común con otros estudios de preferencias declaradas (PD), se requieren menos datos que en un estudio de preferencias reveladas (PR) para obtener un modelo de similar precisión. Aquí no se va a intentar estudiar el método en detalle, pero los lectores interesados pueden consultar a Gunn (1984) para una buena discusión acerca de sus ventajas y problemas, en especial su inconsistencia general con la teoría convencional de los modelos de utilidad aleatoria.

MODELOS

DE



TRANSPORTE

Ejemplo 13.4: considérese un modelo de utilidad aleatoria como el (7.2) en una situación de elección binaria y supóngase que el precio de transferencia (PT) corresponde a la diferencia entre la utilidad de la alternativa elegida (Uc) y otra (Ur), es decir, representa el incremento en el coste de la alternativa elegida que haría que el viajero fuese indiferente a la hora de elegir una de las dos alternativas. Se tiene pues:

PT  U c U r Sin embargo, el valor esperado de (Uc – Ur) es precisamente la diferencia en las utilidades representativas (Vc – Vr); entonces, suponiendo que sean lineales en los parámetros, como de costumbre, se puede formar el siguiente sistema de regresión lineal:

PT( observado)  Q1  X 1c X 1r Q2  X 2c X 2 r L el cual debería permitir estimar los parámetros desconocidos θ conociendo los atributos X de ambas alternativas. Además, con este método se pueden calcular valores de tiempo diferentes para los que ahorran tiempo y para los que ahorran costes (véase Lee y Dalvi, 1969). Un problema importante, descrito en primer lugar por Hensher (1976), concierne al tratamiento de los hábitos o costumbres en los modelos del precio de transferencia. Gunn (1984) demuestra que las especificaciones que utilizan PT como variable dependiente pero restringen su signo (por ejemplo, mediante la modelización de las alternativas de forma separada o intercambiando las características observables para que reflejen la diferencia entre la alternativa elegida y la rechazada) no pueden hacerse fácilmente consistentes con la teoría convencional de la utilidad aleatoria (véase también la discusión en el Capítulo 8). 13.4.2.3.

Enfoque de preferencias declaradas

Los métodos de preferencias declaradas (PD), tal y como se trató en profundidad en el Capítulo 8, se han convertido en la forma más utilizada para estimar los valores del tiempo durante los últimos años. Por ejemplo, en su informe final para el Departamento de Transporte, los consultores que desarrollaron el vanguardista estudio sobre el valor del tiempo para el Reino Unido en 1994 apuntaron que “se han acumulado suficientes evidencias durante los últimos diez años como para tener confianza en que un sondeo PD bien



Otros tópicos de interés

realizado, con un cuestionario bien diseñado y un análisis correcto podría dar resultados fiables, aunque si se van a realizar pronósticos de demanda reales sería preferible tener una base de apoyo con datos PR” (ACCENT y HCG, 1996). No se va a revisar la gran cantidad de estudios basados en PD sobre el valor del tiempo que pueden encontrarse en la literatura de los últimos años; sin embargo, se mencionan algunos de los informes Europeos más recientes sobre estudios nacionales. Además del nuevo estudio para el Reino Unido, es interesante echar un vistazo a los de Finlandia (Kurri y Pursula, 1995); Holanda (HCG, 1990) y Suecia (Lindquist y Algers, 1988). Otros estudios se han visto involucrados con temas importantes como la estimación de valores de tiempo distribuidos de forma aleatoria (Ben Akiva et al., 1993; Gopinath y Ben Akiva, 1995) o con la estimación de valores del tiempo usando datos de PD que permitan incorporar efectos de interacción (Ortúzar et al., 2000c; Rizzi y Ortúzar, 2003). Estos trabajos abarcan nuevos ámbitos del conocimiento y utilizan modelos y especificaciones en el estado del arte, tal y como las que se trataron en los Capítulos 7 y 8.

13.5. 13.5.1.

VALORACIÓN DE EXTERNALIDADES DE TRANSPORTE Introducción

En muchos países del mundo desarrollado se han utilizado métodos de disposición a pagar (DAP) para la evaluación monetaria de una gama de efectos externos del transporte como los accidentes, la contaminación, el ruido, la intrusión visual y el deterioro del paisaje. Diversos ejemplos han sido compilados por Hansson y Markham (1992), OECD (1994a), Match y Rothengatter (1995), Litman (1995), Maddison et al. (1996), Friedrich et al. (1998) y ECMT (1998). El motor de este trabajo ha sido el de establecer los costes sociales totales del transporte como base para la eficiente fijación de los precios en este sector y para extender el alcance del análisis social de costes y beneficios (ASCB) para mejorar la evaluación de proyectos. Aunque ha existido mucho entusiasmo académico acerca de la evaluación monetaria de estos bienes no mercantiles, ésta ha sido puesta en cuestión por razones tanto de principios como prácticas; una buena expresión de la naturaleza de esta oposición puede encontrarse en Adams (1992) y Whitelegg (1993). Sin embargo, existe una considerable fuerza en el argumento de que, si bien

MODELOS

DE

TRANSPORTE



valores monetarios bien fundados son difíciles de conseguir de forma empírica y puede que sean válidos solamente en algunos contextos, su expresión ayudará a asegurar que las externalidades no sean marginalizadas ni poco representadas en la planificación y programación de proyectos. Esto tiene especial importancia en el contexto de la evaluación de inversión en carreteras y en la asignación de recursos para medidas contra los accidentes y estrategias para controlar la contaminación. De hecho, en los 80 y 90, la asignación de valores monetarios a accidentes de diferente gravedad constituyó un estímulo importante para el incremento de los recursos dedicados a la seguridad vial y al establecimiento de prioridades para diferentes medidas de seguridad en muchos países del mundo (Allsop, 1999). También, como parte de la expectativa de responder a estándares y objetivos medioambientales cada vez más estrictos, muchos gobiernos nacionales y locales han ido estableciendo o refinando bases de datos relacionadas con los accidentes, el ruido y diversos contaminantes atmosféricos. La intención es utilizar dichas bases de datos para controlar los cambios y evaluar las políticas fiscales, de regulación y de inversión. En muchos países desarrollados este proceso ya está establecido, mientras que en la mayoría de los países en vías de desarrollo aún está en una etapa de desarrollo relativamente temprana, de forma que el alcance y la calidad de los datos varían considerablemente (Chesnut et al., 1977). Ahora, aunque se acumularon suficientes evidencias al respecto durante los 90, los costes económicos de los accidentes, el ruido y la contaminación están sujetos a una variación considerable debida, en parte, a las diferentes fuentes de datos y métodos de medición. Por ejemplo, Quinet (1994) observó que para todas las formas de contaminación en el sector transporte, las estimaciones basadas en DAP proporcionaban los valores numéricos más altos de una vida estadística (VDVE); ésta es, como se sabe, una característica bien conocida en el cálculo de los costes de accidentes. Por ejemplo, en 1988 el gobierno del Reino Unido sustituyó el enfoque del capital humano para calcular el coste de las fatalidades por un enfoque de DAP, y en 1994 esto se extendió a los accidentes no fatales, basándose en los estudios nacionales de Jones-Lee et al. (1985, 1992). Sin embargo, en el caso de muertes, el gobierno no aceptó los valores mucho más altos que salían del estudio DAP anterior y en cambio implantó un valor de compromiso (Dalvi, 1988), ejercitando de esta forma un elemento de prudencia frente a un cambio radical de metodología (Department of Health, 1999).



Otros tópicos de interés

Hasta fechas tan recientes como 1995, la evaluación monetaria de las externalidades medioambientales recibió poco apoyo oficial (OECD, 1994b; Lee y Kirkpatrick, 1996). Sin embargo, la situación cambió de forma rápida y estudios recientes (Brostow et al., 1988; DETR, 1999) acerca de evaluaciones “oficiales” del transporte sugieren que los valores monetarios del ruido, contaminación atmosférica y en menor grado, los efectos barrera, se emplean cada vez más en muchos países europeos. Lo más usual, sin embargo, es que la evaluación de inversiones en carreteras promovidas o apoyadas por las autoridades nacionales, impliquen un análisis limitado de coste-beneficio (con valores monetarios unitarios restringidos a ahorros en tiempo, accidentes y costes de operación), aplicado en conjunto con una evaluación del impacto medioambiental y socio-económico. Por ejemplo, en un trabajo sobre las entidades estatales de EE.UU. responsables del desarrollo de las carreteras, Waters (1992) destacó que relativamente pocas utilizaban un ASCB sofisticado, y preferían enfoques más sencillos basados en las necesidades o de coste-eficacia. Aunque varios estudios académicos han promovido la extensión del marco de los ASCB para que incluyan una gama más amplia de impactos (Bateman et al., 1993; Willis et al., 1998), los gobiernos aún son precavidos a la hora de extenderlos a aspectos tales como la contaminación, ruido, intrusión visual, deterioro del paisaje y daños al ecosistema. Esto se debe en parte, a una falta de conocimiento tanto de evaluación de impactos como de su valoración económica (Mullen, 1977), y en parte a que la naturaleza contextual de ciertos impactos dificulta el uso de valores unitarios estandarizados. Éstas son preocupaciones universales. Así, sigue constituyendo un reto considerable para la investigación integrar las metodologías tradicionales utilizadas en la evaluación de impactos medioambientales, análisis coste-beneficio y análisis multicriterio (Commission of the European Communities, 1994; OECD, 1994c; Lee y Kirkpatrick, 1996; Nardini, 1997) en un contexto en el cual los objetivos ambientales están cobrando una importancia creciente. Los esfuerzos más recientes incluyen nuevas formas de obtener y presentar la información cualitativa y cuantitativa con el objetivo de minimizar la predisposición contraria a la valoración de los elementos no monetarios, así como la conformación de marcos de evaluación que establezcan “un ámbito ecuánime” entre los diferentes modos, de forma que se puedan afrontar los problemas de transporte con menos énfasis en las soluciones de carreteras (Price, 1999; Glaister, 1999). La monetarización

MODELOS

DE



TRANSPORTE

se aplicará cada vez con mayor frecuencia en escenarios multimodales que demandarán muchos más datos.

13.5.2. Métodos de análisis Existen varias taxonomías sobre métodos de evaluación disponibles en la literatura y una discusión económica mucho más amplia que la que se podría intentar desarrollar aquí (ECMT, 1996; Match y Rothengather, 1995; Nash, 1997; Verhoef, 1994). En este epígrafe sólo se revisarán brevemente dos métodos importantes, el enfoque del capital humano y el método de valoración contingente, aunque probablemente se pueda afirmar justificadamente, que el método con más visos de ser utilizado en el futuro es el enfoque de preferencias declaradas, que ya fue revisado suficientemente en los Capítulos 3 y 8 (véase Rizzi y Ortúzar, 2002) para una aplicación correctamente diseñada. 13.5.2.1.

Enfoque del capital humano

Se basa en la suposición de que el valor de una persona es lo que ella produce y esto normalmente se mide por el salario bruto percibido en el trabajo (es decir, antes de impuestos para incluir al gobierno y, por lo tanto, a la sociedad). Si la persona muere, se pierde esta producción. Este enfoque, que ya tiene más de 30 años (Landefeld y Seskin, 1982), postula que el valor de evitar la muerte de un individuo de edad t es igual al valor actual neto (VAt) de los ingresos esperados para el resto de su vida: T t

VA t  ¤ i 1

Pt 1 Et i (1 r )i

(13.42)

donde π t+i es la probabilidad de que el individuo sobreviva desde la edad t hasta la edad t + i, Et+i son los ingresos esperados del individuo a la edad t + i, r es la tasa de interés y T es la edad de jubilación. El método ha recibido fuertes críticas por ser la antítesis de las premisas convencionales de la economía del bienestar. También se ha discutido cómo valorar la producción de individuos que no están en el mercado laboral (por ejemplo, las amas de casa), o qué tasa de interés debería utilizarse para calcular VP (un tema sensible en el caso de niños y adultos jóvenes); las tasas clásicas iban del 6 al 10% pero hoy en día se prefieren valores por debajo del 5% para evitar penalizar en exceso algún estrato de edad. La tabla 13.2, tomada de



Otros tópicos de interés

Landefeld y Seskin (1982), muestra los efectos de la edad y la tasa de interés sobre el valor de la vida de acuerdo al método del capital humano. Tabla 13.2.

Valor actual neto según edad y tasa de interés

Grupo de edad

De 1 a 4 años

Valor Actual Neto (US$) Interés 2,5%

Interés 6,0%

Interés 10,0%

761.047

205.101

59.859

De 20 a 24 años

967.221

534.799

320.114

De 40 a 44 años

625.508

454.972

338.232

De 65 a 69 años

47.506

40.886

35.304

Debido a las diferencias en los salarios, si el enfoque del capital humano se aplicara de forma rigurosa, daría valores más pequeños para la vida de las mujeres que para la vida de los hombres; y valores más bajos para las personas de raza no caucásica; también asignaría valor cero a individuos jubilados y a los incapacitados por enfermedad u otras razones. Por esta razón, tal y como en el caso del valor del tiempo, una metodología más adecuada sería calcular un valor equitativo único para ser utilizado en la evaluación de los proyectos. No obstante, se acepta ampliamente que como este método no tiene en cuenta el dolor ni el sufrimiento de la víctima y sus familiares, el valor estimado constituye una subestimación del valor real de la pérdida social de un ser humano, por lo que su uso sólo debería permitir establecer un límite inferior para el valor de la vida. Ejemplo 13.5: el conocimiento de los salarios correspondientes a diferentes categorías de edad y sexo permite estimar los valores actuales netos según sexo y edad, dada la tasa de interés, utilizando (13.42). La tabla 13.3 muestra estimaciones de los valores netos medios actuales de ingresos perdidos por fallecimiento prematuro para diferentes grupos de edades en la Región Metropolitana de Santiago (Holz y Sánchez, 2000). Tal y como se puede ver, los valores son mayores para los hombres debido a sus salarios más altos. El valor actual neto disminuye con las edades más avanzadas porque el horizonte de vida es más corto. Para conseguir un coste unitario de la mortalidad, Holz y Sánchez (2000) calcularon el porcentaje de muertes en cada estrato de edad para hombres y mujeres, utilizando las estadísticas de fallecimiento de 1997 en Chile (como

MODELOS

DE



TRANSPORTE

Tabla 13.3.

Valor actual neto por sexo y edad Valor actual neto (US$) Hombres

Mujeres

Menos de 1 año

241.258

174.954

Entre 1 y 4 años

250.569

181.706

Entre 5 y 9 años

268.246

194.525

Entre 10 y 19 años

296.964

214.330

Entre 20 y 44 años

275.951

183.573

Entre 45 y 64 años

154.876

90.305

Entre 65 y 79 años

53.248

25.349

80 o más años

19.780

4.553

no se disponía de datos desagregados por sexo para los tres primeros estratos de edad, se supuso que la mortalidad estaba uniformemente distribuida). Estos porcentajes se multiplicaron por los valores actuales netos respectivos (Tabla 13.4) obteniendo la participación de los respectivos grupos o clases de edad en el coste unitario. La suma de estas participaciones es igual al coste unitario medio de una muerte prematura en 1998 en Santiago, y esto se estimó en 53.224 $ US. Este valor supone una medida que afectaría uniformemente a la tasa de mortalidad de toda la población. Tabla 13.4.

Contribución al coste unitario según edad y sexo

Grupos de edad

< 1 año 1 ≤ edad ≤ 4 años 5 ≤ edad ≤ 9 años 10 ≤ edad ≤ 19 años 20 ≤ edad ≤ 44 años 45 ≤ edad ≤ 64 años 65 ≤ edad ≤ 79 años ≥ 80 años Total

Mortalidad Contribución Mortalidad Contribución Contribución masculina al coste femenina al coste al coste (%) unitario (%) unitario unitario total

0,017 0,003 0,003 0,008 0,076 0,125 0,179 0,118

1.091 201 188 604 6.007 10.377 15.620 10.778

0,017 0,003 0,003 0,004 0,028 0,078 0,145 0,195

846 156 146 256 1.708 5.016 9.809 13.885

1.936 385 428 1.476 15.461 19.453 11.159 2.947 53.244



Otros tópicos de interés

13.5.2.2. Valoración contingente Ésta es una técnica para extraer precios para los bienes que no se venden o no se pueden comprar y vender en los mercados normales. Se solicita a la gente el valor que asignan a un determinado bien, contingente al hecho de que existe un mercado para ello. Se crea un mercado hipotético y se le describe al entrevistado, a quien se pide que haga una decisión mercantil (de compra). Los mercados contingentes definen el bien o servicio de interés, el nivel actual de oferta, posibles incrementos o decrementos, la estructura institucional bajo la cual se va a proporcionar el bien y la forma de pago. Mitchell y Carson (1989) proporcionan una completa explicación de los fundamentos teóricos de la técnica de valoración contingente (VC), sus aspectos metodológicos y su aplicación práctica. Bateman y Turner (1993) y Haneman (1994) realizan revisiones generales del tema. Los cuestionarios VC pueden solicitar a la gente su disponibilidad a pagar (DAP) o a aceptar (DAA) valores compensatorios. El valor DAP representa la cantidad de ingreso a la que un individuo estaría dispuesto a renunciar para conseguir un incremento en el nivel de un bien permaneciendo en el mismo nivel de utilidad; la DAA es lo contrario. Un problema, en este caso, es el de los derechos de propiedad; la DAP supone que éstos pertenecen al consumidor y la DAA supone lo contrario. Sin embargo, la DAP es el valor que se usa más frecuentemente porque se parece a las decisiones habituales de compra de los consumidores (aunque en los casos de deterioro medioambiental, por ejemplo, la DAA debería ser el valor teóricamente correcto a obtener). Por lo tanto, la VC intenta medir el cambio de ingreso necesario para contrarrestar un cambio en el atractivo del producto, dejando la utilidad inalterada. Existen tres métodos principales para determinar los valores de VC: 1. Preguntas abiertas donde sólo se consulta a los entrevistados cuánto estarían dispuestos a pagar por un bien. 2. Preguntas iterativas, donde primero se consulta a los entrevistados si estarían dispuestos a pagar una cantidad específica; si la respuesta es afirmativa, se repite la pregunta con pequeños incrementos en el coste hasta que digan que no, entonces se reduce el coste en cantidades aún más pequeñas hasta llegar a una cifra final (y viceversa si empiezan diciendo que no a la primera cifra). 3. Preguntas de referéndum, también conocidas como preguntas de elección dicotómica, donde los entrevistados contestan sí o no a una pregunta de

MODELOS

DE

TRANSPORTE



DAP con un pago especificado; la pregunta de elección dicotómica doblemente acotada tiene una pregunta extra después de la primera. El enfoque de referéndum es de interés especial porque presenta escenarios similares a los que los entrevistados, como consumidores, encuentran en sus transacciones diarias de mercado. Los métodos de pago para comprar o vender un bien pueden incluir impuestos a la propiedad, impuestos al ingreso o venta, facturas de servicios como gas, luz, gastos comunes, tarifas, precios de entrada, sistemas de suscripción o incluso, un instrumento abstracto. Desde sus primeras aplicaciones en los 70 el enfoque VC se ha utilizado para valorar una amplia gama de bienes no mercantiles. Carson et al. (1995) proporcionan una bibliografía de los estudios VC que contiene 1.400 referencias, lo cual indica la amplia aplicabilidad del método. Por otra parte, una evaluación sumamente crítica del método es proporcionada por Hausman (1993) y Diamond y Hausman (1994) quienes editaron una serie de estudios presentados originalmente en conferencias especializadas. Ellos sostienen que la evidencia sugiere que las encuestas VC no miden las preferencias que intentan medir, y que los cambios en los métodos de encuesta probablemente no van a alterar la situación. Sin embargo, el método sigue siendo popular, de hecho, se ha empleado en muchos trabajos importantes relacionados con la valoración de externalidades en el sector del transporte (por ejemplo, Jones-Lee et al., 1992; Feitelson et al., 1996). Ejemplo 13.6: Ortúzar et al. (2000a) describen la utilización de un cuestionario VC para obtener la DAP para reducir el riesgo de mortalidad (relacionada débilmente con los efectos de la contaminación medioambiental) que fue diseñado para superar algunos de los problemas encontrados en los estudios típicos de VC; en particular, que algunos entrevistados no logran comprender las nociones básicas de probabilidad, atribuyendo valores DAP similares a diferentes reducciones en el riesgo, y que los entrevistados pueden asignar una DAP de cero a futuras reducciones en el riesgo de la muerte debido a su falta de capacidad para comprender el producto valorado. Su enfoque difiere de anteriores estudios VC para la reducción del riesgo de la forma siguiente: (i) el momento fijado para las reducciones del riesgo y la atención dedicada al momento fijado para el pago y (ii) la propuesta de un riesgo base objetivo, que los entrevistados deben aceptar como propio, según su edad y sexo. Después de familiarizar a los entrevistados con el concepto del riesgo de muerte y su percepción, el cuestionario llamaba la atención del entrevis-



Otros tópicos de interés

tado acerca de las causas principales de muerte según edad y el sexo, y también acerca de las medidas más comunes para mitigar estas causas y sus costes. Después se introducían riesgos basales específicos según edad y sexo (a partir de datos reales) y se comprobaba que los entrevistados los aceptaban como propios. Posteriormente se buscó la DAP (utilizando un sistema de pago flexible) para reducciones en el riesgo de muerte en los diez años siguientes; las reducciones propuestas fueron de 1 y 5 sobre 1.000, y se presentaron de forma gráfica empleando una matriz de 1.000 círculos (que presentó el riesgo basal como círculos negros), pidiendo a los encuestados que borraran las reducciones valoradas. El método funcionó muy bien en el sentido de que los individuos encuestados adquirieron una adecuada comprensión de las preguntas. Después de establecer el riesgo base (y comprobar que fue aceptado por el entrevistado), la pregunta fundamental de la encuesta tomó la forma siguiente: Las medidas necesarias para conseguir una reducción de las muertes prematuras en la próxima década implican ciertos costes, tal y como hemos visto anteriormente en este cuestionario. Teniendo en cuenta estos costes, por favor conteste a las siguientes preguntas: ¿Cuánto dinero estaría usted dispuesto a pagar mensualmente durante los próximos diez años para bajar su propia posibilidad de morir en 1 sobre 1.000? $/mes ................ Nada (¿Por qué?) ............... ¿Cuánto dinero estaría usted dispuesto a pagar mensualmente durante los próximos diez años para reducir su propia posibilidad de morir en 5 sobre 1.000? $/mes ................ Nada (¿Por qué?) ............... ¿Qué seguridad tiene usted de que pagaría esta cantidad y no otra? (a) muy seguro........ (b) bastante seguro ......... (c) no muy seguro ...........

La tabla 13.5 muestra los resultados para una muestra de 94 entrevistados. Se resalta que la relación entre las DAP para reducciones de riesgo de 5 y 1 sobre 1.000 es cercana a cuatro; ello es consistente con lo esperado ya que la utilidad marginal de las reducciones de riesgo es decreciente; también sugiere que la gente es capaz de distinguir entre reducciones de riesgo bastante bajas. Finalmente es de resaltar que el VDVE es casi cinco veces mayor que el obtenido con el enfoque del capital humano, lo que es consistente con los resultados encontrados en otros lugares (por ejemplo, Cropper y Freeman, 1991).

MODELOS

DE



TRANSPORTE

Tabla 13.5.

DAP y valor implícito de la vida estadística según reducción del riesgo

Reducción del riesgo

DAP media ($US por mes)

Valor neto actual de DAP ($US)

Valor implícito de la vida estadística ($US)

1 sobre 1.000

3,0

285,1

285.113

5 sobre 1.000

12,0

1.127,0

225.400

EJERCICIOS 13.1. Considere el siguiente modelo econométrico para determinar la tasa de motorización como función del ingreso:

P0 I 1 P0 P2  0, 09 exp(0, 751) 0, 8(1 P0 ) P2 P0 P1 P2  1 a) Calibre el modelo utilizando los datos de la tabla siguiente (hágalo gráficamente) I

P0

P1

P2

1 2

0,60

0,35

0,05

0,40

0,50

0,10

3

0,25

0,55

0,20

4

0,20

0,45

0,35

5

0,15

0,35

0,50

b) Indique las proporciones con 0, 1 y 2 o más coches que el modelo predeciría para un ingreso anual de seis unidades monetarias. 13.2. La tabla siguiente presenta los resultados de una encuesta de precios de transferencia realizada con una muestra de ocho individuos del ejerci-



Otros tópicos de interés

cio 9.3; TP indica el incremento declarado en el coste monetario (expresado en unidades de tiempo después de deflactar por ingresos) del medio actualmente elegido que dejaría a cada individuo indiferente entre ambas alternativas. El estudio supuso que las únicas variables relevantes eran el tiempo (t) y los costes/ingreso (c). Individuos

Elección

1

1

2

1

3

1

4

2

TP

t1 (min)

t2 (min)

c1 (min)

c2 (min)

8,0

47,5

83,2

14,8

7,0

6,5

30,2

45,0

10,4

5,0

2,5

22,0

30,4

12,6

4,0

0,5

45,0

50,6

8,2

5,0

5

2

1,5

15,3

20,5

50,0

17,0

6

1

8,5

34,8

34,8

50,2

35,0

7

2

130,0

65,5

100,5

200,3

53,5

8

2

6,0

12,0

14,0

44,6

17,0

a) Utilice estos datos para estimar el valor subjetivo del tiempo del individuo. Discuta el rol, tamaño y signo del intercepto de la ecuación de regresión lineal del precio de transferencia (Pista: si no tiene una calculadora con capacidad de ajustar una regresión lineal, hágalo gráficamente suponiendo conocido el coeficiente de tiempo θt e igual a –0,03). b) Si el parámetro de preferencias reveladas para la variable tiempo es, de hecho, –0,03 y la constante específica de la alternativa 1 es 1,35, estime el valor subjetivo del tiempo utilizando otro método. Compare y discuta sus resultados.

Bibliografía

AASHTO (1977): A Manual of User Benefit Analysis of Highway and Bus Transport Improvements. American Association of State Highway and Transportation Officials, Washington, DC. A BDEL-ATY, M.A., K ITAMURA, R. Y JOVANIS, P.P. (1997): Using stated preference data for studying the effect of advanced traffic information on driver’s route choice. Transportation Research 5C, 39-50. ABRAHAM, H. Y K AVANAGH, C. (1992): Modelling public transport in-vehicle congestion using EMME/2 Release 5. Proceedings 1st European EMME/2 Users Conference, Londres, Abril 1992, Inglaterra. A BRAHAM, H., SHAW, N. Y WILLUMSEN, L. (1992): A micro-based incremental four stage transportation model for London. Proceedings 20th PTRC Summer Annual Meeting, University of Manchester Institute of Science and Technology, Septiembre 1992, Inglaterra. ACCENT Y HCG (1996): The Value of Travel Time in UK Roads-1994. Final Report to the Department of Transport, Accent Marketing & Research and Hague Consulting Group, Londres. ADAMS, J. (1992): Horse y rabbit stew. En A. Croker y C. Richards (eds.), Valuing the Environment: Economic Approaches to Environmental Valuation. Belhaven Press, Londres. ADDISON, J.D. Y HEYDECKER, B.G. (1998): System optimal assignment with departure time choice. Proceedings 3rd IMA International Conference on Mathematics in Transport Planning and Control, Cardiff, Abril 1998, Gales. ADDISON, J.D. Y HEYDECKER, B.G. (1999): Dynamic traffic equilibrium with departure time choice. En A. Ceder (ed.), Transportation and Traffic Theory. Pergamon, Oxford. ALGERS, S., DALY, A.J., K JELLMAN, P. Y WIDLERT, S. (1995): Stockholm model system: application. 7th World Conference on Transport Research, Sydney, Julio 1995, Austra1ia. ALLAMAN, P.M., TARDIFF, T.J. Y DUNBAR, F.C. (1982): New approaches to understanding travel behaviour. NCHRP Report 250, National Cooperative Highway Research Program, Transportation Research Board, Washington, DC.



Bibliografía

A LLSOP, R.E. (1999): Road safety strategy and targets in Great Britain. Traffic Engineering 34, 72-79. ALLSOP, R.E. Y CHARLESWORTH (1977): Traffic in a signal-controlled road network: an example of different signal timings inducing different routeing, Traffic Engineering and Control 18, 262-264. ALONSO, W. (1964): Location and Land Use. Harvard University Press, Cambridge. A LONSO, W. (1968): Predicting best with imperfect data. Journal of the American Institute of Planners 34, 248-255. ÁLVAREZ, R. (1995): Calibración de redes de transporte: comparación de los métodos Binivel y Hookes & Jeeves. En F.J. Martínez (ed.), Actas del Séptimo Congreso Chileno de Ingeniería de Transporte. Sociedad Chilena de Ingeniería de Transporte, Santiago. AMPT, E. (1981): Recent advances in large-scale travel surveys. Proceedings 9th PTRC Summer Annual Meeting, University of Warwick, Julio 1981, Inglaterra. AMPT, E.S. (1997): Respondent burden: understanding the people we survey. Preprints of the International Conference on Transport Survey Qualify and Innovation (Transport Surveys: Raising the Standard), Grainau, Mayo 1997, Alemania. AMPT, E.S., ORTÚZAR, J. DE D. Y WILLUMSEN, L.G. (1998): Metropolitan origin-destination surveys: the state of the art. 8th World Conference on Transport Research, Antwerp, Julio de 1998, Bélgica. A MPT, E.S. Y ORTÚZAR , J. DE D. (2004): On best practice in continuous large-scale mobility surveys. Transport Reviews 24, 337-363. ANAS, A. (1982): Residential Location Markets and Urban Transportation. Academic Press, Londres. APTECH SYSTEMS (1994): GAUSS User’s Manuals. Maple Valley. AREZKI, Y. (1986): Comparison of some algorithms for equilibrium traffic assignment with fixed demand. Proceedings 14th PTRC Summer Annual Meeting, University of Sussex, Julio 1986, Inglaterra. A REZKI , Y., C HADWICK , N. Y WILLUMSEN, L. (1991): Congestion, evaluation and equilibrium: some empirical results. Proceedings 19th PTRC Summer Annual Meeting, University of Sussex, Septiembre 1991, Inglaterra. A RMOOGUM, J. Y MADRE, J.L. (1998): Weighting or imputations? The example of non responses for daily trips in the French NPTS. Journal of Transportation and Statistics 1, 53-63. A RMOOGUM, J., M ADRE, J.L., H AN, X.L. Y POLLAK, J. (1997): Improved methods for weighting and correcting of travel diaries. Derivable D8, Method for European Surveys of Travel Behaviour. 4th Framework Project, CEC/DG VII, Bruselas. ARMSTRONG, P.M., GARRIDO, R.A. Y ORTÚZAR, J. DE D. (2001): Confidence intervals to bound the value of time. Transportation Research 37E, 143-161. ARNOLD, B. Y BROCKETT, P. (1992): On distributions whose component ratios are Cauchy. American Statistician 46, 25-26.

MODELOS

DE

TRANSPORTE



A RNOTT, R., DE PALMA, A. Y LINDSEY, R. (1993): A structural model of peak period congestion: a traffic bottleneck with elastic demand. American Economic Review 83, 161-179. ARNOTT, R., DE PALMA, A. Y LINDSEY, R. (1994): Welfare effects of congestion tolls and heterogeneous commuters. Journal of Transport Economics and Policy XXVIII. 139-161. ASHLEY, D.J. (1978): The Regional Highway Traffic Model: the home based trip end model. Proceedings 6th PTRC Summer Annual Meeting, University of Warwick, Julio 1978, Inglaterra. ASHLEY, D.J., LOWE, S., MUNDY, R., STANLEY, R. Y BAANDERS, A. (1985): The long distance travel model for the Netherlands: its specification and application. Proceedings 13th PTRC Summer Annual Meeting, University of Sussex, Julio 1985, Inglaterra. ATHERTON, T.J. Y BEN AKIVA, M.E. (1976): Transferability and updating of disaggregate travel demand models. Transportation Research Record 610, 12-18. BABIN, A., FLORIAN, M., JAMES-LEFEBRE, L. Y SPIESS, H. (1982): EMME 2: interactive graphic method for road and transit planning. Transportation Research Record 866, 1-9. BACHARACH, M. (1970): Biproportional Matrices and Input Output Change. Cambridge University Press, Nueva York. BATEMAN, I.J. Y TURNER , R.K. (1993): Valuation of the environment, methods and techniques: the contingent valuation method. En R.K., Turner (ed.), Sustainable Economics and Management: Principles and Practice. Belhaven Press, Londres. BATEMAN, I.J., TURNER, R.K Y BATEMAN, S. (1993): Extending cost-benefit analysis of UK highway proposals: environmental evaluation and equity. Project Appraisal 8, 213-224. BATES, J.J. (1987): Measuring travel time values with a discrete choice model: a note. Economic Journal 97, 493-498. BATES, J.J. (1988a): Econometric issues in stated preference analysis. Journal of Transport Economics and Policy XXII, 59-69. BATES, J.J. (guest ed.) (1988b): Stated preference methods in transport research. Journal of Transport Economics and Policy XXII, 1-137. BATES, J.J. (1996): Time period choice modelling: a preliminary review. Final Report for the Department of Transport-HETA Division, John Bates Services, Oxford. BATES, J.J. (1998): Reflections on stated preference: theory and practice. En J. de D. Ortúzar, D. Hensher y S. Jara-Díaz (eds.), Travel Behaviour Research: Updating the State of Play. Pergamon, Oxford. BATES, J.J. Y ROBERTS, M. (1983): Recent experience with models fitted to stated preference data. Proceedings 11th PTRC Summer Annual Meeting. University of Sussex, Julio 1983, Inglaterra. BATES, J.J. Y ROBERTS, M. (1986): Value of time research: summary of methodology and findings. Proceedings 14th PTRC Summer Annual Meeting, University of Sussex, Julio 1986, Inglaterra.



Bibliografía

BATES, J.J., GUNN, H.F. Y ROBERTS, M. (1978): A model of household car ownership. Traffic Engineering and Control 19, 486-491, 562-566. BATES, J.J., ASHLEY, D.J. Y HYMAN, G. (1987): The nested incremental logit model: theory and application to modal choice. Proceedings 15th PTRC Summer Annual Meeting, University of Bath, Septiembre 1987, Inglaterra. BECKER, G. (1965): A theory of the allocation of time. Economic Journal 75, 493-517. BECKMAN, M.J., MCGUIRE, C.B. Y WINSTEN, C.B. (1956): Studies in the Economics of Transportation. Yale University Press, New Haven. BECKMAN, RJ., BAGGERLY, K.A. Y MCK AY, M.D. (1995): Creating synthetic baseline populations, LA-UR-95-1985, Los Alamos National Laboratory, Los Alamos, Nuevo México. BELL, M.G.H. (1983): The estimation of an origin destination matrix from traffic counts. Transportation Science 17, 198-217. BELL , M.G.H. (1984): Log-linear models for the estimation of origin-destination matrices from traffic counts: an approximation. En J. Volmüller y R. Hamerslag (eds.), Proceedings of the Ninth International Symposium on Transportation and Traffic Theory. VNU Science Press, Utrecht. BELL, M.G.H Y TIDA, Y. (1997): Transportation Network Analysis. John Wiley & Sons, Chichester. BEN AKIVA, M.E. (1977): Choice models with simple choice set generating processes. Working Paper. Centre for Transportation Studies. MIT. BEN A KIVA , M.E. Y BOLDUC, D. (1987): Approaches to model transferability and updating: the combined transfer estimator. Transportation Research Record 1139, 1-7. BEN A KIVA, M.E. Y BOLDUC, D. (1996): Multinomial probit with a logit kernel and a general parametric specification of the covariance structure. Working Paper, Department d’Economique, Université Laval. BEN AKIVA, M., BOLDUC, D. Y BRADLEY, M. (1993): Estimation of travel choice models with randomly distributed values of time. Transportation Research Record 1413, 88-97. BEN A KIVA , M.E. Y LERMAN, S.R. (1985): Discrete Choice Analysis: Theory and Application to Travel Demand. MIT Press, Cambridge, Mass. BEN A KIVA, M. Y MORIKAWA, T. (1990): Estimation of travel demand models from multiple data sources. Proceedings 11th International Symposium on Transportation and Traffic Theory. Yokohama, Julio 1990, Japón. BEN AKIVA, M.E. Y MORIKAWA, T. (1997): Methods to estimate discrete choice models with stated and revealed preferences. Working Paper, Centre for Transportation Studies, MIT. BEN AKIVA, M.E. Y WATANATADA, T. (1980): Application of a continuous spatial choice logit model. En C.F. Manski y D. McFadden (eds.), Structural Analysis of Discrete Data: With Econometric Applications. MIT Press, Cambridge, Mass.

MODELOS

DE

TRANSPORTE



BEN AKIVA, M., MORIKAWA, T. Y SHIROISHI, F. (1992): Analysis of the reliability of preference ranking data. Journal of Business Research 24, 149-164. BERNDT, E.U., HALL, B.H., HALL, R.E. Y HAUSMAN, J.A. (1974): Estimation and inference in non-linear structural models. Annals of Economic and Social Measurement 3/4, 653-655. BHAT, C. (2001): Quasi-random maximum simulated likelihood estimation of the mixed multinomial logit model. Transportation Research 35B, 677-695. BIANCHI, R., JARA-DÍAZ , S.R. Y O RTÚZAR , J. DE D. (1998): Modelling new pricing strategies for the Santiago Metro. Transport Policy 5, 223-232. BLASE, J.H. (1979): Hysteresis and catastrophe theory: a demonstration of habit and threshold effects in travel behaviour. Proceedings 7th PTRC Summer Annual Meeting, University of Warwick, Julio 1979, Inglaterra. BONSALL, P.W. (1983): Transfer price data: its use and abuse. Proceedings 11th PTRC Summer Annual Meeting, University of Sussex, Julio 1983, Inglaterra. B ÖRSCH -SUPAN, A. Y H AJIVASSILIOU, V.A. (1993): Smooth unbiased multivariate probability simulators for maximum likelihood estimation of limited dependent variable models. Journal of Econometrics 58, 347-368. BOYCE, D.E., DAY, N.D. Y MCDONALD, C. (1970): Metropolitan Plan Making. Monograph Series No. 4, Regional Science Research Institute, Filadelfia. BRADLEY, M. (1988): Realism and adaptation in designing hypothetical travel choice concepts. Journal of Transport Economics and Policy XXII. 121-137. BRADLEY, M.A. Y DALY, A.J. (1994): Use of the logit scaling approach to test for rank-order and fatigue effects in stated preference data. Transportation 21, 167-184. BRADLEY, M.A. Y DALY, A.J. (1997): Estimation of logit choice models using mixed stated-preference and revealed-preference information. En P. Stopher y M. LeeGosselin (eds.), Understanding Travel Behaviour in an Era of Change. Pergamon, Oxford. BRADLEY, M. Y DALY, A.J. (2000): New analysis issues in stated preference research. En J. de D. Ortúzar (ed.), Stated Preference Modelling Techniques. Perspective 4, PTRC, Londres. BRADLEY, M.A. Y K ROES, E. (1990): Forecasting issues in stated preference survey research. 69th TRB Annual Meeting, Washington DC, Enero 1990, USA. BRANSTON, D. (1976): Link capacity functions: a review. Transportation Research 10, 223-236. BRENNINGER-GOTHE, M., JORNSTEN K. Y LUNDGREN, J. (1989): Estimation of origindestination matrices from traffic counts using multiobjective programming formulations. Transportation Research 23B, 257-269. BRISTOW, A.L., JANSEN, G., M ACKIE , P.J. Y NELLTHORP, J. (1998): Costs, prices and values in the appraisal of transport projects – European principles and practice. Proceedings 8th World Conference on Transport Research, Amberes, Julio 1998, Bélgica.



Bibliografía

BRÖG, W. Y AMPT, E. (1982): State of the art in the collection of travel behaviour data. In Travel Behaviour for the 1980’s, Special Report 201, National Research Council, Washington, DC. BRÖG, W. Y ERL, E. (1982): Application of correction and weighting factors to obtain a representative data base. Proceedings l0th PTRC Summer Annual Meeting, University of Warwick, Julio 1982, Inglaterra. BRÖG, W. Y M EYBURG, A.H. (1980): The non-response problem in travel surveys: an empirical investigation. Transportation Research Record 775, 34-38. BRÖG, W., ERL, E., MEYBURG, A.H. Y WERMUTH, M.J. (1982): Problems of non-reported trips in surveys of non-home activity patterns. Transportation Research Record 891, 1-5. BROWNSTONE, D. (1998): Multiple imputation methodology for missing data: non-random response and panel attrition. En T. Gärling, T. Laitila y K. Weslin (eds.), Theoretical Foundations of Travel Choice Modelling. Elsevier, Oxford. BRUTON, M.J. (1985): Introduction to Transportation Planning. Hutchinson, Londres. BRUZELIUS, N. (1979): The Value of Travel Time. Croom Helm, Londres. BUREAU OF PUBLIC ROADS (1964): Traffic Assignment Manual. Urban Planning Division, US Department of Commerce, Washington, DC. BURRELL, J.E. (1968): Multiple route assignment and its application to capacity restraint. En W. Leutzbach y P. Baron (eds.), Beiträge zur Theorie des Verkehrsflusses. Strassenbau und Strassenverkehrstechnik Heft, Karlsruhe. BUTTON, K.J., PEARMAN, A.D. Y FOWKES, A.S. (1982): Car Ownership Modelling and Forecasting. Gower, Aldershot. CALDWELL, L.C. Y DEMETSKI, M.J. (1980): Transferability of trip generation models. Transportation Research Record 751, 56-62. CARDELL, N.S. Y REDDY, B. (1977): A multinomial logit model which permits variations in tastes accross individuals. Working Paper, Charles River Associates, Boston. CARRASCO, J.A. Y ORTÚZAR, J. DE D. (2001): A review and assessment of the nested logit model. Transport Reviews 21, 197-218. CARSON, R.T., LOUVIERE, J.J., ANDERSON, D.A., ARABIE, P., BUNCH, D.S., HENSHER, D.A., JOHNSON, R.M., KUHFELD, W.F., STEINBERG, D., SWAIT, J., TIMMERMANS, H. Y WILEY, J.B. (1994): Experimental analysis of choice. Marketing Letters 5, 351-368. CARSON, R.T., WRIGHT, J., CARSON, N., ALBERINI, A. Y FLORES, N. (1995): A Bibliography of Contingent Valuation Studies and Papers. Natural Resource Damage Assessment, La Jolla. CASCETTA, E. (1984): Estimation of trip matrices from traffic counts and survey data: a generalised least squares approach estimator. Transportation Research 18B, 289-299. CASCETTA, E. Y NGUYEN, S (1988): A unified framework for estimating or updating origin/destination matrices from traffic counts. Transportation Research 22B, 437-455. CASCETTA, E., NUZZOLO, A. Y BIGGIERO, L. (1992): Analysis and modelling of commuters, departure time and route choice in urban networks. Proceedings of the Second

MODELOS

DE

TRANSPORTE



International CAPRI Seminar in Urban Traffic Network, Capri, Octubre 1992, Italia. CASEY, H.J. (1955): Applications to traffic engineering of the law of retail gravitation. Traffic Quarterly IX. 23-35. CHADWICK, G. (1987): Models of Urban and Regional Systems in Developing Countries. Pergamon Press, Oxford. C HAMBERLAIN, G. (1984): Panel data. En Z. Griliches y M.D. Intriligator (eds.), Handbook of Econometrics, Vol. 2. North-Holland, Amsterdam. CHAPMAN, R.G. Y STAELIN, R. (1982): Exploiting rank ordered choice set data within the stochastic utility model. Journal of Marketing Research XIX, 288-301. CHERCHI, E. Y MELONI, I. (2004): Pianificazione dei sistemi di trasporto. Ed. Hoepli. CHESNUT, L.G., OSTRO, B.D. Y VICHIT-VADAKAN, N. (1997): Transferability of air pollution control health benefit estimates from the United States to developing countries: evidence from the Bangkok study. American Journal of Agricultural Economics 79, 1630-1635. CIRILLO, C., DALY, A.J. Y LINDVELD, K. (2000): Eliminating bias due to the repeated measurements problem in SP data. En J. de D. Ortúzar (ed.), Stated Preference Modelling Techniques. Perspectives 4, PTRC, Londres. CLANCY, M., DAWSON, J., CATLING, I., TURNER, J. Y HARRISON, W. (1985): Electronic road pricing in Hong Kong. Proceedings 13th PTRC Summer Annual Meeting. University of Sussex, Julio 1985, Inglaterra. CLARK , C.E. (1961): The greatest of a finite set of random variables. Operations Research 9, 145-162. COMMISSION OF THE EUROPEAN COMMUNITIES (1994): Cost-Benefit and Multi-Criteria Analysis for New Road Construction. DGVII, Research and Development Unit, Bruselas. COPLEY, G. Y LOWE, S.R. (1981): The temporal stability of trip rates: some findings and implications. Proceedings 9th PTRC Summer Annual Meeting, University of Warwick, Julio 1981, Inglaterra. COSLETT, S.R. (1981): Efficient estimation of discrete choice models. En C.F. Manski y D. McFadden (eds.), Structural Analysis of Discrete Data: With Econometric Applications. MIT Press, Cambridge, Mass. CROPPER, M.L. Y FREEEMAN, A.M. (1991): Environmental health effects. En J.B. Braden y C.D. Kolstad (eds.), Measuring the Demand for Environmental Quality. NorthHolland, Amsterdam. CROW, R.T., YOUNG, K.H. Y COOLEY, T. (1973): Alternative demand functions for abstract transportation modes. Transportation Research 7, 335-354. DAGANZO, C.F. (1979): Multinomial Probit: The Theory and its Applications to Demand Forecasting. Academic Press, Nueva York. DAGANZO, C.F. (1980): Optimal sampling strategies for statistical models with discrete dependent variables. Transportation Science 14, 324-345.



Bibliografía

DAGANZO, C.F. Y SCHOENFELD, L. (1978): CHOMP user’s manual. Research Report UCB-ITS-RR-78-7, Institute of Transportation Studies, University of California at Berkeley. DAGANZO, C.F. Y SHEFFI, Y. (1979): Estimation of choice models from panel data. 26th Annual Meeting of the Regional Science Association, Los Ángeles, Noviembre 1979, USA. DALVI, Q.M. (1988): The Value of Life and Safety: A Search for a Consensus Estimate. Department of Transport, Londres. DALY, A.J. (1982a): Estimating choice models containing attraction variables. Transportation Research 16B, 5-15. DALY, A.J. (1982b): Applicability of disaggregate models of behaviour: a question of methodology. Transportation Research 16A, 363-370. DALY, A.J. (1987): Estimating “tree” logit models. Transportation Research 21B, 251-268. DALY, A.J. (1992): ALOGIT 3.2 User’s Guide. Hague Consulting Group, La Haya. DALY, A.J. (1997): Improved methods for trip generation. Proceedings 25th European Transport Conference, Vol. P415, pp. 207-222, PTRC, Londres. DALY, A.J. Y GUNN, H.F. (1986): Cost effective methods for national level demand forecasting. En A. Ruhl (ed.), Behavioural Research for Transport Policy. VNU Science Press, Utrecht. DALY, A.J. Y ORTÚZAR, J. DE D. (1990): Forecasting and data aggregation: theory and practice. Traffic Engineering and Control 31, 632-643. DALY, A.J. Y ZACHARY, S. (1978): Improved multiple choice models. En D.A. Hensher y M.Q. Dalvi (eds.), Determinants of Travel Choice. Saxon House, Westmead. DALY, A.J., VAN DER VALK, J. Y VAN ZWAM, H.P.H. (1983): Application of disaggregate models for a regional transportation study in the Netherlands. En P. Baron y H. Nuppnau (eds.), Research for Transport Policies in a Changing World. SNV Studiengesellschaft Nahverkehr, Hamburgo. DAOR, E. (1981): The transferability of independent variables in trip generation models. Proceedings 9th PTRC Summer Annual Meeting, University of Warwick, Julio 1981, Inglaterra. DARGAY, J. Y GATELY, D. (1999): Income’s effect on car and vehicle ownership, worldwide: 1960-2015. Transportation Research 33A, 101-138. DE CEA, J. Y CRUZ, G. (1986): ESMATUC: un modelo de estimación de matrices de viajes en transporte urbano colectivo. Apuntes de Ingeniería 24, 109-125. DE CEA, J. Y FERNÁNDEZ, J.E. (1989): Transit assignment to minimal routes: an efficient new algorithm. Traffic Engineering and Control 30, 491-494. DE CEA, J. Y FERNÁNDEZ , J.E. (2000): ESTRAUS: un modelo de equilibrio ofertademanda para redes multi-modales de transporte urbano con múltiples clases de usuarios. En J. Colomer y A. García (eds.), Calidad e Innovación en los Transportes. Universidad de Valencia, Valencia.

MODELOS

DE

TRANSPORTE



D E C EA , J., O RTÚZAR , J. DE D. Y WILLUMSEN , L.G. (1986): Evaluating marginal improvements to a transport network: an application to the Santiago underground. Transportation 13, 211-233. DEHGHANI, Y. Y TALVITIE, A.P. (1980): Model specification, model aggregation and market segmentation in mode choice models: some empirical evidence. Transportation Research Record 775, 28-34. DEHGHANI, Y. Y TALVITIE, A.P. (1983): Forecasting accuracy, transferability and updating of modal constants in disaggregate mode choice models with simple and complex specifications. Proceedings 11th PTRC Summer Annual Meeting. University of Sussex, Julio 1983, Inglaterra. DE JONG, G.C. (1989): Some Joint Models of Car Ownership and Use. PhD Thesis, Faculteit der Economishe, Universiteit van Amsterdam. D EPARTMENT OF H EALTH (1999): Economic Appraisal of the Health Effects of Air Pollution. Ad Hoc Group on Economic Appraisal of the Health Effects of Air Pollution. HMSO, Londres. DEPARTMENT OF TRANSPORT (1985): Traffic Appraisal Manual (TAM). HMSO, Londres. DEPARTMENT OF TRANSPORT (1987): Values for Journey Time Savings and Accident Prevention. HMSO, Londres. DEPARTMENT OF TRANSPORT (1997): Traffic Appraisal of Road Schemes: Design Manual for Roads and Bridges. HMSO, Londres. DE SERPA, A. (1971): A theory of the economics of time. Economic Journal 81, 828846. DETR (1998): A New Deal for Highways in England. Guidance to the New Appraisal Framework. Department of the Environment. Transport and the Regions, Londres. DEVILLE, J.C., SÄRNDAL, C.E. Y SAUTORY, O. (1993): Generalised ranking procedures in survey sampling. Journal of the American Statistical Association 88, 10131020. DIAL, R.B. (1971): A probabilistic multipath traffic assignment model which obviates path enumeration. Transportation Research 5, 83-111. DIAMOND, P. Y H AUSSMAN, J.A. (1994): Contingent valuation: is some number better than no number? Journal of Economic Perspectives 8, 45-64. DICTUC (1978): Encuesta origen y destino de viajes para el Gran Santiago. Final Report to the Ministry of Public Works. Department of Transport Engineering. Universidad Católica de Chile, Santiago. DICTUC (1998): Actualización de encuestas origen-destino de viajes. Final Report to the Ministry of Planning, Department of Transport Engineering. Pontificia Universidad Católica de Chile, Santiago. DIJKSTRA, E.W. (1959): Note on two problems in connection with graphs (spanning tree, shortest path). Numerical Mathematics 1, 269-271. DOMENCICH, T. Y MCFADDEN, D. (1975): Urban Travel Demand: A Behavioural Analysis. North-Holland, Amsterdam.



Bibliografía

DOMENCICH, T.A., K RAFT, G. Y VALETTE, J.P. (1968): Estimation of urban passenger travel behaviour: an economic demand model. Highway Research Record 238, 64-278. DOUGLAS, A.A. Y LEWIS, R.J. (1970): Trip generation techniques: (1) Introduction; (2) Zonal least squares regression analysis. Traffic Engineering and Control 12, 362-365, 428-431. DOUGLAS, A.A. Y LEWIS, R.J. (1971): Trip generation techniques: (3) Household least squares regression analysis; (4) Category analysis and sumary of trip generation techniques. Traffic Engineering and Control 12, 477-9, 532-5. DOWNES, J.D. Y EMMERSON, P. (1983): Urban transport modelling with fixed travel budgets; an evaluation of the UMOT process. TRRL Supplementary Report SR 799, Transport and Road Research Laboratory, Crowthorne. DOWNES, J.D. Y GYENES, L. (1976): Temporal stability and forecasting ability of trip generation models in Reading. TRRL Report LR 726. Transport and Road Research Laboratory, Crowthorne. DUNCAN, G.J. JUSTER, F.T. Y MORGAN, J.N. (1987): The role of panel studies in research on economic behaviour. Transportation Research 21A, 249-263. DUNPHY, R.T. (1979): Workplace interviews as an efficient source of travel survey data. Transportation Research Record 701, 26-29. ECMT (1996): The Valuation of Environmental Externalities. European Conference of Ministers of Transport, París. ECMT (1998): Efficient Transport for Europe: Policies for Internalisation of External Costs. European Conference of Ministers of Transport, París. EILON, S. (1972): Goals and constraints in decision making. Operations Research Quarterly 23, 3-15. ENGLAND, J., HUDSON, K., MASTERS, R., POWELL, K. AND SHORTRIDGE, J. (eds.) (1985): Information Systems for Policy Planning in Local Government. Longman, Harlow. ESTRAUS (1989): Estudio estratégico de transporte del Gran Santiago. Final Report to the Executive Secretariat of the Urban Transport Commission. Consorcio SIGDOKOPPERS/ CIS, Santiago. ETTEMA, D., GUNN, H., DE JONG, G. Y LINDVELD, K. (1997): A simulation method for determining the confidence interval of a weighted group average value of time. Proceedings 25th European Transport Forum, Brunel University, Septiembre 1997, Inglaterra. EVANS, A. (1972): On the theory of the valuation and allocation of time. Scottish Journal of Political Economy 19, 1-17. EVANS, S.P. (1973): A relationship between the gravity model for trip distribution and the transportation problem in linear programming. Transportation Research 7, 39-61. EVANS , S.P. (1976): Derivation and analysis of some models for combining trip distribution and assignment. Transportation Research 10, 37-57.

MODELOS

DE

TRANSPORTE



EVANS, S.P. Y KIRBY, H.R. (1974). A three dimensional Furness procedure for calibrating gravity models. Transportation Research 8, 105-122. FEITELSON, E., HURD, R. Y MUDGE, R. (1996): The impact of airport noise on willingnessto-pay for residences. Transportation Research 1D, 1-14. FERNÁNDEZ, J.E. Y FRIESZ, T.L. (1983): Equilibrium predictions in transportation markets: the state of the art. Transportation Research 17B, 155-172. FERNÁNDEZ, J.E., COEYMANS, J.E. Y ORTÚZAR, J. DE D. (1983): Evaluating extensions to the Santiago underground system. Proceedings 11th PTRC Summer Annual Meeting. University of Sussex, Julio 1983, Inglaterra. FHWA (1967): Guidelines for Trip Generation Analysis. Federal Highway Administration, US Department of Transportation, Washington, DC. FIELLER, E. (1933): The distribution of the index in a Normal bivariate population. Biometrika XXIV, 428-440. FISK, C.S. (1988): On combining maximum entropy trip matrix estimation with user optimal assignment. Transportation Research 22B, 69-73. FLORIAN, M. Y NGUYEN, S. (1978): A combined trip distribution modal split and trip assignment model. Transportation Research. 12, 241-246. FLORIAN, M. Y SPIESS, H. (1982): The convergence of diagonalization algorithms for asymmetric network equilibrium problems. Transportation Research 16B, 477-484. FLORIAN, M., GAUDRY, M. Y LARDINOIS, C. (1988): A two-dimensional framework for the understanding of transportation planning models. Transportation Research 22B, 411-419. FLORIAN, M., WU, J.H. Y H E, S. (1999): A multi-class multi-mode variable demand network equilibrium model with hierarchical logit structures. En J.E. Coeymans y P. Sommariva (eds.), Actas del IX Congreso Chileno de Ingeniería de Transporte. Sociedad Chilena de Ingeniería de Transporte, Santiago. FOERSTER , J.F. (1979): Mode choice decision process models: a comparison of compensatory and non-compensatory structures. Transportation Research 13A, 17-28. FOERSTER , J.F. (1981): Nonlinear and non-compensatory perceptual functions of evaluations and choice. En P.R. Stopher, A.H. Meyburg y W. Brög (eds.), New Horizons in Travel Behaviour Research. D.C. Heath and Co., Lexington, Mass. FOOT, D. (1981): Operational Urban Models. Methuen, Londres. FOWKES, A.S. (2000): Recent developments in stated preference techniques in transport research. En J. de D. Ortúzar (ed.), Stated Preference Modelling Techniques. Perspectives 4, PTRC, Londres. FOWKES, A.S. Y TWEDDLE, G. (2000): Validation of stated preference forecasting: a case study involving anglo-continental freight. En J. de D. Ortúzar (ed.), Stated Preference Modelling Techniques. Perspectives 4, PTRC, Londres.



Bibliografía

FOWKES, A.S. Y WARDMAN, M. (1988): The design of stated preference travel choice experiments, with special reference to interpersonal taste variations. Journal of Transport Economics and Policy XXII, 27-44. FRIEDRICH, R., BICKEL, P. Y K REWITT, W. (eds.) (1998): External Costs of Transport. IER, Universität Stuttgart. FRIESZ, T.L., TOBIN, R. Y HARKER, P. (1983): Predictive intercity freight network models: the state of the art. Transportation Research 17A, 409-417. FURNESS, K.P. (1965): Time function iteration. Traffic Engineering and Control, 7, 458-460. GALBRAITH, R.A. Y HENSHER, D.A. (1982): Intra-metropolitan transferability of mode choice models. Journal of Transport Economics and Policy XVI, 7-29. GÁLVEZ, T. (1989): Preferencias declaradas en estudios de transporte: metodología y aplicaciones. En J. de Cea y S. González (eds.), Actas IV Congreso Chileno de Ingeniería de Transporte. Sociedad Chilena de Ingeniería de Transporte, Santiago. GÁLVEZ, T. Y JARA-DÍAZ, S.R. (1998): On the social valuation of travel time savings. International Journal of Transport Economics 25, 205-219. GÁRATE, C. (1988): Utilización y actualización de la información de la Encuesta OrigenDestino del Gran Valparaíso. Actas del V Congreso Panamericano de Ingeniería de Tránsito y Transporte, Universidad de Puerto Rico en Mayagüez, Julio 1988, Puerto Rico. GARRIDO, R.A. (1992): The influence of the semantic scale on the estimation of values of time from linear regression models fitted to stated preference data. Working Paper 62, Department of Transport Engineering, Pontificia Universidad Católica de Chile, Santiago. GARRIDO, R.A. Y ORTÚZAR, J. DE D. (1993): The Chilean value of time study: methodological developments. Proceedings 21st PTRC Summer Annual Meeting, University of Manchester Institute of Science and Technology, Septiembre 1993, Inglaterra. GARTNER, N.H. (1980): Optimal traffic assignment with elastic demands: a review. Transportation Science 14, 192-208. GAUDRY, M.J.I. Y WILLS, M.I. (1978): Estimating the functional form of travel demand models. Transportation Research 12, 257-289. GAUDRY, M.J.I., JARA-DÍAZ, S.R. Y ORTÚZAR, J. DE D. (1989): Value of time sensitivity to model specification. Transportation Research 23B, 151-158. GIBSON, J. BAEZA, I. Y WILLUMSEN, L.G. (1989): Congestion, bus stops and congested bus stops. Traffic Engineering and Control 30, 291-296. GLAISTER, S. (1999): Observations on the new approach to the appraisal of road projects. Journal of Transport Economics and Policy XXXIII, 227-234. GOLDENBERG, X. (1996): Choosing a household survey method: results for the Dallas-Fort Worth pretest. Fourth International Conference on Survey Methods in Transport. Oxford, Julio 1996, Inglaterra.

MODELOS

DE

TRANSPORTE



GOLOB, T.F. Y RICHARDSON, A.J. (1981): Non-compensatory and discontinuous constructs in travel behaviour models. En P.R. Stopher, A.H. Meyburg y W. Brög (eds.), New Horizons in Travel Behaviour Research, D.C. Heath and Co., Lexington, Mass. GOODWIN, P. (1977): Habit and hysteresis in mode choice. Urban Studies 14, 95-98. GOPINATH, D.A. Y BEN A KIVA, M. (1995): Estimation of randomly distributed value of time. Working Paper, Department of Civil and Environmental Engineering, MIT. GRAY, R. (1982): Behavioural approaches in freight transport modal choice. Transport Reviews 2, 161-184. G REENBLAT, C. Y D UKE , R. (1975): Gaming-Simulation: Rationale, Design and Applications. John Wiley & Sons, Nueva York. GUNN, H.F. (1984): An analysis of transfer price data. Proceedings 12th PTRC Summer Annual Meeting, University of Sussex, Julio 1984, Inglaterra. GUNN, H.F. (1985a): Value of time for evaluation purposes: the state of the art. Report No. 421-01, Hague Consulting Group, La Haya. GUNN, H.F. (1985b): Artificial sample applications for spatial interaction models. Colloquium Vervoersplanologisch Speurwerk, La Haya, Noviembre 1985, Holanda. GUNN, H.F. Y BATES , J.J. (1982): Statistical aspects of travel demand modelling. Transportation Research 16A, 371-382. GUNN, H.F. Y POL, H. (1986): Model transferability: the potential for increasing costeffectiveness. En A. Ruhl (ed.), Behavioural Research for Transport Policy. VNU Science Press, Utrecht. GUNN, H.F., K IRBY, H.R., MURCHLAND, J.D. Y WHITTAKER , J.C. (1980): The RHTM trip distribution investigation. Proceedings 8th PTRC Summer Annual Meeting. University of Warwick, Julio 1980, Inglaterra. GUNN, H.F., FISHER, P., DALY, A.J. Y POL, H. (1982): Synthetic samples as a basis for enumerating disaggregate models. Proceedings 10th PTRC Summer Annual Meeting, University of Warwick, Julio 1982, Inglaterra. GUNN, H.F., BEN AKIVA, M.E. Y BRADLEY, M.A. (1985): Tests of the scaling approach to transferring disaggregate travel demand models. Transportation Research Record 1037, 21-30. GUR , Y.J. (1982): Recalibration of disaggregate mode choice models based on onboard survey data. Proceedings 10th PTRC Summer Annual Meeting. University of Warwick, Julio 1982, Inglaterra. HAJIVASSILIOU, V.A. Y RUUD, P. (1994): Classical estimation methods for LDV models using simulation. En R. Engle and D. McFadden (eds.), Handbook of Econometrics, Vol. IV. Elsevier Science, Amsterdam. H ALL , M.D., DALY, A.J., DAVIES , R.F. Y RUSSELL , C.H. (1987): Modelling for an expanding city. Proceedings 15th PTRC Summer Annual Meeting. University of Bath, Septiembre 1987, Inglaterra.



Bibliografía

H ALL , M.D., VAN VLIET, D. Y WILLUMSEN, L.G. (1980): SATURN – a simulation assignment model for the evaluation of traffic management schemes. Traffic Engineering and Control 21, 168-176. H ANEMANN, W.M. (1994): Valuing the environment through contingent valuation. Journal of Economic Perspectives 8, 19-43. HANSSON, L. Y MERKHAM, J. (1992): Internalisation of External Costs in Transportation. IRU, París. HARKER, P.T. (1985): The state of the art in the predictive analysis of freight transport systems. Transport Reviews 5, 143-164. HARKER, P.T. (1987): Predicting Intercity Freight Flows. VNU Science Press, Utrecht. HARTLEY, T.M. Y ORTÚZAR, J. DE D. (1980): Aggregate modal split models: is current U.K. practice warranted? Traffic Engineering and Control 21, 7-13. HAUSER, J.R. (1978): Testing the accuracy, usefulness and significance of probabilistic choice models: an information theoretic approach. Operations Research 26, 406-421. H AUSMAN, J.A. (ed.) (1993): Contingent Valuation: A Critical Assessment, NorteHolanda, Amsterdam. HCG (1990): The Netherlands Value of Time Study. Final Report to the Dienst Verkeerskunde, Rijkswaterstaat, Hague Consulting Group, La Haya. HCG, HALCROW FOX AND IMPERIAL COLLEGE LONDON (2000): User Manual for HADES 1.0. Prepared for the Department of the Environment, Transport and the Regions, Londres. H ECKMAN, J.J. (1981): Statistical models for discrete panel data. En C.F. Manski y D. McFadden (eds.), Structural Analysis of Discrete Data: With Econometric Applications. MIT Press, Cambridge, Mass. HEGGIE, I.G. (1983): Valueing savings in non working time: the empirical dilemma. Transportation Research 17A, 13-23. HENDRICKSON, C. Y KOCUR, G. (1981): Schedule delay and departure time decisions in a deterministic model. Transportation Science 15, 62-77. HENDRICKSON, C. Y PLANK, E. (1984): The flexibility of departure times for work trips. Transportation Research 18A, 25-36. H ENSHER , D.A. (1976): Valuations of commuter travel time savings: an alternative procedure. En I.G. Heggie (ed.), Modal Choice and the Value of Time. Clarendon Press, Oxford. HENSHER, D.A. (1986): Sequential and full information maximum likelihood estimation of a nested 1ogit model. The Review of Economics and Statistics 68, 657-667. HENSHER, D.A. (1987): Issues in the pre-analysis of panel data. Transportation Research 21A, 265-285. HENSHER, D.A. (1991): Hierarchical stated response designs and estimation in the context of bus use preferences. Logistics and Transportation Reviews 26, 299-323. HENSHER, D.A. (1994a): Stated preference analysis of travel choices: the state of practice. Transportation 21, 107-133.

MODELOS

DE

TRANSPORTE



HENSHER, D.A. (guest ed.) (1994b): Practice of stated preference methods. Transportation 21, 105-230. H ENSHER, D.A. Y JOHNSON, L.W. (1981): Applied Discrete Choice Modelling. Croom Helm, Londres. HÖGBERG, P. (1976): Estimation of parameters in models for traffic prediction: a nonlinear regression approach. Transportation Research 10, 263-265. HOLDEN, D., FOWKES, A.S. Y WARDMAN, M. (1992): Automatic stated preference design algorithms. Proceedings 20th PTRC Summer Annual Meeting. University of Manchester Institute of Science and Technology, Septiembre 1992, Inglaterra. HOLM, J., JENSEN, T., NIELSEN, S., CHRISTENSEN, A., JOHNSEN, B. Y RONBY, G. (1976): Calibrating traffic models on traffic census results only. Traffic Engineering and Control 17, 137-140. HOLZ, J.C. Y SÁNCHEZ, J.M. (2000): Estimación de costos unitarios en morbilidad y mortalidad y su aplicación para calcular los beneficios del plan de prevención y descontaminación atmosférica de la Región Metropolitana. Working Paper, Department of Economics, Universidad de Chile, Santiago. HOROWITZ, J.L. (1981a): Sources of error and uncertainty in behavioural travel demand models. En P.R. Stopher, A.H. Meyburg y W. Brög (eds.), New Horizons in Travel Behaviour Research. D.C. Heath and Co., Lexington, Mass. HOROWITZ, J.L. (1981b): Sampling error, specification and data errors in probabilistic discrete choice models. Apéndice C de D.A. Hensher and L.W. Johnson, Applied Discrete Choice Modelling. Croom Helm, Londres. HOROWITZ, J.L. (1982): Specification tests for probabilistic choice models. Transportation Research 16A, 383-394. HOROWITZ, J.L. (1991): Reconsidering the multinomial probit model. Transportation Research 25B, 433-438. HOROWITZ, J.L., SPARMANN, J.M. Y DAGANZO, C.F. (1982): An investigation of the accuracy of the Clark approximation for the multinomial probit model. Transportation Science 16, 382-401. HUBER , J. Y H ANSON, D. (1986): Testing the impact of dimensional complexity and affective differences of paired concepts in adaptive conjoint analysis. Working Paper, School of Business, Duke University. HYMAN, G.M. (1969): The calibration of trip distribution models. Environment and Planning 1, 105-112. HYMAN, G. (1997): The development of operational models for time period choice. Working Paper, HETA Division, Department of the Environment, Transport and the Regions, Londres. INRO (1996): EMME/2 User’s Manual. INRO Inc., Montreal. JANSEN, G.R.M. Y BOVY, P.H.L. (1982): The effect of zone size and network detail on all-or-nothing and equilibrium assignment outcomes. Traffic Engineering and Control 23(6), 311-317.



Bibliografía

JARA-DÍAZ, S.R. (1990a): Consumer’s surplus and the value of travel time savings. Transportation Research 24B, 73-77. JARA-DÍAZ, S.R. (1990b): Income and taste in mode choice models: are they surrogates? Transportation Research 25B, 341-350. JARA-DÍAZ, S.R. (1998): Time and income in travel choice: towards a microeconomic activity framework. En T. Garling, T. Laitila y K. Westin (eds.), Theoretical Foundations of Travel Choice Modelling. Pergamon, Oxford. JARA-DÍAZ, S.R. (2000): Allocation and valuation of travel time savings. En D. Hensher y K.J. Button (eds.), Handbook of Transport Modelling. Pergamon, Oxford. JARA-DÍAZ , S.R. Y FARAH, M. (1987): Transport demand and user’s benefits with fixed income: the goods/leisure trade-off revisited. Transportation Research 21B, 165-170. JARA-DÍAZ, S.R. Y GUEVARA, A. (2000): The contribution of work, leisure and travel to the subjective value of travel time savings. Proceedings of the European Transport Conference 2000, Cambridge, Septiembre 2000, Inglaterra. JARA-DÍAZ, S.R. Y ORTÚZAR, J. DE D. (1989): Introducing the expenditure rate in the estimation of mode choice models. Journal of Transport Economics and Policy XXIII, 293-308. JARA-DÍAZ , S.R., ORTÚZAR , J. DE D. Y PARRA, R. (1988): Valor subjetivo del tiempo considerando efecto ingreso en la partición modal. Actas del V Congreso Panamericano de Ingeniería de Tránsito y Transporte. Universidad de Puerto Rico en Mayagüez, Julio 1988, Puerto Rico. JOHNSON, L.W. (1990): Discrete choice analysis with ordered alternatives. En M.M. Fisher, P. Nijkamp y Y.Y. Papageorgiou (eds.), Spatial Choices and Processes. North-Holland, Amsterdam. JOHNSON, L.W. Y H ENSHER, D.A. (1982): Application of multinomial probit to a twoperiod panel data set. Transportation Research 16A, 457-464. JOHNSON, M. (1966): Travel time and the price of leisure. Western Economic Journal 8, 135-145. JONES-LEE, M.W., HAMMERTON, M. Y PHILIPS, P.R. (1985): The value of safety: results of a national sample survey. Economic Journal 95, 49-72. JONES-LEE, M.W., L OOMES, G., O’R EILLY, D.M. Y P HILIPS, P.R. (1992): The value of preventing non-fatal road injuries: findings of a willingness-to-pay national sample survey. TRL Contractor Report 330. Transport Research Laboratory, Crowthorne. KANNEL, E.J. Y HEATHINGTON, K.W. (1973): Temporal stability of trip generation relations. Highway Research Record 472, 17-27. K HAN, A. Y WILLUMSEN, L.G. (1986): Modelling car ownership and use in developing countries. Traffic Engineering and Control 27, 554-560. K IM, T.J. Y H INKLE, J. (1982): Model for statewide freight transportation planning. Transportation Research Record 889, 15-19.

MODELOS

DE

TRANSPORTE



KIMBER, R.M. Y HOLLIS, E.M. (1979): Traffic queues and delays at road junctions. TRRL Report LR 909. Transport and Road Research Laboratory, Crowthorne. K IRBY, H.R. (1979): Partial matrix techniques. Traffic Engineering and Control 20, 422-428. K ITAMURA, R. Y BOVY, P.H.L. (1987): Analysis of attrition biases and trip reporting errors for panel data. Transportation Research 21A, 287-302. KOCUR, G.T., A DLER, T., HYMAN, W. Y AUNET, B. (1982): Guide to forecasting travel demand with direct utility assessment. Report No. UMTA-NH-11-0001-82, Urban Mass Transportation Administration, US Department of Transportation, Washington, DC. KOPPELMAN, F.S. (1976): Guidelines for aggregate travel prediction using disaggregate choice models. Transportation Research Record 610, 19-24. KOPPELMAN, F.S., KUAH , G-K. Y ROSE G. (1985a): Transfer model updating with aggregate data. 64th Annual TRB Meeting, Washington, DC, Enero 1985, USA. KOPPELMAN, F.S., KUAH, G-K. Y WILMOT, C.G. (1985b): Transfer model updating using disaggregate data. Transportation Research Record 1037, 102-107. KOPPELMAN, F.S. Y WEN, C.H. (1998): Alternative nested logit models: structure, properties and estimation. Transportation Research 32A, 289-298. KOPPELMAN, F.S. Y WILMOT, C.G. (1982): Transferability analysis of disaggregate choice models. Transportation Research Record 895, 18-24. K RAFT, G. (1968): Demand for intercity passenger travel in the Washington-Boston corridor. North-East Corridor. Project Report, Systems Analysis and Research Corporation, Boston, Mass. K RESGE , D.T. Y ROBERTS, P.O. (1971): Techniques of Transport Planning: Systems Analysis and Simulation Models. Brookings Institution, Washington, DC. K RUITHOF, J. (1937): Calculation of telephone traffic. Der Ingenieur 52, E15-E25. K RUSKAL , J.B. (1965): Analysis of factorial experiments by estimating monotone transformations of the data. Journal of the Royal Statistical Society 27B, 251-263. KUMAR , A. (1980): Use of incremental form of logit models in demand analysis. Transportation Research Record 775, 21-27. KURRI, J. Y PURSULA, M. (1995): Finish preliminary value of time studies. Working Paper, Laboratory of Transportation Engineering, Helsinki University of Technology. LAMB, G.M. Y HAVERS, G.E. (1970): Introduction to transportation planning: treatment of networks. Traffic Engineering and Control 11, 486-489. LAMOND, B. Y STEWART, N.F. (1981): Bregman’s balancing method. Transportation Research 15B, 239-248. LANCASTER , K.J. (1966): A new approach to consumer theory. Journal of Political Economy 14, 132-157. LANDEFELD, J.S. Y SESKIN, E.P. (1982): The economic value of life: linking theory to practice. American Journal of Public Health 72, 555-566.



Bibliografía

LANGDON, M.G. (1976): Modal split models for more than two modes. Proceedings 4th PTRC Summer Annual Meeting, University of Warwick, Julio 1976, Inglaterra. LANGDON, M.G. (1984): Methods of determining choice probability in utility maximising multiple alternative models. Transportation Research 18B, 209-234. LARSON, R.C. Y O DONI, A.R. (1981): Urban Operations Research. Prentice Hall, Englewood Cliffs, N.J. LEARNER, E. (1978): Specification Searches: Ad-Hoc Inference with Nonexperimental Data. John Wiley & Sons, Nueva York. LEE , N. Y DALVI, M.Q. (1969): Variations on the value of travel time. Manchester School 37, 213-236. LEE, N. Y K IRKPATRICK, C. (1996): Relevance and consistency of environmental impact assessment and cost-benefit analysis in project appraisal. Project Appraisal 11, 229-236. LEONARD, D. Y TOUGH, J. (1979): Validation work on CONTRAM – a model for use in the design of traffic management schemes. Proceedings 7th PTRC Summer Annual Meeting, University of Warwick, Julio 1979, Inglaterra. LEONARD, D.R. Y C OWER , P. (1982): User guide to CONTRAM Version 4. TRRL Supplementary Report 735. Transport and Road Research Laboratory, Crowthorne. LERMAN, S.R. (1984): Recent advances in disaggregate demand modelling. En M. Florian (ed.), Transportation Planning Models. North-Holland, Amsterdam. LERMAN, S.R. Y LOUVIERE, J.J. (1978): The use of functional measurement to identify the form of utility functions in travel demand models. Transportation Research Record 673, 78-85. LERMAN, S.R. Y MANSKI, C.F. (1976): Alternative sampling procedures for calibrating disaggregate choice models. Transportation Research Record 592, 24-28. LERMAN, S.R. Y MANSKI, C.F. (1979): Sample design for discrete choice analysis of travel behaviour: the state of the art. Transportation Research 13B, 29-44. LERMAN, S. Y MANSKI, C. (1981): On the use of simulated frequencies to approximate choice probabilities. En C. Manski. y D. McFadden (eds.), Structural Analysis of Discrete Data with Econometric Applications. MIT Press, Cambridge, Mass. LERMAN, S.R., M ANSKI, C.F. Y ATHERTON, T.J. (1976): Non-random sampling in the calibration of disaggregate choice models. Final Report to the Urban Planning Division. Federal Highway Administration, US Department of Transportation, Washington, DC. LEURENT, F.M. (1998): Multicriteria assignment modelling: making explicit the determinants of mode or path choice. En P. Marcotte y S. Nguyen (eds.), Equilibrium and Advanced Transportation Modelling. Kluwer Academic, Boston. LIEBERMAN, E. (1981): Enhanced NETSIM program. Transportation Research Board Special Report 194, 32-35. LIEM, T.C. Y GAUDRY, M.J.I. (1987): P-2: A program for the Box-Cox logit model with disaggregate data. Publication 525, Centre de Recherche sur les Transports, Université de Montreal.

MODELOS

DE

TRANSPORTE



LINDQUIST, J. Y A LGERS, S. (1998): Further research on the national Swedish value of time study. Proceedings 8th World Conference on Transport Research, Antwerp, Julio 1998, Bélgica. LITMAN, T. (1995): Transportation cost analysis: techniques, estimates and implications. Working Paper, Victoria Transport Policy Institute, Victoria, BC. LOUVIERE, J.J. (1988a): Conjoint analysis modelling of stated preferences: a review of theory, methods, recent developments and external validity. Journal of Transport Economics and Policy XXII, 93-119. LOUVIERE, J.J. (1988b): Analysing Decision Making: Metric Conjoint Analysis. Sage Publications, Newbury Park. LOUVIERE, J.J. (guest ed.) (1992): Special issue on experimental choice analysis. Journal of Business Research 24, 89-189. LOUVIERE, J.J., HENSHER, D.A. AND SWAIT, J. (2000): Stated Choice Methods: Analysis and Application. Cambridge University Press, Cambridge. L OW, D.E. (1972): A new approach to transportation systems modelling. Traffic Quarterly 26 (3), 391-404. LOWRY, I.S. (1965): A model of a metropolis. Technical Memorandum RM-4035-RC, The Rand Corporation, California. LUCE, R.D. Y SUPPES, P. (1965): Preference, utility and subjective probability. En R.D. Luce, R.R. Bush y E. Galanter (eds.), Handbook of Mathematical Psychology. John Wiley & Sons, Nueva York. MCDONALD, K.G. Y STOPHER , P.R. (1983): Some contrary indications for the use of household structure in trip generation analysis. Transportation Research Record 944, 92-100. MCFADDEN, D. (1978): Modelling the choice of residential location. En A. Karlquist, L. Lundquist, F. Snickars y J.W. Weibull (eds.), Spatial Interaction Theory and Planning Models. North-Holland, Amsterdam. MCFADDEN, D. (1989): A method of simulated moments for estimation of discrete response models without numerical integration. Econometrica 57, 995-1026. MCFADDEN, D. Y R EID, F.A. (1975): Aggregate travel demand forecasting from disaggregate behavioural models. Transportation Research Record 534, 24-37. MCFADDEN, D. Y TRAIN, K. (2000): Mixed MNL models for discrete response. Journal of Applied Econometrics 15, 447-470. MCK ELVEY, R.D. Y ZAVOINA W. (1975): A statistical model for the analysis of ordinal level dependent variables. Journal of Mathematical Sociology 4, 103-120. M ACKETT, R.L. (1985): Integrated land use-transport models. Transport Reviews 5, 325-343. M ACKINDER, I.H. Y EVANS, S.E. (1981): The predictive accuracy of British transport studies in urban areas. TRRL Supplementary Report SR 699, Transport and Road Research Laboratory, Crowthorne. MCLEOD, W.T. Y H ANKS, P. (eds.) (1986): The New Collins Concise Dictionary of the English Language. William Collins, Sons & Co., Glasgow.



Bibliografía

MCLOUGHLIN, J. (1969): Urban and Regional Planning: A Systems Approach. Faber & Faber, Londres. MCLYNN, J.M. Y WORONKA, T. (1969): Passenger demand and modal split models. Report 230, Northeast Corridor Transportation Project, U.S. Department of Transport, Washington, D.C. MCNEIL, S. Y HENDRICKSON, C. (1985): A regression formulation of the matrix estimation problem. Transportation Science 19, 278-292. MADDISON, D., PEARCE, D., JOHANSSON, O., CALTHROP, E., LITMAN, T. Y VERHOEF, E. (1996): The True Cost of Road Transport. Earthscan Publications, Londres. MAHER, M.J. (1983): Inferences on trip matrices from observations on link volumes: a Bayesian statistical approach. Transportation Research 17B, 435-447. MAHMASSANI, H. (2000): Trip timing. En D. Hensher y K.J. Button (eds.), Handbook of Transport Modelling. Pergamon, Oxford. M AHMASSANI , H.S. Y SINHA , K.C. (1981): Bayesian updating of trip generation parameters. Transportation Engineering Journal 107, 581-589. MANHEIM, M.L. (1979): Fundamentals of Transportation Systems Analysis. MIT Press Cambridge, Mass. MANSKI, C.F. Y LERMAN, S.R. (1977): The estimation of choice probabilities from choice based samples. Econometrica 45, 1977-1988. M ANSKI, C.F. Y MCFADDEN, D. (1981): Alternative estimators and sample designs for discrete choice analysis. En C.F. Manski y D. McFadden (eds.), Structural Analysis of Discrete Data: With Econometric Applications. MIT Press, Cambridge, Mass. MARTÍNEZ, F.J. (1987): La forma incremental del modelo logit: aplicaciones. Actas del III Congreso Chileno de Ingeniería de Transporte. Universidad de Concepción, Noviembre 1987, Chile. M ARTÍNEZ , F.J. (1992): The bid-choice land-use model: an integrated economic framework. Environment and Planning 24A, 871-875. M AUCH , S.P. Y ROTHENGATTER , W. (1995): External Effects of Transport. Union International des Chemins de Fer, París. MAYBERRY, J.P. (1973): Structural requirements for abstract-mode models of passenger transportation. En R.E. Quandt (ed.), The Demand for Travel: Theory and Measurement. D.C. Health and Co., Lexington, Mass. MEYER, R.J., LEVIN, I.P. Y LOUVIERE, J.J. (1978): Functional analysis of mode choice. Transportation Research Record 673, 1-7. M ITCHELL, R.C. Y CARSON, R.T. (1989): Using Surveys to Value Public Goods: The Contingent Valuation Method. Resources for the Future, Washington, DC. MOAVENZADEH, F., MARKOW, M., BRADEMEYER, B. Y SAFWAT, K. (1983): A methodology for intercity transportation planning in Egypt. Transportation Research 17A, 481-491. MOGRIDGE, M.J.H. (1983): The Car Market. Pion, Londres.

MODELOS

DE

TRANSPORTE



MOORE, E.F. (1957): The shortest path through a maze. Proceedings International Symposium on the Theory of Switching. Harvard University Press, Cambridge, Mass. MORIKAWA, T. (1996): A hybrid probabilistic choice set model with compensatory and non-compensatory choice rules. En D. Hensher, J. King y T. Oum (eds.), World Transport Research. World Conference on Transport Research Society, Sydney. MORIKAWA, T. Y SASAKI, K. (1998): Discrete choice models with latent variables using subjective data. En J. de D. Ortúzar, D. Hensher y S. Jara-Díaz (eds.), Travel Behaviour Research: Updating the State of Play. Pergamon, Oxford. MORIKAWA, T., BEN-AKIVA, M. Y YAMADA, K. (1992): Estimation of mode choice models with serially correlated RP and SP data. Proceedings 6th World Conference on Transport Research, Lyon, Junio 1992, Francia. MORLEY, R. (1972): Mathematics for Modern Economics. Fontana, Londres. MOSER, C.A. Y K ALTON, G.K. (1989): Survey Methods in Social Investigation. Libros Educativos Heinemann, Londres. MULLEN, S. (1997): Determining monetary values of environmental impacts – a DETR perspective. Presented at the conference Determining Monetary Values of Environmental Impacts, University of Westminster, Octubre 1997, Londres. MUNIZAGA, M.A. Y Á LVAREZ, R. (2000): Modelos mixed logit: uso y potencialidades. En L.A. Lindau, J. de D. Ortúzar y O. Strambi (eds.), Engenharia de Tráfego e Transportes 2000: Avanços para uma Era de Mudanças. ANPET, Río de Janeiro. MUNIZAGA, M.A., H EYDECKER , B.G. Y ORTÚZAR , J. DE D. (2000): Representation of heteroscedasticity in discrete choice models. Transportation Research 34B, 219-240. MURCHLAND, J.D. (1977): The multiproportional problem. TSG Note JDM-263. Transport Studies Group. University College London. MVA SYSTEMATICA (1982): TRIPS highway assignment model. MVA House, Working. NAH, C. (1997): Transport externalities: does monetary valuation make sense? En G. de Rus y C. Nash (eds.), Recent Developments in Transport Economics. Ashgate Press, Londres. NARDINI, A. (1997): A proposal for integrating environmental impact assessment, costbenefit analysis and multicriteria analysis in decision making. Project Appraisal 12, 173-184. NEWELL, GF. (1980): Traffic Flow on Transportation Networks. MIT Press, Cambridge, Mass. NUTT, P.C. (1981): Some guides to the selection of a decision making strategy. Technological Forecasting and Social Change 19, 133-145. OECD (1974): Urban Traffic Models: Possibilities For Simplification. OECD Road Research Group, París. OECD (1994a): Internalising the Social Costs of Transport. Organisation for Economic Cooperation and Development, París.



Bibliografía

OECD (1994b): Environmental Impact Assessment of Roads. Organisation for Economic Cooperation and Development, París. OECD (1994c): Project and Policy Appraisal: Integrating Economics and Environment. Organisation for Economic Cooperation and Development, París. OH, J.-H. (1989): Estimation of trip matrices in networks with equilibrium link flows. Proceedings 17th PTRC Summer Annual Meeting, University of Sussex, Septiembre 1989, Inglaterra. OI, K.I.Y. Y SHULDINER, P.W. (1962): An Analysis of Urban Travel Demands. Northwestern University Press, Evanston. OLSEN, G.D. Y SWAIT, J. (1998): Nothing is important. Working Paper. Faculty of Management, Universidad de Calgary. OORT, O. (1969): The evaluation of travelling time. Journal of Transport Economics and Policy 3, 279-286. ORTÚZAR, J. DE D. (1980a): Mixed-mode demand forecasting techniques. Transportation Planning and Technology 6, 81-95. ORTÚZAR, J. DE D. (1980b): Modelling park “n” ride and kiss “n” ride as submodal choices: a comment. Transportation 9, 287-291. ORTÚZAR , J. DE D. (1982): Fundamentals of discrete multimodal choice modelling. Transport Reviews 2, 47-78. ORTÚZAR, J. DE D. (1983): Nested logit models for mixed-mode travel in urban corridors. Transportation Research 17A, 283-299. ORTÚZAR, J. DE D. (1986): The cultural and temporal transferability of discrete choice disaggregate modal split models. En T.D. Heaver (ed.), Research for Tomorrow’s Transport Requirements. University of British Columbia, Vancouver. ORTÚZAR, J. DE D. (1989): Determining the preferences for frozen cargo exports. In World Conference on Transport Research (eds.), Transport Policy, Management and Technology Towards 2001, Western Periodicals Co., Ventura, Ca. ORTÚZAR, J. DE D. (ed.) (1992): Simplified Transport Demand Modelling. Perspectives 2, PTRC, Londres. ORTÚZAR, J. DE D. (ed.) (2000): Stated Preference Modelling Techniques. Perspectives 4, PTRC, Londres. ORTÚZAR, J. DE D., ACHONDO, F.J. Y ESPINOSA, A. (1986): On the stability of logit mode choice models. Proceedings 14th PTRC Summer Annual Meeting. University of Sussex, Julio 1986, Inglaterra. ORTÚZAR, J. DE D., ACHONDO, F.J. E IVELIC, A.M. (1987): Sequential and full information estimation of hierarchical logit models: some new evidence. Proceedings 11th Triennial Conference on Operations Research, Buenos Aires, Agosto 1987, Argentina. ORTÚZAR, J. DE D., ARMSTRONG, P.M., IVELIC, A.M. Y VALEZE, C. (1998): Tamaño muestral y estabilidad temporal en modelos de generación de viajes. Actas X Congreso Panamericano de Ingeniería de Tránsito y Transporte. Santander, Septiembre 1998, España.

MODELOS

DE

TRANSPORTE



ORTÚZAR , J. DE D., CIFUENTES, L.A. Y WILLIAMS, H.C.W.L. (2000a): Application of willingness-to-pay methods to value transport externalities in less developed countries. Environment and Planning 32A, 2007-2018. ORTÚZAR, J. DE D. Y DONOSO, P.C.F. (1983): Survey design, implementation, data coding and evaluation for the estimation of disaggregate choice models in Santiago, Chile. 2nd International Conference on New Survey Methods in Transport, Sydney, Septiembre 1983, Australia. ORTÚZAR, J. DE D., DONOSO, P.C.F. Y HUTT, G.A. (1983): The effects of measurement techniques, variable definition and model specification on demand model functions. 11th PTRC Summer Annual Meeting, University of Sussex, Julio 1983, Inglaterra. ORTÚZAR, J. DE D. Y GARRIDO, R.A. (1993): Estimation of discrete choice models with mixed SP and RP data. XIII World Conference on Operation Research (IFORS ‘93), Lisboa, Julio 1993, Portugal. ORTÚZAR, J. DE D. Y GARRIDO, R.A. (1994a): On the semantic scale problem in stated preference rating experiments. Transportation 21, 185-201. ORTÚZAR, J. DE D. Y GARRIDO, R.A. (1994b): A practical assessment of stated preference methods. Transportation 21, 289-305. ORTÚZAR, J. DE D. Y GARRIDO, R.A. (2001): Methodological developments: workshop report. En H. Mahmassani (ed.), Changes and Opportunities in Travel Behaviour: Research and Applications. Pergamon, Oxford. ORTÚZAR, J. DE D. Y HUTT, G.A. (1988): Travel diaries in Chile: the state of the art. Proceedings 16th PTRC Summer Annual Meeting, University of Bath, Septiembre 1988, Inglaterra. ORTÚZAR, J. DE D. E IVELIC, A.M. (1987): Effects of using more accurately measured level-of-service variables on the specification and stability of mode choice models. Proceedings 15th PTRC Summer Annual Meeting, University of Bath, Septiembre 1987, Inglaterra. ORTÚZAR , J. DE D. E IVELIC, A.M. (1988): Influencia del nivel de agregación de los datos en la estimación de modelos logit de elección discreta. Actas del V Congreso Panamericano de Ingeniería de Tránsito y Transporte. Universidad de Puerto Rico en Mayagüez, Julio 1988, Puerto Rico. ORTÚZAR, J. DE D., IVELIC, A.M., M ALBRÁN H. Y THOMAS, A. (1993): The 1991 Great Santiago origin-destination survey: methodological design and main results. Traffic Engineering and Control 34, 362-368. ORTÚZAR, J. DE D., MARTÍNEZ, F.J. Y VARELA, F.J. (2000b): Stated preferences in modelling accessibility. International Planning Studies 5, 65-85. ORTÚZAR, J. DE D. Y PALMA, A. (1992): Stated preference in refrigerated and frozen cargo exports. En J. de D. Ortúzar (ed.), Simplified Transport Demand Modelling. Perspectives 2, PTRC, Londres. ORTÚZAR , J. DE D., RONCAGLIOLO, D.A. Y VELARDE , U.C. (2000c.): Interactions and independence in stated preference modelling. En J. de D. Ortúzar (ed.), Stated Preference Modelling Techniques. Perspectives 4, PTRC, Londres.



Bibliografía

O RTÚZAR , J. DE D. Y RODRÍGUEZ , G. (2002): Valuing reductions in environmental pollution: stated preference in a residential location context. Transportation Research 7D, 407-427. ORTÚZAR, J. DE D. Y WILLIAMS, H.C.W.L. (1982): Una interpretación geométrica de los modelos de elección entre alternativas discretas basados en la teoría de la utilidad aleatoria. Apuntes de Ingeniería 7, 25-50. ORTÚZAR, J. DE D. Y WILLUMSEN, L.G. (1978): Learning to manage transport systems. Traffic Engineering and Control 19, 239-239. ORTÚZAR, J. DE D. Y WILLUMSEN, L.G. (1991): Flexible long range planning using low cost information. Transportation 18, 151-173. OUTRAM, V.E. Y THOMPSON, E. (1978): Driver route choice-behavioural and motivational studies. Proceedings 5th PTRC Summer Annual Meeting. University of Warwick, Julio 1977, Inglaterra. O UWERSLOOT, H. Y R IETVELD, P. (1996): Stated choice experiments with repeated observations. Journal of Transport Economics and Policy 30, 203-212. OVERGAARD, K.R. (1967): Urban transportation planning: traffic estimation. Traffic Quarterly XXI. 197-218. PAKES, A. Y POLLARD, D. (1989): Simulation and the asymptotics of optimisation estimators. Econometrica 57, 1027-1057. PAPAGEORGIOU, M. EDITOR (1991): Concise Encyclopedia of Traffic & Transportation Systems. Pergamon Press, Oxford. PAPE, U. (1974): Implementation and efficiency of Moore algorithms for the shortest route problem. Mathematical Programming 7, 212-222. PEARMAIN, D. Y SWANSON, J. (1990): The use of stated preference techniques in the quantitative analysis of travel behaviour. Proceedings of the IMA Conference on Mathematics in Transport. University of Cardiff, Septiembre 1990, Gales. PEARMAIN, D., SWANSON, J., KROES, E. Y BRADLEY, M. (1991): Stated preference techniques: a guide to practice. Steer Davies Gleave and Hague Consulting Group, Londres. POLAK, J.W. (1999): Some reflections on the application of equilibrium scheduling theory. Working Paper, Centre for Transport Studies, Imperial College of Science, Technology and Medicine, Londres. POLAK , J.W., JONES, P.M., VYTHOULKAS, P.C., M ELAND, S. Y TRETVIK , T. (1991): The Trondheim toll ring: results of a stated preference study of travellers’ responses. Report to the European Commission DRIVE Programme, Transport Studies Unit, University of Oxford. PRESS, W.H., TEUKOLSKY, S.A., VETTERLING, W.T. Y FLANNERY, B.P. (1992): Numerical Recipes in C: The Art of Scientific Computing, 2nd edn. Cambridge University Press, Cambridge. PRICE, A. (1999): A new approach to the appraisal of road projects in England. Journal of Transport Economics and Policy XXXIII, 221-226. QUANDT, R. Y BAUMOL, W. (1966): The demand for abstract transport modes: theory and measurement. Journal of Regional Science 6, 13-26.

MODELOS

DE

TRANSPORTE



QUARMBY, D.A. Y BATES, J.J. (1970): An econometric method of car ownership forecasting in discrete areas. MAU Note 219. Department of the Environment, Londres. QUINET, E. (1994): The social cost of transport: evaluation and links with internalisation policies. Chapter 2 in Internalising the Social Costs of Transport. Organisation for Economic Cooperation and Development, París. REGAN, A.C. Y GARRIDO, R.A. (2002): Modelling freight demand and shipper behaviour: state of the art and future directions. En D. Henher (ed.), Travel Behaviour Research: The Leading Edge. Pergamon, Oxford. R ICHARDSON, A.J. (1982): Search models and choice set generation. Transportation Research 16A, 403-419. R ICHARDSON A.J. A MPT, E.S. Y M EYBURG, A. (1995): Survey Methods for Transport Planning. Eucalyptus Press, Melbourne. R IZZI, L.I. Y ORTÚZAR, J. DE D. (2003): Stated preference in the valuation of interurban road safety. Accident Analysis and Prevention 34, 9-22. ROBERTS, F.S. (1975): Weighted di-graph models for the assessment of energy use and air pollution in transportation systems. Environment and Planning 7A, 703-724. ROBERTSON, D. (1969): TRANSYT: a traffic network study tool. TRRL Report LR 253. Transport and Road Research Laboratory, Crowthorne. ROBILLARD, P. (1975): Estimating the O-D matrix from observed link volumes. Transportation Research 9, 123-128. ROSE, G. Y KOPPELMAN, F.S. (1984): Transferability of disaggregate trip generation models. En J. Volmüller y R. Hamerslag (eds.), Proceedings of the Ninth International Symposium on Transportation and Traffic Theory. VNU Science Press, Utrecht. RUIJGROK, C.J. (1979): Disaggregate choice models: an evaluation. En G.R.M. Jansen, P.H.L. Bovy, J.P.J.M. van Est y F. Le Clercq (eds.), New Developments in Modelling Travel Demand and Urban Systems. Saxon House, Westmead. SAELENSMINDE, K. (1999): Valuation of Non-Market Goods for Use in Cost-Benefit Analyses: Methodological Issues. PhD Thesis, Department of Economics and Social Sciences, Agricultural University of Norway. SAFWAT, K.N.A. Y MAGNANTI, T. (1988): A combined trip generation, trip distribution, modal split and trip assignment model. Transportation Science 22, 14-30. S CHNEIDER , M. (1959): Gravity models and trip distribution theory. Papers and Proceedings of the Regional Science Association V, 51-56. SHAO, J. Y TU, D. (1995): The Jackknife and Bootstrap. Springer, Nueva York. SHEFFI, Y. (1985): Urban Transportation Networks. Prentice Hall, Englewood Cliffs, N.J. SHEFFI, Y., H ALL, R. Y DAGANZO, C.F. (1982): On the estimation of the multinomial probit model. Transportation Research 16A, 447-456. SIKDAR, P.K. Y HUTCHINSON, B.G. (1981): Empirical studies of work trip distribution models. Transportation Research 15A, 233-243. SKELTON, N. (1982): Determining appropriate sample sizes when two means are to be compared. Traffic Engineering and Control 23, 29-37.



Bibliografía

SMALL, K.A. (1982): The scheduling of consumer activities: work trips. American Economic Review 72, 467-479. SMALL, K.A. (1987): A discrete choice model for ordered alternatives. Econometrica 55, 409-424. SMALL, K.A. Y BROWNSTONE, D. (1982): Efficient estimation of nested logit models: an application to trip timing. Research Memorandum 296. Economic Research Program, Princeton University. SMEED, R.J. (1968): Traffic studies and urban congestion. Journal of Transport Economics and Policy II, 2-38. S MITH , M.E. (1979): Design of small sample home interview travel surveys. Transportation Research Record 701, 29-35. SMITH, M.J. (1979): Traffic control and route choice: a simple example. Transportation Research 13B, 289-294. SMITH, M.J. (1981): Properties of a traffic control policy which ensures the existence of a traffic equilibrium consistent with the policy. Transportation Research 15B, 453-462. SMITH, R.L. Y CLEVELAND, D.E. (1976): Time stability analysis of trip generation and predistribution modal choice models. Transportation Research Record 569, 76-86. SMIT-KROES, N. Y NIJPELS, E.H.T.M. (1988): Tweede Struktuurschema Verker en Vervoer. State Publisher, The Hague (in Dutch). SMOCK, R.J. (1962): An iterative assignment approach to capacity restraint on arterial networks. Highway Research Board Bulletin 156, 1-13. SOBEL, K.L. (1980): Travel demand forecasting by using the nested multinomial logit model. Transportation Research Record 775, 48-55. SOSSLAU, A.B., H ASSAM, A., CARTER , M. Y WICKSTROM, G. (1978): Quick response urban travel estimation techniques and transferable parameters. NCHRP Report 817. National Cooperative Highway Research Program. Transportation Research Board, Washington, DC. SPEAR , B.D. (1977): Applications of new travel demand forecasting techniques to transportation: a study of individual choice models. Final Report to the Office of Highway Planning. Federal Highway Administration, US Department of Transportation, Washington, DC. SPIELBERG, F., WEINER, E. Y ERNST, U. (1981): The shape of the 1980’s: demographic, economic and travel characteristics. Transportation Research Record 807, 27-34. SPIESS, H. (1983): On optimal route choice strategies in transit networks. Publication 286. Centre de recherche sur les Transports. Université de Montreal, Canadá. SPIESS, H. (1987): A maximum likelihood model for estimating origin-destination matrices. Transportation Research 21B, 395-412. SPIESS, H. Y FLORIAN, M. (1989): Optimal strategies: a new assignment model for transit networks. Transportation Research 23B, 82-102.

MODELOS

DE

TRANSPORTE



STEENBRINK, P.A. (1974): Optimisation of Transport Networks. John Wiley & Sons, Nueva York. STEER, J. Y WILLUMSEN, L.G. (1983): An investigation of passenger preference structures. En S. Carpenter y P.M. Jones (eds.), Recent Advances in Travel Demand Analysis. Gower, Aldershot. STONE, R. (1966): Mathematics in the Social Sciences. Chapman and Hall, Londres. STOPHER, P.R. (1975): Goodness-of-fit measures for probabilistic travel demand models. Transportation 4, 67-83. STOPHER, P.R. (1998): Household travel surveys: new perspectives and old problems. En T. Gärling, T. Laitila y K. Westin (eds.), Theoretical Foundations of Travel Choice Modelling. Pergamom, Oxford. STOPHER, P.R. Y MCDONALD, K.G. (1983): Trip generation by cross-classification: an alternative methodology. Transportation Research Record 944, 84-91. STOPHER, P.R. Y MEYBURG, A.H. (1979): Survey Sampling and Multivariate Analysis for Social Scientists and Engineers. D.C. Heath and Co., Lexington, Mass. STOUFFER, A. (1940): Intervening opportunities: a theory relating mobility and distance. American Sociological Review 5, 845-867. SUH, S., PARK, C. Y KIM, T.J. (1990): A highway capacity function in Korea: measurement and calibration. Transportation Research 24A, 177-186. SUPERNAK , J. (1971): Transferability of the person category trip generation model. Proceedings 9th PTRC Summer Annual Meeting. Universidad de Warwick, Julio 1979, Inglaterra. SUPERNAK, J. (1979): A behavioural approach to trip generation modelling. Proceedings 7th PTRC Summer Annual Meeting. University of Warwick, Julio 1979, Inglaterra. SUPERNAK, J. (1983): Transportation modelling: lessons from the past and tasks for the future Transportation 12, 79-90. SUPERNAK , J., TALVITIE, A.P. Y DE JOHN, A. (1983): Person category trip generation modelling. Transportation Research Record 944, 74-83. SWAIT, J. Y LOUVIERE, J.J. (1993): The role of the scale parameter in the estimation and comparison of multinomial logit models. Journal of Marketing Research XXX, 305-314. SWAIT, J., LOUVIERE, J.J. Y WILLIAMS, M. (1994): A sequential approach to exploiting the combined strengths of SP and RP data: application to freight shipper choice. Transportation 21, 135-152. SWANSON, J., PEARMAIN, D. Y LOUGHEAD, K. (1992): Stated preference sample sizes. Proceedings 20th PTRC Summer Annual Meeting. University of Manchester, Institute of Science and Technology, Septiembre 1992, Inglaterra. TAMIN, O.Z. Y WILLUMSEN, L.G. (1989): Transport demand model estimation from traffic counts. Transportation 16, 3-26. TAMIN, O.Z. Y WILLUMSEN, L.G. (1992): Freight demand model estimation from traffic counts. En J. de D. Ortúzar (ed.), Simplified Transport Demand Modelling. Perspectives 2, PTRC, Londres.



Bibliografía

TANNER, J.C. (1974): Forecasts of vehicles and traffic in Great Britain: 1974 revision. TRRL Report LR 650. Transport and Road Research Laboratory, Crowthorne. TANNER , J.C. (1978): Long term forecasting of vehicle ownership and road traffic. Journal of the Royal Statistical Society 141A, 14-63. TARDIFF, T.J. (1976): A note on goodness-of-fit statistics for probit and 1ogit models. Transportation 5, 377-388. TARDIFF, T.J. (1979): Specification analysis for quantal choice models. Transportation Science 13, 179-390. TAYLOR, T.L. (1971): Instructional Planning Systems: A Gaming-Simulation Approach to Urban Problems. Cambridge University Press, Nueva York. TERZA, J.V. (1985): Ordinal probit: a generalization. Communications in Statistics – Theory and Method 14, 1-11. TIMBERLAKE, R.S. (1988): Traffic modelling techniques for the developing world. 67th Annual TRB Meeting, Washington DC, Enero 1988, USA. TRAIN, K.E. (1977): Valuations of modal attributes in urban travel: questions of non-linearity, non-genericity and taste variations. Working Paper, Cambridge Systematics Inc. West, San Francisco. TRAIN, K.E. (1986): Qualitative Choice Analysis: Theory. Econometrics and an Application to Automobile Demand. MIT Press, Cambridge, Mass. TRAIN, K.E. (1998): Recreation demand models with taste differences over people. Land Economics 74, 230-239. TRAIN, K.E. (1999): Halton sequences for mixed logit. Working Paper, Department of Economics, University of California at Berkeley. TRAIN, K.E. Y MCFADDEN, D. (1978): The goods/leisure trade-off and disaggregate work trip mode choice models. Transportation Research 12, 349-353. TRAUGOTT, M.W. Y KATOSH, J.P. (1979): Response validity in surveys of voting behaviour. Public Opinion Quarterly 42, 359-377. TVERSKI, A. (1972): Elimination by aspects: a theory of choice. Psychological Review 79, 281-299. VAN ES, J.V. (1982): Freight transport, an evaluation. CEMT Round Table 58, European Conference of Ministers of Transport, París. VAN VLIET, D. (1977): D’Esopo: a forgotten tree-building algorithm. Traffic Engineering and Control 18, 372-375. VAN VLIET, D. (1978): Improved shortest path algorithms for transport networks. Transportation Research 12, 7-20. VAN VLIET, D. (1982): SATURN: a modern assignment model. Traffic Engineering and Control 23, 578-581. VAN VLIET, D. Y DOW, P. (1979): Capacity restrained road assignment. Traffic Engineering and Control 20, 296-305. VAN VLIET, D. BERGMAN, T. Y SCHELTES, W. (1987): Equilibrium assignment with multiple user classes. Proceedings 15th PTRC Summer Annual Meeting. University of Sussex, Julio 1987, Inglaterra.

MODELOS

DE

TRANSPORTE



VAN ZUYLEN, H. Y WILLUMSEN, L.G. (1980): The most likely trip matrix estimated from traffic counts. Transportation Research 14B, 281-293. VERHOEF, E. (1994): External effects and social costs of road transport. Transportation Research 28A, 273-287. VICKREY, W. (1969): Congestion theory and transport investment. American Economic Review 59, 251-261. WARDROP, J.G. (1952): Some theoretical aspects of road traffic research. Proceedings of the Institution of Civil Engineers, Part II 1, 325-362. WARDROP, J.G. (1968): Journey speed and f low in central urban areas. Traffic Engineering and Control 9, 528-532, 539. WARNER, S.L. (1962): Strategic Choice of Mode in Urban Travel: A Study of Binary Choice. Northwestern University Press, Evanston. WATERS, W.G. (1992): The value of time savings for the economic evaluation of highway investments in British Columbia. Report to the Canadian Ministry of Transportation and Highways, Victoria, BC. WATSON, S.M., TONER, J.P., FOWKES, A.S. Y WARDMAN, M. (1996): Efficiency properties of orthogonal stated preference designs. Proceedings 24th European Transport Forum, Brunel University, Septiembre 1996, Inglaterra. WEBSTER, F.V., BLY, P.H. Y PAULLEY, N.J. (eds.) (1988): Urban Land-Use and Transport Interaction: Policies and Models. Gower, Aldershot. WERMUTH, M.J. (1981): Effects of survey methods and measurement techniques on the accuracy of household travel-behaviour surveys. En P.R. Stopher, A.H. Meyburg y W. Brög (eds.), New Horizons in Travel Behaviour Research. D.C. Health and Co., Lexington, Mass. WHITELEGG, J. (1993): Transport for a Sustainable Future: The Case for Europe. Belhaven Press, Londres. WILLIAMS, H.C.W.L. (1977): On the formation of travel demand models and economic evaluation measures of user benefit. Environment and Planning 9A, 285-344. WILLIAMS, H.C.W.L. (1981): Travel demand forecasting: an overview of theoretical developments. En D.J. Banister y P.G. Hall (eds.), Transport and Public Policy Planning. Mansell, Londres. WILLIAMS, H.C.W.L. Y ORTÚZAR, J. DE D. (1982a): Behavioural theories of dispersion and the mis-specification of travel demand models. Transportation Research 16B, 167-219. WILLIAMS, H.C.W.L. Y ORTÚZAR, J. DE D. (1982b): Travel demand and response analysissome integrating themes. Transportation Research 16A, 345-362. WILLIAMS, H.C.W.L. Y SENIOR, M.L. (1977): Model based transport policy assessment: (2) Removing fundamental inconsistencies from the models. Traffic Engineering and Control 18, 464-469. WILLIAMS, I. (1976): A comparison of some calibration techniques for doubly constrained models with an exponential cost function. Transportation Research 10, 91-104.



Bibliografía

WILLIS, K.G., GARROD, G.D. Y HARVEY, D.R. (1998): A review of cost-benefit analysis as applied to the evaluation of new road proposals in the UK. Transportation Research 3D, 141-156. WILLS, M.J. (1986): A flexible gravity-opportunities model for trip distribution. Transportation Research 20B, 89-111. WILLUMSEN, L.G. (1978): Estimation of an O-D matrix from traffic counts: a review. Working Paper 99, Institute for Transport Studies, University of Leeds. WILLUMSEN, L.G. (1981): Simplified transport demand models based on traffic counts. Transportation 10, 257-278. WILLUMSEN, L.G. (1982): Estimation of trip matrices from volume counts; validation of a model under congested conditions. Proceedings 10th PTRC Summer Annual Meeting, University of Warwick, Julio 1982, Inglaterra. WILLUMSEN, L.G. (1984): Estimating time-dependent trip matrices from traffic counts. En J. Volmüller y R. Hamerslag (eds.), Proceedings of the Ninth International Symposium on Transportation and Traffic Theory. VNU Science Press, Utrecht. WILLUMSEN , L.G. (1991): Origin-destination matrix: static estimation. En M. Papageorgiou (ed.), Concise Encyclopedia of Traffic & Transportation Systems. Pergamon Press, Oxford. WILLUMSEN, L.G. (2000): Travel networks. En D. Hensher y K.J. Button (eds.), Handbook of Transport Modelling. Pergamon, Oxford. WILLUMSEN, L.G. Y HOUNSELL, N.B. (1998): Simple models of highway reliability-supply effects. En J. de D. Ortúzar, D. Hensher y S. Jara-Díaz (eds.), Travel Behaviour Research: Updating the State of Play. Pergamon, Oxford. WILLUMSEN, L.G. Y O RTÚZAR , J. DE D. (1985): Intuition and models in transport management. Transportation Research 19A, 51-58. WILLUMSEN, L.G. Y R ADOVANAC, M. (1988): Testing the practical value of the UMOT model. International Journal of Transport Economics 15, 203-223. WILLUMSEN, L., BOLLAND, J., AREZKI, Y. Y HALL, M. (1993): Multi-modal modelling in congested networks: SATURN + SATCHMO. Traffic Engineering and Control 34, 294-301. WILSON, A.G. (1970): Entropy in Urban and Regional Modelling. Pion, Londres. WILSON, A.G. (1974): Urban and Regional Models in Geography and Planning, John Wiley & Sons, Londres. WILSON, A.G. Y K IRBY, M.J. (1980): Mathematics for Geographers and Planners. Clarendon Press, Oxford. WILSON, A.G., R EES, P.H. Y LEIGH, C.M. (eds.) (1977): Models of Cities and Regions: Theoretical and Empirical Developments. John Wiley & Sons, Londres. WITTINK, D., K RISHNAMURTHI, L. Y NUTTER, J. (1982): Comparing derived importance weights accross attributes. Journal of Consumer Research 8, 471-474. WONNACOTT, T.H. Y WONNACOTT, R.J. (1977): Introductory Statistics for Business and Economics. John Wiley & Sons, Nueva York.

MODELOS

DE

TRANSPORTE



WOOTTON, H.J. Y PICK, G.W. (1967): A model for trips generated by households. Journal of Transport Economics and Policy 1, 137-153. WOOTTON, H.J., NESS, M.P. Y BURTON, R.S. (1981): Improved direction signs and the benefits for road users. Traffic Engineering and Control 22, 264-268. WOOTTON JEFFREYS Y PARTNERS (1980): JAM User Manual. Brookwood. YEN, J., M AHMASANI, H. Y HERMAN, R. (1998): A model of employee participation in telecommuting programs based on stated preference data. En J. de D. Ortúzar, D.A. Hensher y S.R. Jara-Díaz (eds.), Travel Behaviour Research: Updating the State of Play. Pergamon, Oxford. YOUNG , W. Y R ICHARDSON, A.J. (1980): Residential location preference models: compensatory and non-compensatory approaches. Proceedings 8th PTRC Summer Annual Meeting. University of Warwick, Julio 1980, Inglaterra. Z AHAVI, Y. (1979): The UMOT project. Report No. DoT-RSPA-DPB-20-79-3, US Department of Transportation, Washington DC.