The spatial scale and the empirics of regional economicsgrowth, convergence and agglomerations

  1. DIAZ DAPENA, ALBERTO
Dirigida por:
  1. Fernando Rubiera Morollón Director
  2. Esteban Fernández Vázquez Codirector

Universidad de defensa: Universidad de Oviedo

Fecha de defensa: 13 de enero de 2017

Tribunal:
  1. Jordi Suriñach Caralt Presidente/a
  2. Luis Orea Sánchez Secretario
  3. Geoffrey J.D. Hewings Vocal
Departamento:
  1. Economía Aplicada

Tipo: Tesis

Teseo: 449913 DIALNET lock_openRUO editor

Resumen

En Inglés. The choice of the spatial scale for conducting the empirical analysis should be a fundamental initial step in regional economics. Even when scholars in regional economics have paid attention for decades (Openshaw, 1984) to the role played by this scale, which must be consistent with the assumptions and the theoretical framework, the traditional lack of geographically disaggregated data has forced regional economists to use information aggregated to a large scale and use administrative large regions in their empirical analysis. Statistical and econometric techniques have experienced important improvements in the last decades for the measurement of increasingly complex socio-economic phenomena (Islam, 2003). These improvements allow us to deal with issues as spatial dependence, nonlinearities or heterogeneity and making inferences on economic relationships and impacts in a much more accurate way. The large variety on the available econometric techniques in the regional economist’s toolkit makes the choice of the specific estimation strategy a relevant decision that should be conveniently justified in every empirical research. Databases also have improved significantly in the last decades, having more precise and more spatially disaggregated information for most of the variables. However, the possibilities of considering different spatial scales for the empirical analysis that should depend on the research question or the theoretical framework are still not generalized, even when this decision can influence the results more than the selection of a specific version of an estimator. A possible reason that explains this tendency to ignore the relevance of the spatial unit of investigation and the scale of the analysis could be the influence of Neoclassical Economics. This theoretical framework basically neglected the importance of the scale in economic analysis. Their well-known models are based on decreasing returns to scale in factors (see Solow, 1956; Mankiw et al., 1992), the mobility of factors, and the spread of knowledge as explained in Barro et al. (1991), Barro and Sala-I-Martin (1992) or Sala-I-Martin (1994). These macroeconomic models are built on the aggregation of representative, independent and homogeneous agents of the economy. So, theoretical models should operate no matter the scale or the concept of region used in the analysis. Nevertheless, this conclusion is not robust when basic growth models include a process with local interactions. For example, Lucas (1988) emphasizes human capital accumulation through schooling and learning-by-doing. In addition, Lucas (2001) develops the theory that central zones accumulate human capital, generating positive externalities. It remarks the idea of a positive incentive in the urban areas towards accumulation of knowledge and spillovers. A process with these characteristics would be impossible to distinguish within an aggregated scale. Consequently, the scale does have an influence on the results and the conclusions. This type of processes in the local scale are highlighted with later models that introduce accumulative mechanics in the regions -see Romer (1990 y 1994), Myrdal (1957), Hirschman (1958), Kaldor (1957), Dixon and Thirlwall (1975). There is an important discussion about the nature of the positive externalities created within the urban areas. The most accepted theoretical literature could be the proposal of Marshal (1890) about the agglomeration economies. This phenomenon can be divided into two: the location economies and the urbanization economies. The location economies describe the externalities caused by the interaction of activities of the same sector. This interaction attracts specialized workers, suppliers and access to knowledge. The urbanization economies explain that the concentration of the activity triggers relationships between individuals –known as social capital– and infrastructures –e.g. railways, innovation centers or hospitals–. Parr (2002) summarizes this idea with a modern and clear delimitation of the concept of agglomeration economies. The literature of the agglomeration economies has evolved from the 1950’s with more contributions that explain the processes developed in the urban areas, such as Isard (1956), Ziprf (1949), Jacobs (1969) and Porter (1990). These ideas are summarized in the core-periphery model (see, Krugman, 1991; Krugman and Venables, 1995; Fujita et al., 2001). A new empirical and theoretical literature emerged from this model, known as New Economic Geography (NEG hereinafter). According to Krugman (1998), NEG explains the economy by using dynamic models with a general equilibrium. The equilibrium is obtained through a competition between forces of dispersion and concentration with scale economies. According to NEG literature: (i) there are incentives to largely concentrate the production in the central areas, and (ii); the intra-regional and inter-country processes of specialization and trade reinforce the processes of concentration and, in consequence, of divergence (see also Baldwin and Forslid, 2003; Ottaviano and Thisse, 2004 or Behrens and Thisse, 2007). To sum up, geographical scale is not relevant according to the Neoclassical Economics. The lack of interaction between the representative agents in this models generates homogeneity in all the scales. However, the NEG focuses on the centrifugal forces, which create concentration of the activities and heterogeneity. From this point of view, the concept of region and the aggregation are not neutral. Different classifications of the territory could lead to the elimination of valuable information on the relationship between central and peripheral locations. The assumption of homogeneous data for wide areas can be extremely arbitrary depending on the aggregation criteria. Databases from governments have been traditionally limited to aggregated administrative units due to the lack of detailed information. However, these regions have been usually designed by not economic but historical or political reasons. So the aggregated data that base on this type of classification is mix different economic units. Depending on the research question, it can undermine the economic analysis. This absence of disaggregated data in a local scale implies that the regional analysis had no option but to use this information, despite the problems of aggregation. However, NEG analysis requires an especial attention to the dynamics of the local level rather than national areas. The analysis of these dynamics using aggregated information that do not distinguish between urban and rural areas may lack of robustness. Nevertheless, the availability of data has grown in the last years. There is an increasingly amount of databases with disaggregated information –or even individual data–. Nowadays, it is possible to adapt the data to the level of aggregation or to the concept of economic region more appropriate to our research analysis. The choice of a suitable scale in the economic analysis and its consequences in the results could become as important as the choice of the correct estimator. The central aim of this thesis is to explore the role played by the spatial scale in the empirics of regional economics. It studies how a geographical scale not consistent with the assumptions could affect the final conclusions and lead to obtain meaningless results –or, at least, not as clear as they could be when the scale is properly chosen-. Although this idea could be applied to all spatial analysis is in the field of economic growth and territorial economic differences where most relevant underestimations of the relevance of the scale could be happening. So, this thesis particularly pays attention to the relevance of the election of the spatial scale in growth and convergence studies as well as in productivity analysis. The thesis starts focusing on the phenomenon of inequalities between territories using the well-known β-convergence analysis. β-convergence analysis is particularly interesting for the aim of the thesis, since it is a field of the literature directly connected with both the Neoclassical framework and the NEG. NEG suggests that regional inequalities in GDPpc emerges due to the differences between rural and urban areas in terms of human capital and externalities of the activity, while neoclassical theories predict homogeneity of the levels of GDPpc across regions. This first part of this thesis studies the problem of spatial aggregation of data when estimating β-convergence equations. It bases on previous studies that have already called the attention to the effect of the aggregation, like in the work by Theil (1954) for the general case on linear regression models or, more recently, by Arbia and Petrarca (2011) for the case of spatially dependent data. Additionally, it explicitly introduces in the analysis the hierarchical nature of economic data when referring to spatial units and analyzes the importance of each level in the process by using econometric approach of multilevel analysis. The second part of this dissertation studies urban agglomerations and how the dynamics between rural and urban territories can affect the results and then it continues with the analysis of the productivity and its relationship with population density. It follows the recent literature, which has paid attention to quantify the impact of agglomeration economies on productivity –see, for example, Rosenthal and Strange (2001), for an extensive review or Ciccone and Hall (1996); Combes (2000), Combes et al. (2008), or Artis et al. (2012)–. More recently, Combes and Gobillon (2015) have reviewed the most relevant contributions to the empirics of agglomeration economies, which covers both the attempts to estimate them basing on aggregated regional data to the more recent strategies that use individual data. While this last option is arguably preferable when data are available, sometimes lack of observable information at individual level makes necessary the estimation basing on some average at a given spatial scale. If this is the case, using data that average highly disaggregated geographical units allows for considering an appropriate spatial scale to measure agglomeration economies, since spatially aggregated data imply assuming a high level of intra-regional homogeneity. En castellano: La elección de la escala espacial para llevar a cabo análisis empíricos debería ser un paso fundamental en la economía regional. Aunque los investigadores en economía regional han prestado atención durante décadas (Openshaw, 1984) al papel que juega la escala, que debe ser consistente con los supuestos y el marco teórico, la tradicional falta de información desagregada geográficamente ha obligado a los economistas regionales a usar datos agregados en grandes regiones administrativas para sus análisis empíricos. Las técnicas estadísticas y econométricas han experimentado mejoras importantes en la última década permitiendo la medición de fenómenos socioeconómicos cada vez más complejos (Islam, 2003). Esas mejoras nos permiten tratar temas como la dependencia espacial, las relaciones no lineales o la heterogeneidad, y hacer inferencias en relaciones económicas e impactos de una manera mucho más precisa. La gran variedad de técnicas econométricas disponibles hace que la elección de una estrategia de estimación específica sea una decisión relevante que debe ser adecuadamente justificada en toda investigación empírica. Las bases de datos también han mejorado significativamente en los últimos años, pasando a tener información más precisa y con mayor desagregación espacial para la mayoría de las variables. Sin embargo, no se presta tanta atención a que la escala espacial en el análisis empírico debe depender de la cuestión que se quiera investigar y del marco teórico. Esta decisión puede afectar a los resultados incluso más que la elección de una versión concreta de un estimador. Un motivo que explique esta tendencia de ignorar la importancia de la unidad espacial de la investigación y la escala de los análisis podría ser la influencia de la Economía Neoclásica. Este marco teórico básicamente ignora la importancia de la escala en el análisis económico. Sus modelos más conocidos se basan en rendimientos decrecientes en los factores (véase Solow, 1956; Mankiw et al., 1992), la movilidad de factores y la difusión del conocimiento como se explica en Barro et al. (1991), Barro and Sala-I-Martin (1992) o Sala-I-Martin (1994). Dichos modelos macroeconómicos están construidos sobre la agregación de agentes de la economía representativos, independientes y homogéneos. Por lo tanto, los modelos teóricos operan sin importar la escala o el concepto de región usado en el análisis. Pero esta conclusión no es robusta cuando los modelos básicos de crecimiento incluyen un proceso con interacciones locales. Por ejemplo, Lucas (1988) enfatiza la acumulación de capital humano a través de la educación y del “aprender haciendo”. Además, Lucas (2001) desarrolla la teoría de que las zonas centrales acumulan capital humano, generando externalidades positivas, lo que refuerza la idea de un incentivo en las áreas urbanas hacia la acumulación del conocimiento y los efectos spillover. Un proceso con estas características sería imposible de distinguir en una escala agregada. En consecuencia, la escala sí afecta a los resultados y las conclusiones. Este tipo de procesos en la escala local son resaltados con modelos posteriores que introducen mecánicas acumulativas en las regiones -véase Romer (1990 y 1994), Myrdal (1957), Hirschman (1958), Kaldor (1957), Dixon y Thirlwall (1975)-. Hay un debate importante sobre la naturaleza de las externalidades positivas creadas en las áreas urbanas. La literatura teórica más aceptada podría ser la propuesta por Marshal (1890) sobre las economías de aglomeración. Este fenómeno puede dividirse en dos: las economías de localización y las economías de urbanización. Las economías de localización describen las externalidades causadas por la interacción entre actividades del mismo sector, que atrae trabajadores especializados, proveedores y acceso al conocimiento. Las economías de urbanización explican que la concentración de actividades desencadena las relaciones entre individuos -conocidas como capital social- e infraestructuras -por ejemplo, ferrocarriles, centros de innovación y hospitales-. Parr (2002) resume esta idea con una delimitación moderna y clara del concepto de economías de aglomeración. La literatura sobre economías de aglomeración ha evolucionado desde la década de 1950 con contribuciones que explican los procesos desarrollados en las áreas urbanas, como por ejemplo Isard (1956), Ziprf (1949), Jacobs (1969) y Porter (1990). Estas ideas se resumen en el modelo centro-periferia (véase Krugman, 1991; Krugman y Venables, 1995; Fujita et al., 2001). Una nueva literatura empírica y teórica ha surgido de ese modelo, conocida como Nueva Geografía Económica (NGE, en adelante). Según Krugman (1998), la NGE explica la economía usando modelos dinámicos con un equilibrio general, que se obtiene a través de la competencia entre las fuerzas de dispersión y de concentración con economías de escala. De acuerdo con la literatura de la NGE: (i) hay incentivos a concentrar fuertemente la producción en áreas centrales, y (ii) los procesos de especialización y comercio intra-regionales y entre países refuerzan los procesos de concentración y, en consecuencia, de divergencia (véase también Baldwin y Forslid, 2003; Ottaviano y Thisse, 2004 o Behrens y Thisse, 2007). En resumen, la escala geográfica no es relevante según la Economía Neoclásica. La falta de interacción entre los agentes representativos en este modelo genera homogeneidad en todas las escalas. Sin embargo, la NGE se centra en las fuerzas centrífugas, que crean concentración de las actividades y heterogeneidad. Desde este punto de vista, el concepto de región y la agregación no son neutrales. Diferentes clasificaciones del territorio pueden llevar a la eliminación de información relevante en las relaciones entre las zonas centrales y periféricas. El supuesto de información homogénea en grandes áreas puede ser extremadamente arbitrario según el criterio de agregación. Las bases de datos gubernamentales han estado tradicionalmente limitadas por unidades administrativas agregadas debido a la falta de información detallada. Sin embargo, estas regiones han sido frecuentemente diseñadas por razones no económicas sino históricas o políticas. Así que los datos agregados que basan este tipo de clasificación es una combinación de diferentes unidades económicas. Esta ausencia de información desagregada a nivel local implica que los análisis regionales no tenían más opción que usar estos datos, a pesar de los problemas de agregación. Pero los análisis de la NGE requieren una especial atención a las dinámicas del nivel local más que de las áreas nacionales. El análisis de dichas dinámicas utilizando información agregada que no distingue entre áreas urbanas y rurales puede carecer de robustez. Aun así, la disponibilidad de datos ha aumentado en los últimos años, existiendo un número creciente de bases de datos con información desagregada -o incluso con datos individuales-. Hoy en día es posible adaptar los datos al nivel de agregación o al concepto de región económica más apropiado a nuestra investigación. La elección de una escala adecuada en el análisis económico y sus consecuencias en los resultados podría volverse tan importante como la de un estimador correcto. El objetivo principal de esta tesis es explorar el papel jugado por la escala espacial en los análisis empíricos de la economía regional. Estudia cómo un nivel geográfico no consistente con los supuestos puede afectar a las conclusiones finales y llevar a unos resultados sin sentido -o, al menos, no tan claros como deberían ser cuando la escala es elegida correctamente-. Aunque esta idea puede ser aplicada a todos los análisis espaciales, es en el campo del crecimiento económico y las diferencias económicas entre territorios donde puede darse una mayor infraestimación de la importancia de la escala. Por lo tanto, esta tesis presta especial atención a la importancia de la elección del nivel espacial en los estudios de crecimiento y convergencia, así como en análisis de productividad. La tesis empieza poniendo el foco en el fenómeno de desigualdad entre territorios usando el conocido análisis de β-convergencia. El análisis de β-convergencia es particularmente interesante para el objeto de esta tesis, pues es un campo de la literatura está directamente conectado tanto con el marco Neoclásico como con la NGE. La NGE sugiere que las desigualdades regionales en PIB per cápita surgen debido a las diferencias entre las áreas rurales y urbanas en términos de capital humano y externalidades de la actividad, mientras que las teorías neoclásicas predicen homogeneidad en los niveles de PIB per cápita entre regiones. Esta primera parte de la tesis estudia el problema de agregación espacial de los datos en la estimación de ecuaciones de β-convergencia. Se basa en estudios previos que ya han prestado atención al efecto de la agregación, como en el trabajo de Theil (1954) para el caso general con modelos de regresión lineal o, más recientemente, de Arbia y Petrarca (2011) para el caso de datos dependientes espacialmente. Además, se introduce explícitamente en el análisis la naturaleza jerárquica de los datos económicos en lo que respecta a unidades espaciales y analiza la importancia de cada nivel en el proceso mediante un enfoque econométrico de análisis multinivel. La segunda parte de esta tesis estudia las aglomeraciones urbanas y cómo las dinámicas entre los territorios rurales y urbanos pueden afectar al resultado, y después continua con el análisis de la productividad y sus relaciones con la densidad de población. Sigue la literatura reciente, que ha prestado atención a cuantificar el impacto de las economías de aglomeración sobre la productividad -véase, por ejemplo, Rosenthal y Strange (2001), para un análisis más extenso o Ciccone y Hall (1996); Combes (2000), Combes et al. (2008), o Artis et al. (2012)-. Más recientemente, Combes y Gobillon (2015) han revisado las contribuciones más relevantes de las economías de aglomeración, que cubren tanto los intentos de estimarlos en base a datos regionales agregados como las estrategias más recientes que utilizan datos individuales. Mientras que esta última opción puede considerarse preferible cuando hay datos disponibles, en ocasiones la falta de información observable a nivel individual hace necesaria la estimación utilizando alguna media a la escala espacial dada. Si ese es el caso, utilizar datos que promedian unidades geográficas altamente desagregadas permite considerar la escala espacial adecuada para medir las economías de aglomeración, en tanto que los datos agregados espacialmente implican asumir un alto nivel de homogeneidad intra-regional.