ecnicas Actuales de Estad´ıstica Aplicada
Universidad Nacional de Educaci´on a Distancia
Copyright c 2011 Alfonso Garc´ıa P´erez
Fotograf´ıa de la Portada: El Hemisf`eric. Ciudad de las Artes y Las Ciencias. Valencia.
“No est´a permitida la reproducci´on total o parcial de estelibro, ni su tratamiento inform´atico, ni la transmisi´on deninguna forma o por cualquier medio, ya sea electr´onico,mec´anico, por fotocopia, por registro u otros medios, sin elpermiso previo y por escrito de los titulares del Copyright. El contenido de este libro est´a registrado por el autor en elRegistro de la Propiedad Intelectual con el n´
y protegido por la Ley, que establece penas de prisi´on adem´asde las correspondientes indemnizaciones para quien lo plagiara”
Edita: Universidad Nacional de Educaci´on a Distancia
La presente Gu´ıa Did´actica es un documento que sirve de apoyo y refe-
rencia al curso. En ella se incluye el Temario del curso, las horas y formas detutor´ıas, orientaciones y sugerencias de c´omo organizar el estudio de los temas(Cronograma) y un Anexo con diez problemas que servir´an para evaluar alalumno.
1. Paquetes Estad´ısticos SAS, SPSS y R
-Introducci´on. -El Paquete Estad´ıstico SAS. -El Paquete Estad´ıstico SPSS. -El Paquete Estad´ıstico R.
-Introducci´on. -Tests de Hip´otesis para una muestra. -Tests de Hip´otesis para dos muestras. -Modelos Lineales.
-An´alisis de la Varianza. -Regresi´on Lineal.
-An´alisis de Componentes Principales. -An´alisis de Correspondencias.
-An´alisis Discriminante. -An´alisis Cluster.
-Introducci´on. -Tests de Hip´otesis robustos para una muestra. -Tests de Hip´otesis robustos para dos muestras. -Modelos Lineales Robustos.
-An´alisis de la Varianza robusto. -Regresi´on Lineal robusta. -T´ecnicas Multivariantes robustas.
-Introducci´on. -El Jackknife. -El Bootstrap.
-Estimadores bootstrap del error de muestreo. -Estimadores bootstrap del sesgo. -Intervalos de confianza bootstrap. -Varianza de los estimadores bootstrap.
5. T´ecnicas Actuales en Regresi´on Lineal
-Introducci´on. -El Modelo de Regresi´on Lineal. -Diagn´ostico de la Regresi´on Lineal. -Puntos Influyentes. -Regresi´on Robusta.
-S-estimadores. -MM-estimadores.
-Introducci´on. -Definici´on de Modelo Lineal Generalizado. -Estimaci´on y contrastes basados en la verosimilitud, cuasi-verosimilitud,
-Regresi´on Log´ıstica cl´asica y robusta. -Regresi´on Poisson cl´asica y robusta.
7. T´ecnicas Actuales en el An´alisis de Series Temporales
-Introducci´on. -Filtrado Lineal.
-Identificaci´on del modelo ARIMA. -Estimaci´on de los par´ametros. -Diagnosis. -Predicci´on. -Test de serie estacionaria.
-Cointegraci´on. -Modelos ARCH y GARCH. -Series Climatol´ogicas.
8. Inferencias con Mixturas de Distribuciones
-Introducci´on. -Estimaci´on de par´ametros.
-M´etodos Cl´asicos. -Intervalos Bootstrap. -M´etodos Robustos.
-Comparaci´on del An´alisis Discriminante, An´alisis de Mixturas, An´alisis
Cluster y An´alisis de Componentes Principales.
9. T´ecnicas Estad´ısticas para Datos Espaciales
-Introducci´on. -Datos Espaciales y su representaci´on. -Procesos Puntuales Espaciales.
-An´alisis de la distribuci´on espacial.
-Aleatoriedad Espacial Completa (CSR). -Ajuste de Modelos Espaciales Puntuales.
-An´alisis de la densidad espacial.
10. T´ecnicas Estad´ısticas Actuales en Ciencias de la Salud
-Introducci´on. -Fundamentos Estad´ısticos de los Ensayos Cl´ınicos.
-Introducci´on. -Poblaci´on y Muestra. -Formalizaci´on del problema. -Tama˜
-Poblaciones normales. -Poblaciones binomiales.
-Grupos de tratamientos permutados aleatoriamente.
-An´alisis de los resultados. -Enfoques alternativos.
-Ensayos cruzados (Crossover trials).
-Introducci´on. -Tipos de censura. -Distribuciones de tiempo de fallo.
-Algunas distribuciones de tiempo de fallo.
-Modelos de regresi´on Exponencial y Weibull. -Modelo de Azar Proporcional. -Modelo de Tiempo de Fallo Acelerado.
-Estimaci´on de la Funci´on de Supervivencia.
-Estimador de Kaplan-Meier (M´etodo del L´ımite-producto). -M´etodo de la tabla de supervivencia.
-Comparaci´on de curvas de supervivencia.
-Test de Savage de rangos logar´ıtmicos.
-Estimaci´on de Haplotipos y de su riesgo.
-Conceptos de Gen´etica. -Genotipos y Haplotipos. -Asignaci´on de haplotipos a individuos con genotipo AaBb.
-Comparaci´on de poblaciones: Regresi´on Log´ıstica.
-Bioinform´atica: T´ecnicas Machine Learning.
Arboles de Clasificaci´on y Regresi´on (Classification and Regression
-Bosques Aleatorios (Random Forests, RFs). - ´
-Regresi´on a Trazos Adaptativa Multivariante (Multivariate Adaptive
-Problemas B´asicos Resueltos. -Problemas Avanzados Resueltos.
11. T´ecnicas Estad´ısticas Actuales en Arqueolog´ıa y Paleontolog´ıa
-Introducci´on. -Diagrama Ternario.
-Regresi´on de Eje Mayor Reducido. -Morfometr´ıa.
-Introducci´on a la Morfometr´ıa.
-Series Temporales en Paleontolog´ıa.
-Introducci´on. -An´alisis Espectral. -Autocorrelaci´on en Paleontolog´ıa. -Correlaci´on Cruzada (Cross-correlation). - An´alisis de .Olas peque˜
-Problemas B´asicos Resueltos. -Problemas Avanzados Resueltos.
12. T´ecnicas Estad´ısticas Actuales en Ciencias Ambientales
Arboles de Clasificaci´on y Regresi´on en Ciencias Ambientales.
-Modelos Aditivos Generalizados GAM en Ciencias Ambientales. -Problemas B´asicos Resueltos. -Problemas Avanzados Resueltos.
El alumno dispone, adem´as de esta Gu´ıa Did´actica, de los siguientes textos
gratuitos para los alumnos del curso enviados por el Equipo Docente,
Estad´ıstica Aplicada con R. (Texto impreso) + Suplemento R (Textoen pdf).
Estad´ıstica Aplicada con SAS. (Texto en pdf).
Estad´ıstica Aplicada con SPSS. (Texto en pdf).
etodos Avanzados de Estad´ıstica Aplicada. T´
etodos Avanzados de Estad´ıstica Aplicada. M´
tos y de Remuestreo. (MR). (Texto impreso).
ecnicas Actuales de Estad´ıstica Aplicada. (TAEA). (Texto en
Cuadernos de Estad´ıstica Aplicada: Arqueolog´ıa y Paleonto-log´ıa. (Texto en pdf).
Cuadernos de Estad´ıstica Aplicada: Biolog´ıa y Ciencias Am-bientales. (Texto en pdf).
De los textos impresos s´olo necesitar´a estudiar los cap´ıtulos que correspon-
un se menciona en el apartado siguiente.
Los textos en pdf los puede imprimir si lo desea aunque en pdf tiene la
posibilidad de aumentar el zoom si no lo ve bien.
En todos estos textos se mencionan unos ficheros de datos que son utilizados
en los ejemplos. Los ficheros de datos est´an en el Curso Virtual.
Recomendaciones sobre el estudio del curso
Aunque seguramente el alumno tendr´a suficiente experiencia como para
organizarse ´el mismo el estudio del Material Did´actico, damos a continuaci´onuna serie de recomendaciones que pueden serle de utilidad.
Tambi´en, dependiendo del nivel de conocimientos y del inter´es que tenga
sobre cada uno de los temas en estudio, es posible que modifique las siguientessugerencias de estudio:
na al alumno a utilizar tres Paquetes Estad´ısticos
de los m´as habituales. Seguramente se inclinar´a por uno de ellos y omitir´a (almenos en una primera lectura) el Material Did´actico de los otros dos Paquetes. Nosotros nos inclinamos, sin lugar a dudas, por el Paquete Estad´ıstico gratuitoR. De hecho, los temas m´as avanzados son ilustrados con ejemplos resueltoscon R.
Tambi´en es cierto que lo m´as importante, en el estudio de las T´ecnicas
Estad´ısticas, es saber cu´ando y c´omo utilizarlas as´ı como saber interpretar losresultados obtenidos con ellas, siendo el paquete estad´ıstico tan s´olo una he-rramienta en dicho proceso aunque, eso s´ı, muy potente. Por esta raz´on, si elalumno dispone de otro Paquete distinto de los tres aqu´ı utilizados, podr´a se-guir el curso sin ning´
Se recomienda simultanear el estudio del Tema 1 con la primera parte del
Tema 2 sobre Temas Cl´asicos univariantes puesto que el texto en el que seestudian ´estos, CB, est´a pensado para estudiar en conjunto con el Material delos diferentes Paquetes Estad´ısticos. En concreto, puede leer los seis primeroscap´ıtulos de CB para repasar algunos conceptos elementales y estudiar dete-nidamente el Cap´ıtulo 7 de CB sobre contrastes para una muestra y para dosmuestras. El An´alisis de la Varianza y la Regresi´on Lineal los puede estudiarpor los cap´ıtulos 8, 9 y 10 de CB. Ser´ıa interesante que analizara con detallelos Problemas B´asicos Resueltos de los textos correspondientes a los Temas10, 11 y 12.
Las T´ecnicas Multivariantes Cl´asicas las puede estudiar por los cap´ıtulos
Los M´etodos Estad´ısticos Robustos del Tema 3 los puede seguir por los
cap´ıtulos 3 y 4 del texto MR, habiendo le´ıdo previamente los dos primeroscap´ıtulos de este texto. Los Modelos Lineales Robustos los puede estudiar porlos cap´ıtulos 5, 6 y 7 de este libro MR.
Los M´etodos de Remuestreo Bootstrap del Tema 4 se siguen bien por los
Los Temas 5, 6, 7, 8 y 9 se deben estudiar por los 5 cap´ıtulos del texto
El Tema 10 se corresponde con el texto Cuadernos de Estad´ıstica Aplicada:
De la misma manera, el Tema 11 se corresponde con el texto Cuadernosde Estad´ıstica Aplicada: Arqueolog´ıa y Paleontolog´ıa y el Tema 12 con el textoCuadernos de Estad´ıstica Aplicada: Biolog´ıa y Ciencias Ambientales.
Durante la duraci´on del curso, el alumno deber´a ir estudiando el Material
Did´actico anterior y podr´a realizar consultas sobre ´el.
Se ofrecer´an unas sesiones presenciales voluntarias, al menos en Madrid,
nar´a a manejar los paquetes estad´ısticos antes mencionados.
Aunque lo ofreceremos m´as adelante, si algunos alumnos quieren que vayamosa su centro de trabajo a realizar estas pr´acticas, puede solicitarlo al EquipoDocente y, si el n´
umero de alumnos de esa zona es suficientemente grande,
As´ı mismo, se impartir´an conferencias invitadas sobre temas de actualidad
Si quiere seguir un Cronograma m´as preciso puede enviar los 10 Problemas
del Anexo uno cada mes (de Diciembre a Septiembre) pues ´estos correspondencon temas distintos.
En el Curso Virtual hay un fichero ejecutable que permite la instalaci´on de
una versi´on modificada de R, versi´on que denominamos Rmo. En esta versi´onse han indo incorporando programas propios y es con ella con la que se hanresuelto los ejemplos de los textos TA y MR.
Como en ella se han incorporado, entre otros, los programas de Robustez
y Remuestreo, si el alumno baja de la red la versi´on completa de R, no lefuncionar´an algunos de los programas de robustez y remuestreo as´ı como lasinnovaciones de los M´etodos Cl´asicos incorporadas. Por tanto, si se baja elpaquete R, lo razonable es que utilice dos subdirectorios, uno para el softwaredel curso y otro para la versi´on completa de R.
Aunque existen varias formas de instalar este software, la idea b´asica con-
siste en, primero descomprimirlo y, luego, volcar (copiar y pegar) el contenido
de la carpeta denominada r en el disco duro del ordenador.
Para ejecutar este software es necesario que primero lo copie en el disco
El fichero que ejecuta este Paquete estad´ıstico es
aunque, una vez instalado el software del curso en el disco duro del ordenador,lo m´as interesante es crearse un Acceso directo a dicho software. Para ello, conel Explorador de Windows vaya a
y, posicion´andose sobre el archivo Rgui, presione el bot´on derecho del rat´on ycree un Acceso Directo. Una vez creado dicho acceso directo (y con el Explo-rador no maximizado), arr´astrelo hasta el Escritorio.
En algunas ocasiones (especialmente en relaci´on con la Regresi´on, aparece el
n, el cual se corresponde con el s´ımbolo Ascii
umero 126 y se obtiene, manteniendo presionada la tecla Alt, tecleando en el
umero 126 para soltar despu´es la mencionada
tecla Alt, con lo que aparecer el s´ımbolo
un momento, utilice los cauces de las tutor´ıas que aparecen
en el punto 7 de m´as abajo, para que contestemos a sus preguntas. • Dr. D. Alfonso Garc´ıa P´erez
• Dr. D. Carlos Moreno Gonz´alez• Da. Yolanda Cabrero Ortega• Dr. Javier Navarro Fern´andez• Da. Emilia Carmena Y´a˜
Alfonso Garc´ıa P´erezDepartamento de Estad´ıstica e I.O. (despacho 104)Facultad de Ciencias. UNED. Paseo Senda del Rey, no¯ 9
tel´efono: 91 398 72 51fax: 91 398 66 97e-mail: agar-per@ccia.uned.es
bien por tel´efono, fax, e-mail, correo ordinario o de forma presencial (para esta
ultima modalidad, es imprescindible solicitarlo previamente).
Si quiere una contestaci´on on-line, debe realizar sus consultas de lunes a
mi´ercoles de 10’30 a 1, o los jueves (de 10’30 a 1 y de 4 a 8).
No obstante, lo m´as recomendable es hacerlo a trav´es del Curso Virtual.
Para obtener una calificaci´on positiva del curso, el alumno deber´a enviar
resueltos los 10 ejercicios del Anexo de la Gu´ıa Did´actica a
Alfonso Garc´ıa P´erezDepartamento de Estad´ıstica,Facultad de Ciencias, UNEDPaseo Senda del Rey, 9. 28040-Madrid (Espa˜
antes del d´ıa 15 de septiembre pr´oximo.
Los puede enviar todos juntos, uno a uno, o por grupos de ejercicios. Tam-
poco hace falta que siga el orden de los enunciados puesto que cada problemase refiere a Temas distintos.
un su Actividad Econ´omica y el Nivel deDenuncias presentadas en las Oficinas de los Consumidores, obteni´endose lasiguiente tabla:
Contrastar primero mediante un test χ2 de independencia, si pueden o no
considerarse independientes ambas variables. Realizar despu´es un An´alisis deCorrespondencias entre ellas.
El Mnemiopsis leidyi es una especie invasora introducida accidentalmente
vez en el norte del Mar Egeo a comienzo de los a˜
Con objeto de estudiarla con m´as detalle, en d´ıas elegidos al azar se anot´o la
profundidad en metros a la que fueron vistos en el norte del Mar Egeo los a˜
2007, 2008, 2009 y 2010 obteni´endose los siguientes datos,
a) Analizar, mediante un An´alisis de la Varianza Cl´asico, si existen diferen-cias significativas entre los cuatro a˜
avistamiento. Si fuera as´ı, agrupar los a˜
b) Analizar las suposiciones de normalidad y homocedasticidad requeridas paraque este ANOVA cl´asico sea v´alido.
Considerando de nuevo los datos del Problema 2 anterior y recortando 0 1,
¿puede inferirse que existen diferencias significativas entre los cuatro a˜
a) Utilizando la generalizaci´on robusta del test de Welch. b) Utilizando la generalizaci´on robusta del test de Box. c) Hacer en todo caso, las comparaciones m´
Considerando de nuevo los datos del Problema 2 anterior realizar el ANOVA
ultiples mediante t´ecnicas bootstrap y utilizando la
mediana como estimador de localizaci´on.
En 10 beb´es reci´en nacidos con SIDA se midi´o la diferencia X entre el
umero de c´elulas CD45RA al nacer y al cabo de 24 horas de aplicaci´on de un
medicamento denominado Ritonavir, as´ı como la diferencia Y entre el n´
ro de c´elulas CD45RO al nacer y al cabo de 24 horas de aplicaci´on de estemedicamento. Los resultados obtenidos fueron los siguientes:
Se cree que existe una relaci´on lineal significativa de Y sobre X. Se pide,analizando si son o no significativas,a) La recta de regresi´on m´ınimos cuadrados. b) La recta de regresi´on de Huber. c) La recta de regresi´on de M´ınimos Cuadrados Recortados, LTS. d) La recta de regresi´on MM. ¿Con cu´al de las cuatro rectas se quedar´ıa?
Durante los meses de polinizaci´on se piensa que los Recuentos de Polen deGram´ıneas (en granos por m3) pueden depender de tres covariables: Cantidadde lluvia (en litros por metro cuadrado), Velocidad del Viento (en Km. por
hora) y Temperatura (en grados cent´ıgrados). Los datos recogidos en 15 d´ıaselegidos al azar fueron:
a) Considerar un Modelo de Regresi´on de Poisson cl´asico y analizar cu´ales delas tres covariables son significativas. b) Estimar los coeficientes del modelo de las covariables significativas. c) Estimar los coeficientes del Modelo de Regresi´on de Poisson robusto endonde se consideren las mismas covariables que resultaron significativas en elmodelo cl´asico.
Los siguientes datos son datos de consumo de bienes no duraderos por
nos, desde el primer cuatrimestre de 1969 hasta el cuarto
cuatrimestre de 1988 en el Reino Unido. (¡Puede copiar los datos sin Qtr conCopiar− >Pegar!)
33742 35401 36147 3806734149 36176 37485 3904734783 37042 38008 4013236466 38680 39976 4227339131 40780 41852 4368438729 40427 41576 4388639131 40394 40956 4295938714 40062 41152 4346038695 39780 40923 4409340777 41778 43160 4589741947 44061 44378 4723743315 43396 44843 4683542833 43548 44637 4710742552 43526 45039 4794043740 45007 46667 4932544878 46234 47055 5031846354 47260 48883 5260548527 50237 51592 5515250451 52294 54633 5880253990 55477 57850 61978
Ajustar un modelo SARIMA a estos datos.
Se quieren clasificar los restos arqueol´ogicos de un determinado animal
prehist´orico en dos grupos: Machos y Hembras utilizando como modelo unaMixtura de dos Normales. Para ello se midieron las longitudes de cuatro huesosde los 10 restos encontrados obteni´endose los siguientes datos:
44 1 43 6 42 6 43 5 42 3 38 9 36 5 39 4 37 2 38 9
umero 35 3 35 4 34 9 34 5 33 4 32 5 32 2 33 1 33 5 32 6
30 1 31 2 32 3 30 4 29 9 25 9 25 3 24 9 25 1 24 8
a) Estimar los par´ametros del modelo Mixtura de dos Normales multivariantes. b) Determinar los dos grupos de individuos.
Los siguientes datos corresponden a las coordenadas de (Latitud,Longitud)
de avistamientos de un animal en peligro de extinci´on (¡las puede Copiar− >Pegar!)
Latitud<-c(21,22,21.2,22.4,22.8,21.7,22.3,21.5,22.4,21.9,21.2,22.2,21.4,22.6,23.0,21.9,22.5,21.7,22.6,22.1,21.5,22.5,21.7,22.9,23.3,22.2,22.8,22.0,22.9,22.4,22.8,22.0,22.8,22.1,21.8,20.9,23.1,22.6,22.5,21.4)
Longitud<-c(34.1,35.7,34.0,34.9,34.8,34.2,35.3,34.5,35.4,34.2,34.2,35.2,34.4,34.6,36.0,34.9,35.5,34.7,35.6,35.1,34.5,34.5,34.1,35.9,36.3,34.2,35.8,35.2,34.3,35.5,35.8,35.0,35.8,35.1,34.8,33.9,36.3,35.6,35.5,34.4)
a) Analizar si se cumple o no la hip´otesis CSR. b) Si no se puede admitir esta hip´otesis, obtener un gr´afico de la estimaci´onde la intensidad del Proceso de Poisson no homog´eneo mediante un EstimadorN´
Se est´a estudiando la contaminaci´on ambiental en un r´ıo espa˜
como variable dependiente de respuesta Y los niveles de concentraci´on de undeterminado pesticida.
Se cree que las covariables X1, ., X5 pueden ser explicativas de estos niveles
de pesticida, obteni´endose los siguientes 40 datos: (¡los puede Copiar− >Pegar!)
Y<-c(3.65,3.85,3.69,3.93,4.01,3.79,3.91,3.75,3.93, 3.83, 3.69, 3.89, 3.73, 3.97, 4.05,3.83, 3.95 ,3.79, 3.97, 3.87, 3.75, 3.95, 3.79, 4.03, 4.11, 3.89, 4.01, 3.85, 4.03, 3.93,4.01, 3.85, 4.01, 3.87, 3.81, 3.63, 4.07, 3.97, 3.95, 3.73)
X1<-c(5.9640,6.2360,5.0184,5.3448,5.4536,5.1544,5.3176,5.1000,5.3448,5.2088,5.0184,5.2904,5.0728,5.3992,5.5080,4.2088,5.3720,5.1544,5.3992,5.2632,5.1000,5.3720,5.1544,5.4808,5.5896,5.2904,5.4536,5.2360,5.4808,5.3448,5.4536,5.2360,5.4536,5.2632,5.1816,4.9368,5.5352,5.3992,5.3720,5.0728)
X2<-c(1.333,3.253,1.765,1.183,1.477,3.119,0.996,0.324,2.815,1.353,3.622,1.096,2.576,2.014,2.165,1.639,1.559,1.378,3.930,2.906,1.449,2.254,3.083,2.258,2.766,3.196,-0.020,0.238,1.314,1.668,4.163,1.507,2.816,2.578,2.725,2.051,1.764,0.312,1.539,3.760)
X3<-c(0.5745,0.2405,0.5077,0.1069,-0.0267,0.3407,0.1403,0.4075,0.1069,0.2739,0.5077,0.1737,0.4409,0.0401,-0.0935,0.2739,0.0735,0.3407,0.0401,0.2071,0.4075,0.0735,0.3407,-0.0601,-0.1937,0.1737,-0.0267,0.2405,-0.0601,0.1069,-0.0267,0.2405,-0.0267,0.2071,0.3073,0.6079,-0.1269,0.0401,0.0735,0.4409)
X4<-c(12.84,13.24,12.92,13.40,13.56,13.12,13.36,13.04,13.40,13.20,12.92,13.32,13.00,13.48,13.64,13.20,13.44,13.12,13.48,13.28,13.04,13.44,13.12,13.60,13.76,13.32,13.56,13.24,13.60,13.40,13.56,13.24,13.56,13.28,13.16,12.80,13.68,13.48,13.44,13.00)
X5<-c(3.123,2.322,1.778,-1.111,1.959,-0.359,5.196,2.940,1.518,1.910,3.698,0.720,0.843,-0.513,-0.370,-1.949,2.683,-1.821,-0.203,2.860,0.869,2.577,2.323,2.852,1.770,4.060,3.245,2.335,-0.042,1.045,1.748,2.195,2.166,1.919,1.404,-3.605,-1.780,4.407,4.481,4.566)
Arbol de Regresi´on CART, comentarlo y dar las predicciones
1 Westmount Square, Suite C200, Westmount (QC) H3Z 2P9, Tel. (514) 904-0666 COLO-RECTAL / GASTRO- INTESTINAL DIAGNOSTIC AND TREATMENT PROGRAM COLONOSCOPY/GASTROSCOPY - INFORMATION, PREPARATION & CONSENT THESE INSTRUCTIONS WILL HELP YOU PREPARE FOR YOUR EXAMINATION WE ASK THAT YOU READ THEM CAREFULLY…. • If you have ever had complications or serious side effects fol
The Geography of Poverty and Wealth by Jeffrey D. Sachs, Andrew D. Mellinger, and John L. Gallup, Scientific American, March 2001, pp.71-74. Why are some countries stupendously rich and others horrendously poor? Social theorists have been captivated by this question since the late 18th century, when Scottish economist Adam Smith addressed the issue in his magisterial work The Wealth of Natio