Economía: ¿Cómo se puede utilizar el aprendizaje automático para la econometría?

Cualquier respuesta que dé será rápidamente reemplazada por una mejor respuesta, probablemente escrita por una computadora de auto programación. ¡Pero gracias por preguntar!

Ahora eso probablemente no sea cierto hoy, pero no estaría seguro sobre el próximo año.

Sin embargo, más seriamente, se podría definir el ” aprendizaje automático ” como la capacidad de una computadora, sistema informático o aplicación de software específica para adaptar y reescribir su propio código de programación, con intervención humana limitada o nula; es una mezcla de autoprogramación y análisis predictivo con una gran cantidad de inteligencia artificial . Es muy genial, aunque posiblemente un poco aterrador.

Y podría definir ” econometría ” como la aplicación concertada de matemáticas, estadísticas e informática a verdaderas montañas de datos económicos (o potencialmente, cualquier ) para identificar relaciones económicas difíciles de percibir, o simplemente tomar una decisión económica .

Me parece que las dos ideas están unidas de todos modos. En un mundo inundado de datos, solo hay muchos economistas humanos y ojos relacionados disponibles para realizar un seguimiento de dichas montañas de datos, y mucho menos determinar lo que significa todo. Los humanos son buenos para detectar patrones e idear ideas creativas, pero también tienen sus límites.

Nuestra sociedad está absolutamente enganchada a los datos, económicos o de otro tipo. Solíamos usar papel para hacer esto, y tabletas de arcilla antes de eso. Cada transacción, artículo de stock, dirección del cliente, producto, política y procedimiento se anotó. Y mucho más. Cuando ordenó un producto, creó un rastro de papel de principio a fin. Paso a paso. A veces utilizamos recordatorios físicos (tarjetas de aviso impresas o algo un poco más simbólico) para recordarle a una persona real en vivo que reordene o llame a un cliente. Y luego todo se archivó físicamente. Imagínense si así fue como hicimos negocios hoy.

De todos modos, hemos aumentado de volúmenes más bajos y la grabación de datos se ha vuelto mucho más abstracta . Buscar conexiones y relaciones ocultas siempre fue difícil, pero a medida que los números crecieron, todo se perdió literalmente en la nube. Y el ritmo al que se agregan los datos es implacable. Pero aún necesitamos saber cosas y tomar buenas decisiones .

Para tomar esas decisiones desde una perspectiva comercial , necesitamos saber cosas como:

  • cuando reordenar
  • qué reordenar
  • qué características del producto están en aumento
  • qué características están disminuyendo
  • quién compra qué, dónde y cuándo
  • a qué responde la gente, en términos de marketing
  • la competencia y sus productos
  • y cualquier ventaja comparativa
  • regulaciones y cambios regulatorios
  • eficiencias de entrega
  • si entrar o salir de un mercado, y cuándo. Y cómo.

Y variaciones sobre todo eso, y mucho más además.

Econometrics interviene con sus habilidades matemáticas, estadísticas y de informática para construir modelos , descubrir las tendencias ocultas, detectar la ventaja comparativa en desarrollo, la disminución de la fortuna o la próxima gran cosa antes de que sea cegadoramente obvio. Y para evitar fallas en las cadenas de suministro y entrega. Y para dar a las empresas la oportunidad de tomar la decisión más eficiente y efectiva.

Desde una perspectiva nacional, los gobiernos y sus burocracias deben rastrear el PIB , los cambios fiscales y monetarios a lo largo del tiempo y predecir y abordar los problemas antes de que sucedan. Y realizar un seguimiento de la balanza comercial. Desempleo. Demografía Tasas de natalidad. Tendencias de inmigración. Necesidades educativas. Y así sucesivamente. (Incluso la opinión de los votantes).

Una vez más, la econometría interviene, armada con matemáticas, estadísticas y ciencias de la computación para construir una vez más algunos modelos, para descubrir estas tendencias fiscales y monetarias ocultas, para detectar las habilidades y recursos en declive o con exceso de oferta o lo que sea necesario para mantener al país en el lugar deseado. curso.

La econometría ayuda a las corporaciones, las burocracias y los gobiernos a gestionar esa verdadera montaña de datos y, con suerte, aportar algo de estabilidad y previsibilidad a lo que se ha convertido en una mezcla potencialmente volátil. Pero necesita las mejores herramientas.

Con tantas transacciones y tantas corporaciones y naciones compitiendo por la más mínima ventaja del mercado, se han desarrollado sistemas automatizados y semiautomatizados para convertir el más mínimo y mínimo beneficio en grandes ganancias al aprovechar el gran volumen. Los mercados complejos y de rápido movimiento necesitan el mejor modelado, especialmente cuando se incluyen factores dispares. Si bien el análisis de regresión es un gran stock econométrico en el comercio, el aprendizaje automático lo lleva a un nivel superior.

A mediados de la década de 1970, solía tomar físicamente (corriendo, principalmente, para cumplir con una fecha límite) los cheques diarios de los grandes clientes bancarios (una letra de cambio, emitida por un banquero, pagadera a pedido, ¿los recuerdas?) un mercado monetario central de ladrillo y mortero para invertir de la noche a la mañana, a fin de obtener una ganancia pequeña pero significativa. Ahora, tales transacciones son electrónicas y se repiten constantemente y sin cesar, incluso sin descanso, por computadoras que buscan convertir algunas fracciones en centavos completos.

Entonces, en pasos , aprendizaje automático , adaptándose gradualmente a patrones de demanda y oferta que cambian vigorosamente. Es la mejor herramienta para estas situaciones de rápida evolución . Se adapta Se aprende.

Esencialmente, el aprendizaje automático simplifica y automatiza el complejo “modelado” econométrico que se haría de todos modos, al reemplazar una gama de algoritmos especializados con modelos holísticos autoadaptativos de los datos y su “comportamiento”. Aprende a medida que avanza y se vuelve “mejor” en sus predicciones y acciones posteriores. Integra datos aparentemente dispares y los modela con “inteligencia”.

Al unir el aprendizaje automático y la econometría, en teoría podría desarrollar un modelo predictivo y analítico con agentes inteligentes que podrían “impulsar” una economía (o un subconjunto de una economía), o participar en un mercado o ejecutar una cadena de suministro o suministro . Predeciría dónde y cuándo colocar recursos (existencias, repuestos, componentes, camiones, lo que sea) o cuándo tomar decisiones clave. Y podría hacerlos para ti también.

O utilice el modelo de aprendizaje automático “vivo” para predecir las tasas de mano de obra, la escasez, el exceso de oferta o cualquier cosa , realmente. Puede rastrear, adaptar y eliminar virus informáticos , o eliminar el correo electrónico no deseado . Puede modelar las mejores prácticas y probar diferentes configuraciones. Puede ejecutar publicidades dirigidas y adaptativas basadas en situaciones locales, noticias de última hora, problemas de suministro de la competencia, ofertas especiales de precios o cambios de opinión minuto a minuto.

Para una burocracia gubernamental que puede significar un ajuste fino para minimizar el desempleo y combinar el sistema laboral y educativo con las predicciones sobre las habilidades que aún están por llegar a ser “populares”. Permitiría una predicción más rápida y mejor del costo y los beneficios de los diferentes enfoques del desarrollo económico . Podría automatizar la intervención en el mercado y poner los recursos donde se necesitan, justo a tiempo .

O lo que sea, de verdad. Al igual que un automóvil de Google podría navegar por las calles.

Esto podría ser más efectivo, y eficiente, que nuestro enfoque humano, práctico, o un poco aterrador. ¡Elige tu opción!

Más lectura:
Aprendizaje automático
Página en coursera.org
Econometría
¿Qué es la econometría?

Tradicionalmente, el kit de herramientas de aprendizaje automático y el kit de herramientas econométricas se usan para responder preguntas distintas: mientras que el aprendizaje automático se centra en la predicción, la econometría, especialmente la inferencia causal, se centra en la toma de decisiones.

Uno de los principales desafíos con las técnicas econométricas estándar para estimar las relaciones causales es que el modelo y la selección de variables son relativamente sin principios. Y “relativamente sin principios” se convierte en un negocio más grande en un mundo con millones de observaciones, con tantas características y una gran cantidad de contrafactuales aparentemente razonables. Los economistas (¡y los científicos de datos de domo!) Aún pueden construir sus modelos de manera ad-hoc, pero eso se vuelve cada vez más poco práctico a medida que los datos escalan y, como veremos en la próxima publicación, es propenso a resultados y decisiones subóptimos. . Además, podríamos aspirar a construir estos sistemas de decisión para poder iterar sin ninguna interacción humana en absoluto, y para que eso suceda, la máquina debe ser capaz de tomar estas decisiones por sí sola.

La buena noticia es que los métodos para el modelo basado en principios y la selección de características son fundamentales para el aprendizaje automático. Y en los últimos años, visionarios académicos como Victor Chernozhukov, Susan Athey, Guido Imbens, Alberto Abadie y otros han estado desarrollando cuidadosamente adaptaciones que combinan lo mejor de lo que el aprendizaje automático tiene para ofrecer con las aplicaciones de inferencia causal que más importan.

Hay una variedad de métodos de ML para la selección de variables instrumentales, efectos de tratamiento heterogéneos, controles sintéticos y más. Como ejemplo concreto, considere dos adaptaciones de ML simples pero poderosas que pueden acelerar su toma de decisiones, incluido el tiempo para resolver las pruebas AB: doble selección y doble aprendizaje automático, ambos para la selección de covariables con principios.

* A2A *

Mi conocimiento de la econometría es algo servil. Sin embargo, aquí hay algunas cosas en las que el aprendizaje automático puede ser potencialmente útil para la econometría:
1] Uso de modelos no lineales como árboles de decisión y bosques especialmente aleatorios que tienen amplias aplicaciones en muchas áreas. Especialmente con los esfuerzos recientes [A] que intentan dar una base teórica más sólida a los bosques aleatorios, con suerte comenzarán a ser menos mágicos y más científicos.
2] Los modelos gráficos se han utilizado durante mucho tiempo para estudiar la inferencia causal. Pero los desarrollos recientes en MCMC, especialmente con el paquete de software llamado Stan [B], el uso de modelos gráficos complicados no debería ser un obstáculo. [C] debería dar una idea de cómo los documentos de diversos campos están utilizando Stan.
3] Las técnicas de etiquetado activo / muestreo activo no se han explorado en econometría (nuevamente mi conocimiento es rudimentario, así que discúlpeme si ese no es el caso). Si va a gastar dinero en alguna encuesta, ¿por qué no utilizar los datos para decidir a quién preguntar? En uno de nuestros trabajos, pudimos combinar el etiquetado activo con el muestreo estratificado para mostrar mejoras sobre el muestreo aleatorio [D].
4] Una de las técnicas más comunes que se ha vuelto bastante popular en el aprendizaje automático es utilizar el regularizador de 1 norma para la selección de características o variables. No he visto el uso de tales técnicas en econometría, que nuevamente creo que podría ser bastante útil para determinar las relaciones causales.

Por supuesto, todo lo anterior viene con la advertencia de que tengo muy poco conocimiento en el campo de la econometría para sugerir algo, pero con suerte, lo anterior sigue siendo útil.

[A] http://jmlr.org/proceedings/pape
[B] http://mc-stan.org/
[C] http://mc-stan.org/citations.html
[D] http://www.computer.org/csdl/pro

El economista jefe de Hal Varian en Google tenía un artículo sobre esto en su página web de UC Berkeley
http: //people.ischool.berkeley.e
lea la lista de referencias para más documentos
usa el término Big Data pero es sinónimo de aprendizaje automático
Otro post de ¿Cuál es el estado actual de la investigación académica que aplica el aprendizaje automático y las matemáticas a las ciencias sociales? un economista de Oxford menciona al profesor de economía de Harvard Sedhil Mullainathan Conferencia de la Royal Economics Society Conferencia de Hahn: Big data y el método inductivo para la prueba de teoría: un marco con aplicaciones Vi la conferencia hace muchos meses y la considero excelente

Creo que depende en gran medida del tipo de econometría. Como se especificó la evaluación del sistema / efecto (y como esta es mi especialidad), en su mayor parte lo discuto (también leo el artículo de Hal Varian).
La inducción causal / el tratamiento impacta la estimación / programa o la evaluación del efecto la mayoría de las veces intenta construir si un tratamiento específico afecta causalmente algún resultado. El tema central en el que debe pensar es que no sabe cómo se vería el resultado para los tratados si no hubieran recibido tratamiento, es decir, no tiene la circunstancia contrafáctica. De esta manera, supongamos que el individuo X se dirige a la universidad y poco tiempo después obtiene alguna compensación. No comprendemos lo que X habría ganado si no hubiera salido para la universidad, por lo que generalmente no podemos decir si ir a la universidad fue genial o horrible para él. Esto es en ocasiones llamado el “problema de evaluación” o el “problema principal de la deducción causal”.
¿Acaso nos acercaremos a personas que partieron para la universidad con personas que no lo hicieron? En el caso de que hiciéramos esto, tendríamos que hacer hincapié en la forma en que las personas que asistieron a una universidad pueden ser, en un sentido general, no muy similares a las personas que no lo hicieron. Por ejemplo, pueden ser más brillantes, más estimulados o simplemente esperar que el sector empresarial de mayor trabajo regrese de la participación escolar. El hecho de contrastar individuos y sin participación escolar le brinda una combinación del impacto genuino de la participación escolar y cierta distinción en los salarios que se debe solo a la forma en que los individuos con y sin participación escolar son diversos de alguna manera central.
Actualmente hay esencialmente tres cosas que puedes hacer:
1) Experimentos: si pudiéramos distribuir al azar a algunas personas a la escuela y algunas a otra cosa, no habría ningún contraste entre las reuniones y podríamos pensar de manera básica sobre los salarios medios y obtener el impacto causal de la capacitación escolar (con respeto a cualquier “otra cosa” para esta situación). Para esta situación, generalmente no requiere información especialmente grande o rica, ya que solo necesita una correlación de medios. Claramente, no puede hacer este tipo de pruebas en toda la actualidad para una amplia variedad de consultas debido a una variedad de cuestiones morales y prácticas.
2) Condición para las distinciones: puede tener información que sea lo suficientemente rica como para estar seguro de que ve todo lo que hace que los graduados de la escuela no sean lo mismo que los no graduados. Entonces podría condicionar estas distinciones de alguna manera (control de recaídas, coordinación, etc.). Esto es algo en lo que la información mayor y más rica ayuda muchísimo. En esta ilustración, en cualquier caso, es un poco descabellado que realmente veas todo lo que importa (la inspiración, la comprensión, etc., son difíciles de medir).
3) Encuentre algún examen común que haga una variedad de semi-prueba en la participación escolar, es decir, alguna “ocasión” regular que se asemeje a un ensayo aleatorio e intente utilizar esa variedad para distinguir los beneficios de una instrucción escolar (con variables instrumentales, contrastes de contraste). , irregularidad de recaída, etc.). Este es el tipo de cosas con las que se preocupa una gran cantidad de trabajo econométrico en algunos campos microeconómicos (por ejemplo, trabajo, bienestar, etc.). Aquí, la información más amplia y rica ayuda, pero en sí misma no es el tipo de variedad que necesita.
En este sentido, básicamente una gran cantidad de información ayudaría con (2), sin embargo, no de forma habitual con (1) y (3). Creo que el caso es completamente diferente para anticipar un tipo de problemas, en los que, por supuesto, no se piensa en la causalidad. No me sorprendería ver algunos avances allí.

Algunos de los usos que he encontrado son las redes bayesianas para extraer caminos en procesos complejos (psicología, educación, procesos biológicos, probablemente también ayudarían en economía) y crear modelos de pronóstico basados ​​en series de tiempo con predictores adicionales (mucho mejor que los modelos ARIMA o incluso SSA para muchos problemas; consulte aquí: https://www.slideshare.net/Colle …).