El siguiente artículo se publicó originalmente en inglés en el sitio de nuestros aliados de la iniciativa Data Powered Positive Deviance (DPPD) el 17 de mayo de 2021.
Por: Alejandra Cervantes, Asesora técnica de la Iniciativa Agenda 2030, GIZ México; Gabriela Ríos, Jefa de Exploración, Laboratorio de Aceleración PNUD México; e Itzel Soto, Analista de datos, Codeando México.
En cada comunidad, hay individuos o grupos con comportamientos poco comunes que, aunque tienen acceso a recursos similares, encuentran mejores soluciones a los desafíos que sus pares. La búsqueda de estas llamadas desviaciones positivas y la promoción de sus soluciones se conoce como el enfoque de la desviación positiva. Sobre esta base, la iniciativa de desviación positiva basada en datos (Data Powered Positive Deviance DPPD) combina datos tradicionales y no tradicionales para identificar y comprender la desviación positiva de nuevas maneras. Como parte de esta iniciativa, GIZ Data Lab, la Iniciativa Agenda 2030 de la GIZ México, el Laboratorio de Aceleración del Programa de las Naciones Unidas para el Desarrollo (PNUD) en México y el Centro para Desarrollo Digital de la Universidad de Mánchester están llevando a cabo un proyecto piloto en la Ciudad de México para encontrar espacios públicos que sean desviaciones positivas o ‘outliers’ por ser más seguros para las mujeres. Esta entrada del blog ofrece una presentación paso a paso del proceso llevado a cabo para identificar y validar esas posibles desviaciones positivas.
I. El contexto: La violencia contra las mujeres, un reto social y de seguridad apremiante en México
En México, dos tercios de todas las niñas y mujeres mayores de 15 años han declarado haber sufrido al menos un incidente de violencia en su vida. En promedio, 11 mujeres son asesinadas a diario; siendo aquellas entre 20 y 24 años la mayoría de las víctimas de este crimen entre 2000 y 2019. En 2019, más del 50 por ciento de los homicidios de mujeres se cometieron en espacios públicos.
La violencia contra las mujeres a nivel comunidad, perpetrada por un individuo o colectivo desconocido para la víctima, se produce en calles, parques y, en menor medida, en autobuses, minibuses o en el metro. Los ataques que se producen en la calle son principalmente sexuales (66.8%) e incluyen silbidos y piropos inapropiados, acoso, abuso sexual, violación e intento de violación. A nivel nacional, 34% de las mujeres han sufrido alguna forma de violencia sexual en espacios públicos a lo largo de su vida. Sin embargo, 78% de las mujeres y niñas mayores de 15 años no denuncian estos incidentes. La Ciudad de México se encuentra entre las entidades federativas con mayores índices de violencia comunitaria contra las mujeres en el país (61.1%).
Este problema es relevante porque limita la libertad de movimiento de las mujeres y restringe su derecho a la ciudad, estipulado en la Constitución de la Ciudad de México (artículo 12). Además, limita el acceso de las mujeres a oportunidades de trabajo y educación, acceso a servicios esenciales, su participación en actividades culturales y de ocio, y su plena participación en la vida pública.
En este contexto, iniciamos un proyecto piloto para identificar las zonas de la Ciudad de México en las que las mujeres están más seguras -con especial atención a espacios públicos- y explicamos por qué, utilizando el método de desviación positiva basada en datos (Data Powered Positive Deviance DPPD).
II. El enfoque: Pilotaje del método de desviación positiva basada en datos
Uno de los principales retos actuales es desarrollar soluciones innovadoras para los problemas cada vez más complejos del desarrollo. El método de desviación positiva basada en datos (DPPD), al centrarse en los valores atípicos o desviaciones positivas, propone descubrir prácticas y estrategias inusuales que pueden resolver con éxito un problema. La aplicación de este enfoque representa un punto de partida en la búsqueda de soluciones para problemas apremiantes, como la seguridad de las mujeres, ya que aprovecha las ventajas de realizar y combinar análisis cuantitativos y cualitativos.
Establecimos un método paso a paso para descubrir los espacios públicos con mejor comportamiento en términos de seguridad para las mujeres, empezando por el mapeo de las fuentes de datos relevantes, la realización de una agrupación homogénea y la definición de nuestra variable de desempeño para identificar las desviaciones positivas. Enseguida viene el trabajo de campo para recopilar y analizar los factores subyacentes de las desviaciones positivas. Mientras que el análisis cuantitativo se centra en la identificación de las desviaciones positivas y en algunas condiciones posibles que explican su desempeño (por ejemplo, el número de tótems de seguridad, estaciones de policía), el análisis cualitativo se ocupará de comprender los factores sobre el terreno que contribuyen a este comportamiento destacado.
En las próximas subsecciones, desarrollaremos los pasos que hemos dado para aplicar el método de desviación positiva basada en datos (Figura 1) y compartiremos los principales aprendizajes que hemos obtenido en el camino. El proyecto piloto aún está en marcha, pero los primeros pasos ya han aportado valiosas lecciones.
a. Conceptualización, mapeo y acceso a datos
La violencia contra las mujeres es un problema complejo porque se sustenta en un conjunto de relaciones estructurales de desigualdad profundamente arraigadas entre mujeres y hombres. Para conceptualizar mejor las relaciones que sostienen la violencia contra las mujeres, necesitamos entender qué es, cómo funciona socialmente y qué datos pueden utilizarse para explorar el problema.
Uno de nuestros primeros pasos fue realizar una serie de entrevistas con expertas y expertos en planeación urbana, activistas, academia, así como funcionarias y funcionarios públicos con experiencia relevante en materia de violencia contra las mujeres. Este ejercicio nos proporcionó una orientación inicial sobre los factores que hacen que los espacios públicos sean más seguros para las mujeres: infraestructura urbana, infraestructura de seguridad, personas, uso del espacio y movilidad. Además, identificamos algunos conjuntos de datos iniciales para el análisis.
El siguiente paso consistió en hacer un mapeo exhaustivo de los conjuntos de datos públicos y no públicos en las categorías mencionadas. Inicialmente identificamos 67 posibles conjuntos de datos que podrían arrojar luz sobre el problema, independientemente de si eran privados o públicos o de si sus características los hacían adecuados para el análisis. En otras palabras, nuestro mapeo inicial era una lista de deseos de conjuntos de datos que incluían infraestructura urbana, población, patrones de desplazamiento, índice socioeconómico, seguridad y justicia. Recurrimos principalmente a dos fuentes: el Portal de Datos Abiertos de la Ciudad de México y el Instituto Nacional de Estadística y Geografía (INEGI). También mapeamos conjuntos de datos no públicos, propiedad de entidades públicas y privadas, como datos de celulares, reportes al 911 y el uso de botones de pánico.
El siguiente paso fue convertir la lista de datos deseados en una lista accionable. Identificamos los datos más importantes de varios conjuntos de datos en función de su relevancia, nivel de agregación y fecha de última actualización. Era importante obtener información lo más granular posible porque queremos utilizar unidades geográficas de análisis lo suficientemente pequeñas y precisas como para descubrir fácilmente los factores subyacentes a los espacios públicos positivamente desviados. Seleccionamos datos abiertos relacionados con la infraestructura urbana (por ejemplo, estaciones de metro y de autobús), uso del suelo, infraestructura de seguridad (por ejemplo, ubicación de botones de pánico, cámaras), datos del Censo e índices de marginación para nuestro análisis. También seleccionamos el conjunto de datos de la Fiscalía General de Justicia (FGJ) que contiene información actualizada sobre víctimas de delitos en las carpetas de investigación de la Ciudad de México.
b. Unidad de análisis
Comenzamos por definir la unidad para nuestro análisis. Elegimos las AGEB, áreas geoestadísticas básicas utilizadas en México, que están formadas por manzanas delimitadas por calles, avenidas o andadores (Figura 2). Elegimos esta unidad de análisis porque ofrece un buen nivel de granularidad para tener un número suficiente de observaciones -hay 2,431 AGEB en la Ciudad de México- y un área geográfica manejable para cuando realicemos el trabajo de campo y nos centremos en los espacios públicos. Además, la mayoría de los datos estadísticos oficiales que utilizamos están a nivel de AGEB.
c. Agrupación homogénea
La Ciudad de México es una ciudad desigual. El Informe de Desarrollo Humano Municipal lo ilustra: el municipio con el mayor Índice de Desarrollo Humano (IDH) de Ciudad de México es muy similar al de Suiza, mientras que el municipio más bajo se acerca más al IDH de Colombia. Incluso dentro de un mismo municipio hay fuertes contrastes, por ejemplo, en algunas zonas, es común encontrar fraccionamientos de altos ingresos junto a colonias de bajos ingresos.
Al aplicar el método de desviación positiva basada en datos, uno de los objetivos es identificar prácticas distintivas o atípicas que puedan transferirse a personas, comunidades o espacios con condiciones similares. Al hacerlo, las posibilidades de que estas prácticas tengan éxito son mayores. Por ejemplo, transferir las mismas prácticas que funcionan para AGEB con un IDH similar al de Suiza a AGEB con un IDH similar al de Colombia podría no ser la mejor manera de abordar la inseguridad de una manera consciente del contexto. En pocas palabras, queremos evitar comparar peras con manzanas.
El proceso de agrupar unidades de análisis con características similares se denomina agrupación homogénea. ¿Qué variables debemos utilizar para crear grupos homogéneos? Factores estructurales que están por encima del nivel del individuo -por ejemplo, factores económicos, políticos y sociales- y que son comunes a una unidad geográfica. Estos factores se mantienen bastante estáticos a lo largo del tiempo o son difíciles de cambiar. En otras palabras, no son transferibles a otras unidades de análisis.
Para ello, elegimos variables estructurales que están relacionadas con la presencia de crimen: densidad de población y condiciones socioeconómicas. El tamaño de las AGEB, la población que vive en ellas y los transeúntes que reciben no son uniformes en toda la ciudad, por lo que quisimos agrupar las AGEB con números similares de población y transeúntes. Por ello, utilizamos densidad poblacional y viajes diarios entrantes de transeúntes.
Para tener en cuenta las condiciones socioeconómicas, seleccionamos el Índice de Marginación del Consejo Nacional de Población (CONAPO) porque resume varias características socioeconómicas a nivel de AGEB, como condiciones de la vivienda, ingreso, población activa y nivel de educación. Realizamos un análisis de conglomerados, que dio como resultado cuatro grupos (Figura 3) caracterizados por:
Grupo I: AGEB con una densidad de población media y un índice de marginación muy bajo que atraen a un número muy elevado de personas para trabajar y estudiar
Grupo II: AGEB muy pobladas con un bajo índice de marginación que atraen a un número elevado de personas para trabajar y estudiar
Grupo III: AGEB muy pobladas con un índice de marginación medio y un nivel medio de personas que se desplazan allí diariamente para trabajar y estudiar
Grupo IV: AGEB con un índice de marginación alto y una baja densidad de población que atraen a pocas personas para trabajar o estudiar
d. Variable de desempeño
Para identificar las AGEB que superan o se desvían positivamente, necesitábamos encontrar una medida fiable del comportamiento. En otras palabras, necesitábamos datos que nos ayudaran a identificar qué AGEB registran un número de delitos contra las mujeres inferior al esperado. Para ello, utilizamos el conjunto de datos de víctimas en carpetas de investigación de la Fiscalía General de Justicia (FGJ) de la Ciudad de México, que abarca los años 2019 y 2020.
Como mencionamos anteriormente, existe un elevado número de delitos que no se denuncian. Es lo que se conoce como cifra negra, delitos que no se denuncian o que no son objeto de una investigación previa y, por tanto, no aparecen en ninguna estadística. Somos conscientes de la limitación que esto supone, pero es el único conjunto de datos existente que ofrece los campos de información que necesitábamos para construir la variable de desempeño: 1) tipo de delito, 2) día de la semana en que se produjo el delito, 3) hora del día en que se produjo, 4) edad de la víctima, 5) sexo de la víctima y 6) geolocalización del suceso. Este último aspecto es especialmente importante, ya que nos permite asociar las cifras de los delitos a sus respectivas AGEB.
El primer paso para construir la variable de desempeño fue definir el universo de delitos para nuestro análisis. Teniendo en cuenta que el objetivo de nuestro proyecto piloto es la seguridad en espacios públicos, seleccionamos los delitos que solo ocurren en espacios públicos -aquellos perpetrados contra un transeúnte en un entorno público- y los delitos de violencia de género que podrían ocurrir en espacios públicos, como agresión sexual y feminicidio. Excluimos violencia doméstica y familiar porque la literatura al respecto sugiere que tienden a ocurrir en espacios privados. Lo hicimos porque, aunque el conjunto de datos contiene la geolocalización de los incidentes, no podemos saber si el incidente ocurrió en un espacio público o privado.
Es importante entender los diferentes tipos de violencia contra las mujeres porque el impacto psicológico y físico de los delitos varía mucho. No es posible, por ejemplo, equiparar un feminicidio a un robo, y las condiciones, incluidas las características del espacio físico, que los provocan pueden ser diferentes. Por lo tanto, después de definir el universo de delitos para nuestro análisis, nos propusimos dividirlos en categorías según su gravedad e impacto en las mujeres. Esto dio como resultado tres categorías (Figura 4). En la categoría "Severidad 1" se encuentran los delitos que amenazan la vida y tienen como objetivo dañar la integridad física y sexual de las mujeres, mientras que en "Severidad 2" se incluyen los delitos con violencia física y psicoemocional, pero que no amenazan la vida. “Severidad 3" se refiere a aquellos en los que no hubo violencia física, pero pueden dejar un impacto psicoemocional.
Con estas categorías, queremos probar si podemos encontrar diferentes desviaciones positivas dentro y/o entre categorías. Por ejemplo, un conjunto de desviaciones positivas para "Severidad 1", delitos más graves como feminicidio y violación, y otro para "Severidad 3", delitos menos graves, como robo a transeúnte sin violencia. Si ese es el caso, cuando realicemos el trabajo de campo, podríamos identificar los factores distintivos que favorecen los tipos de delitos más o menos graves.
e. Identificación de desviación positiva
El siguiente paso del método desviación positiva basada en datos es identificar las desviaciones positivas mediante un análisis cuantitativo. En el caso de nuestro piloto, estamos identificando las AGEB que, controlando las características relevantes de estos espacios, presentan un número de víctimas femeninas inferior al previsto. Esto significa que estas AGEB tienen un desempeño observado mejor de lo esperado, dadas sus características. El marco temporal que estamos utilizando para nuestro análisis es el año 2019 y los tres primeros meses de 2020, antes de que comenzara el confinamiento de COVID-19, impactando en los patrones de movilidad y uso de los espacios públicos.
Entonces, ¿cómo identificamos las desviaciones positivas? Empezamos haciendo un modelado estadístico. El modelado estadístico es necesario para encontrar desviaciones positivas porque tenemos que predecir la variable de desempeño, es decir, las víctimas femeninas en las carpetas de investigación, con el modelo. A continuación, debemos observar los residuales, es decir, las diferencias entre los valores observados y los predichos. Si hay valores atípicos positivos en los residuales, estamos ante una desviación positiva.
En otras palabras, hay desviaciones positivas cuando el número de víctimas observado por AGEB es muy inferior al número de víctimas predicho por el modelo.
Para el modelado estadístico, necesitamos definir las variables independientes, aquellas que van a predecir el número de víctimas femeninas. En nuestro modelo estadístico, la mayoría de las variables independientes son las características de la infraestructura urbana en los espacios públicos y las características de la población de las AGEB. En cuanto a la infraestructura urbana, incluimos zonas verdes, paradas de transporte público, tipos de carreteras, cantidad de comercio, servicios, escuelas, hospitales y otros servicios relevantes en el espacio. En cuanto a las características de la población, incluimos grupos de edad, hogares encabezados por mujeres, porcentaje de personas económicamente activas y porcentaje de personas sin educación formal. También se incluyeron las variables utilizadas para la agrupación homogénea, así como una variable para indicar si la AGEB es colindante con el Estado de México y el tamaño de la AGEB. Nuestra selección de variables independientes se basó, tanto en entrevistas a personas expertas, como en estudios anteriores sobre crimen en la Ciudad de México.
Tras definir nuestras variables independientes, realizamos tres tipos de análisis de regresión. En primer lugar, realizamos una regresión lineal múltiple. Posteriormente, realizamos una regresión lineal LASSO para llevar a cabo la selección de variables con el fin de mejorar la precisión de la predicción y la interpretabilidad del modelo estadístico. Por último, hicimos una regresión binomial negativa porque este tipo de regresión está diseñado para ajustar modelos en los que la variable de desempeño consiste en recuentos con sobredispersión. Hicimos el análisis de tres regresiones para cada uno de los cuatro conglomerados de la agrupación homogénea por categoría de severidad del delito y para todos los delitos, por lo que tenemos varios resultados en función del tipo de regresión, conglomerado y severidad del delito.
Entre los principales hallazgos hasta el momento se encuentra que las variables más relevantes identificadas en las tres regresiones fueron tamaño de población, superficie de AGEB, servicios financieros, restaurantes y bares por AGEB, así como distancia al Metrobús y a la estación de metro más cercanos. Esta última variable tiene una relación negativa con el número de víctimas, lo que significa que, cuando la distancia entre el centro de la AGEB y la estación de metro es menor, se espera un mayor número de víctimas. Los tres modelos explican por término medio el 40% de la varianza de la variable de resultado -la variable de desempeño- entre los distintos grupos, lo que proporciona un buen punto de partida para definir las desviaciones positivas. Estamos seleccionando las AGEB que son desviaciones positivas que queremos conocer mejor.
III. Siguientes pasos
Una vez que terminemos la identificación de las AGEB que son desviaciones positivas, las validaremos utilizando varios tipos de datos que puedan ayudarnos a explicar si son o no desviaciones positivas y qué podría explicar su comportamiento. Para este paso, estamos considerando datos como la ubicación de las estaciones de policía, y los tótems con botones de pánico y cámaras.
Después realizaremos trabajo de campo. Esto nos proporcionará datos cualitativos sobre las causas o factores que explican el comportamiento de los espacios públicos con un comportamiento disruptivo y positivo. Una vez que completemos el trabajo etnográfico, presentaremos los resultados a socios estratégicos para debatir su relevancia e identificar posibles intervenciones piloto. El resultado final del proyecto serán recomendaciones informadas por la evidencia para la mejora de las políticas públicas destinadas a abordar la violencia contra las mujeres en espacios públicos.
A medida que avancemos con este proyecto piloto, compartiremos nuestros progresos en este espacio, así que manténgase en sintonía y póngase en contacto si quiere saber más.
Agradecemos especialmente a Andreas Gluecker, Director de Proyectos, GIZ Data Lab; Andreas Pawelke, GIZ Data Lab; Basma Albanna, Universidad de Mánchester; Jeremy Boy, Laboratorios de Aceleración del PNUD; Daniela Torres, GIZ México; y Alma Rangel, Codeando México, por sus valiosos comentarios y contribuciones.
Acerca de:
La iniciativa de desviación positiva basada en datos (Data Powered Positive Deviance) se creó con la convicción de que la mejor manera de abordar los complejos retos del desarrollo sostenible es aprender de las personas que se enfrentan a esos retos cada día. Con esta mentalidad, el Laboratorio de Datos GIZ, el Centro de Desarrollo Digital de la Universidad de Mánchester y los Laboratorios de Aceleración del Programa de las Naciones Unidas para el Desarrollo están llevando a cabo una serie de proyectos piloto en diferentes países y ámbitos para descubrir prácticas e innovaciones eficaces y desarrolladas localmente como respuesta a los retos del desarrollo.
Contacto
- Laboratorio de Aceleración PNUD México: Gabriela Ríos: gabriela.rios@undp.org
- GIZ Data Lab: Andreas Gluecker / Catherine Vogel: datalab@giz.de
- Universidad de Mánchester: Basma Albanna: basma.albanna@manchester.ac.uk
- Laboratorio de Aceleración PNUD: Jeremy Boy: jeremy.boy@udp.org
- Iniciativa Agenda 2030 de la GIZ México: Alejandra Cervantes: alejandra.cervantes@giz.de