¿Quiénes hablan del Censo en Facebook, Instagram, TikTok y YouTube?


Resumen:

  • Construimos una muestra representativa de 1 208 cuentas que realizaron comentarios sobre el Censo en Facebook, Instagram, TikTok o YouTube.
  • Recuperamos información clave como género, edad, posición política, zona geográfica y nivel educativo.
  • Detectamos una baja presencia de ‘bots’, tan sólo un 2,5% de las cuentas.
  • Los llamados a informarse sobre el proceso son realizados principalmente por mujeres.
  • Detectamos que las personas de entre 30 y 44 años son las que realizan una mayor cantidad de mensajes inciviles.
  • Las posiciones políticas de derecha son más prevalentes que las de izquierda, excepto en Instagram. Las personas de derecha tienen mayor preocupación por temas como el objetivo del Censo, el tiempo y costo, así como de la situación social y política.
  • En cambio, las personas de izquierda tienen una mayor tendencia a realizar llamados a informarse.

Hace tres semanas publicamos un análisis de la conversación sobre el Censo en cuatro plataformas de redes sociales: Facebook, Instagram, TikTok y YouTube. En esa entrada, analizamos mas de 30 800 comentarios, publicados por casi 15 700 cuentas únicas. Los resultados invitaron a poner atención en los motivos que las personas tienen para dudar y desconfiar en la aplicación de este instrumento tan importante.

Muchas personas nos preguntaron ¿quiénes son los que comentan? porque claro, una cosa es describir analíticamente los comentarios –su lógica y racionalidad– y otra, muy distinta, es caracterizar social y políticamente a estas personas. Hasta ahora, no podíamos decir mucho. Rara vez se observan análisis inferenciales, que busquen representar a las personas detrás de los mensajes digitales. Por ello, abordamos este problema con una sola pregunta ¿cuáles son las características sociales y políticas de las cuentas que emitieron los mensajes que recolectamos?

Asumimos que las 15 700 cuentas son nuestra población y que lo más adecuado era desarrollar una muestra representativa en términos probabilísticos, estratificada por plataforma de red social y aleatoria en su selección. Calculamos el tamaño de la muestra con un nivel de confianza del 95% y asumimos una varianza máxima de +/- 2,7%. Bajo esos parámetros, recolectamos una muestra inicial de 1 216 casos y descartamos 8 observaciones por no encontrar sus cuentas. Estamos hablando de un 0,7% de los casos. Por lo tanto, la muestra con la que trabajamos finalmente es de 1 208 usuarios de las cuatro plataformas de redes sociales. En la Tabla 1 se puede observar su distribución en cada una de las plataformas en las que hicimos el análisis.

Tabla 1. Distribución de frecuencia y porcentaje de la muestra según plataforma

Fuente: Elaboración propia

Desde luego, cada plataforma ofrece distintas posibilidades, mientras que en Facebook las personas pueden publicar hasta las relaciones de parentesco, en Instagram, la bio sirve para expresar lo que uno quiera. En cambio, YouTube y TikTok son un poco mas escuetas, y ofrecen menos espacios para entregar información personal. Nos hicimos 6 preguntas: ¿Es un bot? ¿Qué edad tiene? ¿Qué género –binario– se puede observar? ¿De qué comuna es? ¿Qué nivel educativo tiene? ¿Qué posición política declara o se puede inferir?

Lo primero que detectamos es una baja presencia de cuentas ‘bots’, tan sólo un 2,5% de las cuentas fueron clasificadas en esta categoría. Hablamos de 30 casos. La clasificación es estrecha, se basa en la idea de que la cuenta está manejada por un computador y no por un humano, desarrollan mensajes repetitivos y, por lo general, invitan a hacer click a otras páginas. De este modo, podemos señalar que la amplia mayoría de los mensajes recolectados representan persona reales que interactúan en internet. Las cuentas clasificadas como ‘bots’ no las eliminamos, sino que las mantuvimos dentro del análisis, en tanto que no presentan mayores distorsiones a los resultados que aquí presentamos.

A continuación presentamos los resultados de las variables más relevantes. Primero, una aproximación al género, luego a los tramos etarios y la posición política. En estos tres casos, presentamos resultados de la distribución por plataforma y las diferencias dentro de los temas que detectamos. Para esto último, se sugiere leer la entrada mencionada para tener mayor contexto de los resultados. Luego de ello, presentamos un breve apartado para abordar el caso de zona geográfico y nivel educativo, para finalizar con una breve reflexión sobre los resultados y la construcción de datos en plataformas de redes sociales.

  • Género: distribuciones casi equitativas entre plataformas

Primero, encontramos que el porcentaje de hombres (45,7%) y mujeres (45,5%) es prácticamente el mismo, mientras que las cuentas clasificadas como «no identificadas» alcanzan casi el 9%. Estos valores presentan variaciones en cada una de las plataformas, las que se pueden observar en la Figura 1. Sólo en el caso de YouTube hay diferencias estadísticamente significativas entre hombres y mujeres, en el resto de los casos, las diferencias son meramente descriptivas. Además, estos resultados son consistentes con los encontrados en la primera entrada.

Figura 1. Distribución de género según plataforma

Fuente: Elaboración propia [intervalos de confianza al 95%]

Ahora bien, cuando se agrupan los distintos temas en los que se clasificaron los comentarios (ver entrada anterior) y se observa la distribución de género dentro de cada uno de ellos, podemos notar que en general no existen mayores diferencias estadísticamente significativas. En la Figura 2 se encuentran los resultados. Sin embargo, en los llamados a informarse notamos una diferencia sustantiva por género. Son las mujeres quienes realizan mayores llamados a informarse, en comparación a los hombres. Este es el único tema dentro de los cuales se nota esta diferencia estadísticamente significativa, dando cuenta de un comportamiento definido en función del género de quien emite los comentarios.

Figura 2. Distribución de género en cada uno de los temas identificados

Fuente: Elaboración propia [intervalos de confianza al 95%]

  • Edad: Las incivilidades de los adultos jóvenes

La edad es una variable un poco más compleja de identificar, a diferencia del caso anterior. En esta muestra, logramos clasificar un poco mas del 56% de las observaciones, las que se componen de un 11,7% a personas entre 18 y 29 años, un 23,7% entre 30 y 44 años, un 15,4% corresponde a personas entre 45 y 59 años, mientras que un 5,5% son personas de 60 o más años. El resto, (44%) no fue posible asignarle una edad. Nuevamente, la composición etaria y el porcentaje de cuentas no clasificadas, varían de acuerdo a la plataforma. En la Figura 3 se observa la distribución de cada uno de los tramos etarios en cada una de las redes. Llama la atención que el peso de las cuentas con edad no identificada es menor en Facebook (19,4%), y muy superior en YouTube (86%).

Figura 3. Distribución de tramo etario según plataforma

Fuente: Elaboración propia [intervalos de confianza al 95%]

Cuando se compara la distribución etaria dentro de cada uno de los temas clasificados se notan algunas cosas interesantes. Los resultados se pueden apreciar en la Figura 4. Por una parte, las personas entre los 30 y 44 años son las que realizan mayores mensajes inciviles, con diferencias estadísticamente significativas respecto a los otros tramos de edad clasificados ¿Será un tramo etario particularmente incivil? Desde luego no se puede extraer esa conclusión con sólo observar estos datos, pero invita a la reflexión. Por otra parte, no observamos mayores diferencias estadísticamente significativas entre grupos, a excepción de la mencionada.

Figura 4. Distribución de tramos etarios en cada uno de los temas identificados

Fuente: Elaboración propia [intervalos de confianza al 95%]

  • Posición política: la relevancia de la derecha y la particularidad de la izquierda

En el caso de la posición política, logramos identificar un poco más del 49% de las tendencias de las personas. En este caso, hicimos un ejercicio de observar si es que hay alguna declaración explícita a una posición particular o si las personas entregaban información suficiente que permitiera deducir una posición política . En este sentido, se identificó un 31,1% de cuentas con la derecha o centro derecha, mientras que un 17,9% de las cuentas fueron clasificadas como izquierda o centro izquierda. Nuevamente, al igual que en los casos anteriores, estos resultados varían por plataforma, tanto en la identificación de alguna posición, como en la distribución entre derecha e izquierda. Los resultados se pueden apreciar en la Figura 5.

Figura 5. Distribución de posición política según plataforma

Fuente: Elaboración propia [intervalos de confianza al 95%]

Ahora bien ¿qué se observa respecto a la distribución de la posición política dentro de cada una de los temas identificados? En la Figura 6 se puede observar los resultados. Por una parte, se observa un grupo de categorías temáticas que presentan mayor prevalencia de personas de derecha, cuando se compara con las cuentas de izquierda. En este caso, hablamos de las preocupaciones por la legalidad y sanciones asociadas al proceso, los objetivos que este persigue, así como los mecanismos de recolección, y el tiempo y costo del proceso. También resulta interesante notar que son las personas de derecha quienes presentan mayor cantidad de mensajes respecto a la situación social y política del país, relacionándolo con el proceso. En todos estos casos hay diferencias estadísticamente significativas entre derecha e izquierda.

Figura 6. Distribución de posición política en cada uno de los temas identificados

Fuente: Elaboración propia [intervalos de confianza al 95%]

Por otra parte, se observa que en el caso de los llamados a informarse son las personas de izquierda las que mayormente realizan esta acción, en comparación con las personas de derecha. Este resultado, en conjunto con los abordados en el párrafo anterior, permiten desarrollar algunas ideas respecto a la relación entre las posiciones políticas de las personas y la aplicación del Censo. Estos resultados sugieren una preponderancia de las personas de derecha en la mayoría de las plataformas comentando sobre el Censo, así como en las preocupaciones respecto a temas particulares internos del Censo, y de la situación social y política del país. Esto permite sugerir que los comentarios sobre el Censo pueden estar fuertemente influenciados por la posición política de la persona.

  • Otras variables de interés: zona geográfica y nivel educativo

También registramos otras variables que fueron más difíciles de recuperar. Por una parte, tenemos el caso de la variable zona geográfica, la que logramos reconstruir a partir de información comunal o regional que las personas entregaban respecto a su residencia. En términos generales, construimos esta variable para un poco más del 32% de la muestra y organizamos los resultados en función de las macrozonas en las que se divide el país. La zona con mayor cantidad de cuentas identificadas corresponde a la Región Metropolitana (12,6%), seguido por la Centro Sur (6,5%), Sur (5,1%), Centro (4,1%), Norte (3,4%) y la zona Austral (0,6%).

Ahora bien, cuando observamos por plataforma los resultados, notamos que en Facebook se logra, por lejos, la mayor cobertura de información –lo que se explica por las características de la misma plataforma. En este caso, se logró identificar en un 71% de los casos. En cambio, en Instagram, TikTok y YouTube, los datos faltantes superan 3/4 de la muestra. Estos resultados se puede observar en la Figura 7.

Figura 7. Distribución de zona geográfica según plataforma

Fuente: Elaboración propia [intervalos de confianza al 95%]

Finalmente, el nivel educativo fue la variable más difícil de recolectar. Tan sólo recuperamos el 20% de los casos. En términos generales, este porcentaje se compone de un 14% de personas que estudiaron en la Educación Superior, sea Centro de Formación Técnica, Instituto Profesional o Universidad. En cambio, un 6% de las personas fueron registradas con un nivel educativo de Educación Media o Básica. Al igual que en el caso anterior, estos resultados varían por plataforma y se pueden observar en la Figura 8. Nuevamente, es Facebook la plataforma que nos permite recuperar la mayor cantidad de información.

  • Algunas conclusiones a partir de este caso

A lo largo de esta entrada hemos desarrollado un análisis que busca representar a las cuentas que publicaron sobre el Censo en cuatro plataformas de redes sociales. En términos generales podemos notar que no hubo mayores diferencias de género en la participación de los comentarios, y pocas diferencias respecto a los temas, salvo en los llamados a informarse. En el caso de la edad, se observan diferencias entre plataformas y en el trato de las incivilidades, mientras que la posición política es la que otorga mayores diferencias respecto a los temas que se tratan.

Por otro lado, este trabajo es una exploración sobre técnicas que permiten abordar el problema de la representatividad de los comentarios en las distintas plataformas. En este caso, podemos notar que variables como género y edad son de fácil construcción y, parcialmente, posición política. En cambio, zona geográfica y nivel educativo fueron difíciles de recopilar. Cualquier sea la variable, notamos que Facebook es la plataforma que entrega mayores facilidades para recuperar información, mientras que Instagram, TikTok y YouTube resultan ser más complejas.

Imagen: Generada con Dall-E

Deja un comentario