Fundación BBVA Fundación BBVA

Multivariate Statistics

Case Study 2: Positioning The "Middle" Category In Survey Research


1. We have shown how multiple correspondence analysis and its subset and canonical variants can allow a detailed investigation of the patterns of response in a large data set from a social survey. Based on similar studies that we have conducted on several different survey data sets of this type, from the ISSP and Eurobarometer, several results that emanate here appear to be typical:

2. In the analysis of individual responses, the missing response categories dominate. This is partially due to responses sets (all missings) by many respondents, which inflate the associations between the missing categories, but this association is strong even when the response sets are eliminated.

3. Although the middle response categories might appear to be positioned "correctly" amongst the moderate categories in the initial best planar view of the data, inspection of further dimensions shows them to be associated among one another, and separated from their expected positions between the moderate categories. Again, we have found that this phenomenon persists even when response sets (all middles) are removed.

4. A middle response on one question is not generally associated with non-response on other questions. It seems that, if the middle response is used as a satisficing alternative to a non-response, there are some respondents that generally give just middle responses while there are others that give just non-responses.

5. Canonical MCA can be used to isolate a single dimension corresponding to the middle responses, similarly for the missing responses (or whatever responses the researcher is interested in). The positions of the respondents on these dimensions can be averaged within demographic groups to investigate their possible dispersions on these dimensions.

6. Subset MCA can be used to study the middle responses in more detail. As many dimensions as there are middle responses are analysed, so that dimension reduction is necessary to create a map. Generally, the first dimension in this analysis corresponds to the single constraining variable of "middleness" in the canonical MCA, so that the following dimensions reveal the more detailed patterns in middle response.

7. The same approach can be used to investigate patterns of any particular response category or categories. For example, the dimensions of the set of extreme response categories (1's and 5's) could be studied on their own and related to the demographic characteristics.

Estudio de caso 2: Situación de las categorias "intermedias" en una encuesta de investigación social

Resumen Capítulo 14

1. Hemos visto cómo el análisis de correspondencias multiple, sus subconjuntos y variantes canónicas, permiten una investigación detallada de los patrones de respuesta de un gran conjunto de datos de una encuesta social. Resultados de estudios similares con datos de encuestas de este tipo, del ISSP y del Eurobarómetro, nos han permitido observar algunos resultados típicos:

2. En el análisis de las respuestas individuales predominan las no-respuesta, en parte debido a la falta de respuestas de muchos encuestados, lo que dilata las asociaciones entre las categorías de no-respuesta, incluso cuando eliminamos tales conjuntos de respuestas.

3. A pesar de que las categorías intermedias podrían parecer estar situadas «correctamente» entre las categorías moderadas en la mejor proyección bidimensional de los datos, la inspección detallada de las restantes dimensiones muestra que éstas están asocidas entre sí, y situadas lejos de las posiciones esperadas para las categorías moderadas. Hemos observado que este fenómeno persiste incluso cuando eliminamos todas las respuestas intermedias.

4. En general, no asociamos una respuesta intermedia con una no-respuesta. Sin embargo, parece como si las respuestas intermedias fueran una alternativa a no responder. Hay encuestados que tienden a dar sólo respuestas intermedias, mientras que otros tienden a no responder.

5. Podemos utilizar el ACM canónico para separar la dimensión correspondiente a las respuestas intermedias. De forma similar lo podríamos utilizar para las no-respuestas (o para cualquier tipo de respuesta en la que pudiéramos estar interesados). Dentro de cada grupo demográfico podemos promediar las posiciones de los encuestados en estas dimensiones para investigar su posible dispersión en tales dimensiones.

6. Podemos utilizar el ACM de subgrupos para estudiar las respuestas intermedias con más detalle. Puesto que analizamos tantas dimensiones como respuestas intermedias, necesitamos reducir la dimensionalidad para crear un mapa. En general, en el ACM canónico la primera dimensión corresponde a los resultados «intermedios», de manera que en las siguientes dimensiones podemos observar comportamientos más detallados de las respuestas intermedias.

7. Podemos utilizar la misma aproximación para investigar los comportamientos de cualquier categoría o categorías de respuesta. Por ejemplo, las dimensiones de las respuestas correspondientes a las categorías extremas (1s y 5s) podrían ser analizadas por separado y relacionadas con características demográficas.