Fundación BBVA

Multivariate Statistics

Multiple Correspondence Analysis Biplots I

Summary

1. A concatenated table is a block matrix composed of several contingency tables cross-tabulating the same sample of cases between two sets of variables. If there are L variables in the first set and Q in the second set, then there are LxQ subtables constituting the concatenated table, and each subtable has the same grand total, equal to the sample size.

2. The CA of a concatenated table is an average picture of the pairwise relationships between the two sets of variables. Its inertia is the average of the inertia of the subtables and the graphical display is the best approximation to all the subtables. One can think of this analysis as a compromise among all possible simple CAs of the subtables, using only one set category points for each row and column variable.

3. The asymmetric biplot of a concatenated table usually shows the set of points in principal coordinates close to the origin and far from the other set in standard coordinates, in which case a separate plot of the "inner" set of points is required.

4. Each category in principal coordinates, say a row category, is the average of a mini-cloud of points, one point for each of the column variables. It is useful to measure the dispersion within each of these mini-clouds because this gives information about the variance of the category across the column variables.

5. The contribution biplot of a concatenated table displays one set of points in principal coordinates to show their interpoint distances, and the other points in standard coordinates multiplied by the square root of the respective masses (these are the usual masses that sum to 1 across all the variables). The latter set of points then indicates how they contribute to the construction of the axes of the representation space.

6. A supplementary point is an additional row or column of data with a profile that is displayed afterwards by projection onto the biplot. One can think of this row or column being in the analysis from the start but with zero mass assigned to it, hence having no influence on the solution.

Biplots de análisis de correspondencias múltiple I

Resumen Capítulo 9

1. Una tabla concadenada es una matriz de bloques compuesta de varias tablas de contingencia, obtenidas cruzando la misma muestra de casos en relación a dos conjuntos de variables. Si tenemos L variables en el primero y Q variables en el segundo, la tabla concadenada estará constituida por LxQ subtablas . Cada una de ellas tiene la misma suma total, igual al tamaño de la muestra.

2. El AC de una tabla concadenada nos da una idea de todas las relaciones dos a dos existentes entre los dos conjuntos de variables. Su inercia es la inercia media de las subtablas. Su representación gráfica es la mejor aproximación a todas las subtablas. Podemos entender este análisis como un compromiso entre todos los posibles AC simples de las subtablas, utilizando un solo conjunto de categorías para cada variable fila y columna.

3. En general, los biplots asimétricos de una tabla concadenada muestran los puntos en coordenadas principales cerca del origen y lejos del otro conjunto en coordenadas estándar, en cuyo caso necesitamos una representación gráfica adicional para los puntos «interiores».

4. Cada categoría en coordenadas principales, por ejemplo las filas, es la media de una mininube de puntos, un punto para cada variable columna. Es útil medir la dispersión dentro de cada una de estas mininubes, ya que nos da información sobre la varianza de la categoría en relación a las distintas variables.

5. En los biplots de contribuciones de tablas concadenadas, representamos un conjunto de puntos en coordenadas principales, para mostrar las distancias entre puntos, y el otro conjunto en coordenadas estándar multiplicadas por las raíces cuadradas de sus respectivas masas (son masas cuya suma total es igual a 1). Las coordenadas de este segundo conjunto de puntos indican la contribución de los puntos a la construcción de los ejes del espacio de representación.

6. Los puntos adicionales son filas o columnas adicionales que proyectamos posteriormente en el biplot. Podemos imaginar a estas filas o columnas, como si ya estuvieran incluidos el análisis desde el principio pero con masa cero, por lo que no influyen sobre el resultado obtenido.

[back]