• Aucun résultat trouvé

SEGUNDA PARTE: MODELO DE ANÁLISIS, HIPÓTESIS Y ESTRATEGIA METODOLÓGICA

5. Modelo de análisis e hipótesis de investigación 1 Antecedentes 1Antecedentes

5.5 Descripción de las técnicas estadísticas utilizadas

5.5.1 La “tipología estructural y articulada”

5.5.1.2 Análisis de clasificación automática

El Análisis de Clasificación (ACL) se concibe como una forma de obtener una clasificación de unidades estadísticas que están dispuestas en una forma matricial.

Mediante esta técnica es posible la obtención de grupos homogéneos sin que exista la necesidad de condicionar previamente el análisis y en este sentido se trata de un

instrumento con carácter fundamentalmente descriptivo y exploratorio (López-Roldán, 1994). Sin embargo, el ACL permite también la prueba de hipótesis que proviene de un trabajo teórico, de manera independiente o en combinación con otras técnicas de análisis de datos.

Desde el punto de vista técnico, la aplicación de la técnica busca la obtención de unidades (tipos, grupos, clases) lo más homogéneas posibles al interior de las mismas y lo más heterogéneas posibles entre ellas. Según lo sugieren López-Roldán y Lozares (2000), en el ACL se deben seguir las siguientes etapas:

1. Selección de las variables.

2. Elección de la medida de proximidad.

3. Construcción de la matriz de distancias.

4. Elección del método de clasificación.

5. Clasificación de las unidades en un número de clases que debe ser fijado.

6. Validación de los resultados.

Una vez que se han tomado las decisiones pertinentes, el ACL opera través de la aplicación de algoritmos que pueden ser de dos tipos: “monotéticos” o “politéticos”

(Lozares, 1990). En los métodos monotéticos se realizan particiones en la matriz de datos, comenzando por una división en dos clases pero teniendo en cuenta una sola variable cada vez, es decir, que en cada etapa se introducen variables diferentes, además de que no existen hipótesis previas de factores explicativos. En los métodos politéticos todas las variables que forman parte del análisis entran en juego simultáneamente. Entre los principales algoritmos que se utilizan destacan dos: las técnicas de centroides o de agregación de particiones sucesivas (principalmente técnicas de centro móvil) y las técnicas jerárquicas, que pueden ser descendentes o ascendentes.

En esta tesis se optó por la utilización de un “método mixto”, que integra los dos logaritmos de los métodos politéticos mencionados anteriormente. Este método es propuesto por Lebart et al. (2004) para conjuntos de millares o decenas de millares de casos83.

83 El software estadístico SPAD (“Sistema Portable pour l‟Analyse de Données”) desarrollado por Lebart y Morineau, permite la implementación de este algoritmo mixto.

Según dichos autores, las técnicas de agregación alrededor de centros móviles permiten obtener una partición sobre un conjunto amplio de datos, pero tienen el inconveniente de producir particiones que dependen de los primeros centros elegidos, lo cual de alguna manera puede predisponer el número el número de grupos. Por el contrario, la clasificación jerárquica, constituye una familia de algoritmos que se pueden considerar

“deterministas” (porque dan siempre los mismos resultados a partir de los mismos datos). Además, si bien las técnicas jerárquicas pueden indicar el número de grupos a conservar, no se adaptan adecuadamente a grandes conjuntos de datos.

Las etapas de la aplicación del algoritmo mixto son las siguientes (Fachelli, 2009, pp.

243–244):

1. El conjunto de datos se clasifica en partición inicial mediante centros móviles, con la finalidad de obtener algunas decenas o centenas de grupos homogéneos.

2. Se procede enseguida a una agregación jerárquica ascendente de los grupos, donde el “dendograma” (o árbol de clasificación) sugerirá eventualmente el número de grupos finales a retener. El árbol se construye mediante el criterio de Ward84.

3. Se vuelve a utilizar la técnica de centros móviles para optimizar los resultados de la partición precedente. La partición final se define por el corte del árbol de clasificación y es posible optimizar la homogeneidad de las clases por medio de reafectaciones a las clases formadas.

La elección final del número de grupos que se conservarán como resultado de la investigación depende de dos tipos de criterios: estadísticos y del investigador. En primer lugar, por lo que hace los criterios estadísticos la elección del nivel del corte, así como del número de grupos de la partición, puede ser facilitado por una inspección visual del árbol: el corte debe ser hecho después de la agregación correspondiente a los valores más elevados del índice, que reagrupan los elementos más cercanos unos de los otros. De una manera general, mientras más se agregan los elementos, es decir, mientras

84 El criterio de Ward o de “mínima perdida de inercia” utiliza como medida de proximidad la distancia euclidiana. El método agrega progresivamente y de manera ascendente las unidades de análisis, de manera que en cada etapa se incorporan los individuos que suponen una mínima pérdida de inercia entre grupos.

más uno se acerca a la cima del árbol, la distancia entre las dos clases más cercanas es más grande y el índice del nivel es más elevado. Cortando el árbol al nivel de un “salto”

importante de este índice, se puede esperar obtener una partición de buena calidad, porque los individuos reagrupados anteriormente eran cercanos, y los reagrupados después del corte están necesariamente alejados.

Sin embargo, es importante tomar en cuenta que los criterios estadísticos no responden necesariamente a los objetivos de la investigación, particularmente en este punto de la determinación del número de grupos finales a conservar en el ACL. Por ello, es imprescindible que el investigador conserve las clases que pueden ser interpretadas en función al objeto de estudio y al planteamiento teórico de la investigación.