El análisis de clusters es la organización de los datos en grupos con características similares.
Crear clústeres
La agrupación de análisis es un método de examen de los datos mediante la asignación de los datos a los grupos anteriormente definidos. El número de miembros de cada grupo se basa en la similitud de las características. Cada miembro de un grupo debe tener más en común con los demás miembros del mismo grupo que con los miembros de otros grupos. Las variables mediante la cual se ordena la información puede ser numérico, binario, categórico, o de cualquier otro tipo. ¿Cómo se clasifican los datos pueden ser ligeramente diferentes para los diferentes tipos de variables.
Lo que necesita
Calculadora Suggest Edits datos numéricos
Organizar los datos. Utilice un histograma si sólo una variable está involucrado, o graficar los puntos en un plano de coordenadas, si se trata de dos variables. Si los datos contienen más de dos variables, organizarla en tablas o matrices.
Divida el número de elementos de datos por el número de deseados agrupaciones para obtener el promedio de número de miembros por grupo.
Grupo de los datos en grupos que contienen el promedio de número de miembros. Si existe un resto, distribuir cada punto de datos a un clúster diferente restante, de forma que ninguna agrupación supera cualquier otro de tamaño en más de uno.
Encontrar el centroide de cada grupo sumando los valores de cada miembro y dividiendo por el número de miembros del clúster. Esto le dará el valor medio de la agrupación.
Encontrar la distancia de cada miembro de cada grupo a partir de su centro de gravedad. Si cualquiera de los puntos de datos están más cerca del centro de gravedad de otro grupo, a continuación, pasar a la otra agrupación.
Cuente el número de puntos en cada grupo. Si los clústeres contienen más que el número promedio, mover el exceso de los miembros más alejado del centroide para el clúster vecina más cercana a ellos.
Repita los pasos del cuatro al seis, hasta que no se necesitan más redistribución.
Binarias o categóricas de datos
Busque el número de miembros por grupo que desee dividiendo el número total de elementos de datos por el número deseado de grupos.
Ponga el número apropiado de elementos de datos en grupos que tengan características similares.
Encontrar el valor más común (modal) para cada variable para los datos dentro de cada grupo. El centroide de la agrupación tendrá el valor más común para cada variable.
Divida el número de variables de cada elemento tiene en común con el centroide, por el número total de variables. Esta relación muestra el grado en el que el punto de datos se parece a el resto de la agrupación
Mover los puntos de datos que tienen relaciones variables de menos de 0,5 a otro grupo con una mayor similitud a ese punto. Redistribuir los puntos que se necesitan para mantener igual tamaño de los clusters. Repita los pasos tres a cinco años hasta que no se necesitan nuevas medidas.
No hay comentarios:
Publicar un comentario