La agrupación de datos es un método por el
cual grandes conjuntos de datos se agrupan en
racimos de pequeños conjuntos de datos similares.
QUE ES LA AGRUPACION
También
se llama clasificación no supervisada de aprendizaje, a
veces llamada por los estadísticos y la
clasificación por los psicólogos y la
segmentación por la gente en la comercialización.
Organizar los
datos en clases de tal manera que no hay Similitud alta dentro
de la clase baja similitud entre clases
y encontrar las etiquetas de clase y el número de clases directamente
de los datos (a diferencia de la clasificación).
Manera más informal, la búsqueda de agrupaciones naturales entre los objetos.
ALGORITHM K-MEANS
1. Decidir sobre un valor de k.
2. Inicializar los centros de cluster k (al azar, si es necesario).
3. Decidir la pertenencia de clase de los objetos N asignándoles a un centro de clúster.
4. Volver a estimar los centros de cluster k, asumiendo las pertenencias que se encuentran aquí presentados son correctos.
5. Si ninguno de los objetos N cambiado la pertenencia a la última iteración, la salida.De lo contrario Ir a 3.
2. Inicializar los centros de cluster k (al azar, si es necesario).
3. Decidir la pertenencia de clase de los objetos N asignándoles a un centro de clúster.
4. Volver a estimar los centros de cluster k, asumiendo las pertenencias que se encuentran aquí presentados son correctos.
5. Si ninguno de los objetos N cambiado la pertenencia a la última iteración, la salida.De lo contrario Ir a 3.
No hay comentarios:
Publicar un comentario