El Proceso de Agrupamiento K

ASIGNATURA:
Aprendizaje
PROYECTO FINAL
Aplicacin en datos de sismos a nivel nacional
Introduccin.Un terremoto (del latn: terra tierra y motus movimiento), tambin llamado sesmo o sismo (del griego : temblor o temblor
de tierra) es un fenmeno de sacudida brusca y pasajera de la corteza terrestre producido por la liberacin de energa acumulada en forma
de ondas ssmicas. Los ms comunes se producen por la ruptura de fallas geolgicas. Tambin pueden ocurrir por otras causas como, por
ejemplo, friccin en el borde de placas tectnicas, procesos volcnicos o incluso ser producidos por el hombre al realizar pruebas de
detonaciones nucleares subterrneas.
El punto de origen de un terremoto se denomina hipocentro. El epicentro es el punto de la superficie terrestre directamente sobre el
hipocentro. Dependiendo de su intensidad y origen, un terremoto puede causar desplazamientos de la corteza terrestre, corrimientos de
tierras, tsunamis o actividad volcnica. Para la medicin de la energa liberada por un terremoto se emplean diversas escalas entre las que
la escala de Richter es la ms conocida y utilizada en los medios de comunicacin.
K -means es un mtodo de agrupamiento, que tiene como objetivo la [particin [de un conjunto]] n observaciones en k grupos en el que cada
observacin pertenece al grupo ms cercano a la media. Es un mtodo utilizado en mineria de datos.
La agrupacin del conjunto de datos puede ilustrarse en una particin del espacio de datos en celdas de Voronoi.
El problema es computacionalmente difcil (NP-hard). Sin embargo, hay eficientes heursticas que se emplean comnmente y convergen
rpidamente a un ptimo local. Estos suelen ser similares a los algoritmos expectation-maximization de mezclas de distribuciones
gausianas por medio de un enfoque de refinamiento iterativo empleado por ambos algoritmos. Adems, los dos algoritmos usan los centros
que los grupos utilizan para modelar los datos, sin embargo k-means tiende a encontrar grupos de extensin espacial comparable, mientras
que el mecanismo expectation-maximization permite que los grupos que tengan formas diferentes.
Descripcin
Dado un conjunto de observaciones (x1, x2, , xn), donde cada observacin es un vector real de d dimensiones, k-means construye una
particin de las observaciones en kconjuntos (k = n) S = {S1, S2, , Sk}
a fin de minimizar la suma de los cuadrados dentro de cada grupo (WCSS):
donde i es la media de puntos en Si.
Desarrollo:-
El proceso de agrupamiento k-medias es simple, Inicialmente se determina el nmero de grupos K y se asume el centroide o centro de esos
grupos. Para determinar los centroides hay dos alternativas practicas: la primera es tomar de forma aleatoria K objetos como centroides
iniciales y la segunda es tomar los primeros K objetos en secuencia.
Luego el algoritmo ejecuta los siguientes tres pasos hasta que alcance el criterio de convergencia, es decir que los objetos no se muevan de
grupo.
1.-Se determina el o los centroides iniciales de acuerdo al nmero de cluster esperado.

2.-Se determina la distancia de cada objeto con relacin a los centroides.
3.-Se agrupan los objetos con base en la distancia mnima.
Los puntos capturados.
En el ejemplo se realizaron las siguientes iteraciones.
Paso 1.los centroides elegidos son:

Iteracin K=1
Z1(1) = X1 (1,3.3)
Z2(1) = X18 (10,6.4)
Datos de la primer iteracin.
Paso 2.-Calculando las distancias de cada punto a cada una de las clases existentes.
w1(1)={x1,x2,x3,x4,..x9} N1= 9
w1(1)={x10,x11,x12,x13,..x20} N1= 11
grafica obtenida.-
Tercera iteracin.-
Cuarta iteracin.-
x=(3.1) x(8.4)
(3.8) (3.9)
como no son los mismos

Agrupando los terminos tenemos que
w1(1)={x1,x2,x3,x4,..x9,x10,x11} N1= 11
w1(1)={x12,x13,..x20} N1= 9
como:
Z1(3)=z1(4) y
z2(3)=z2(4)
se encuentra la estabilidad en el algoritmo
FIN
Aplicaciones:
Agrupamiento k-means cuando se usan heursticas como el algoritmo de Lloyd es fcil de implementar
incluso para largos conjuntos de datos. Por lo que ha sido ampliamente usado en muchas reas
como segmentacin de mercados, visin por computadoras, geoestadstica, and astronomy to [[Data Mining
in Agriculture| agriculture]]. Tambin se usa como preprocesamiento para otros algoritmos, por ejemplo
para buscar una configuracin inicial.
Referencias.http://profesores.fi-b.unam.mx/ana/APUNTES_RP/Capitulo3.pdf
http://www2.ssn.unam.mx:8080/website/jsp/Cuaderno1/ch3.html#DETERMINACION
http://people.revoledu.com/kardi/tutorial/kMean/EjemploNumerico.htm
http://es.wikipedia.org/wiki/K-means

El Proceso de Agrupamiento K

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

El Proceso de Agrupamiento K

Загружено:

Авторское право:

Доступные форматы

ASIGNATURA:

donde i es la media de puntos en Si.

1.-Se determina el o los centroides iniciales de acuerdo al nmero de cluster esperado.

En el ejemplo se realizaron las siguientes iteraciones.

Paso 1.los centroides elegidos son:

como no son los mismos

Вам также может понравиться