Академический Документы
Профессиональный Документы
Культура Документы
REPOSITORIO DE LA UCI
Nmero de
Regresin, Valores
Tareas asociadas: N/A Web 11743
Clustering perdidos?
Accesos:
Fuente:
Manohar Kaul, Departamento de Ciencias de la Computacin de la Universidad de Aarhus,
Dinamarca ( mkaul '@' cs.au.dk )
Atributo de la informacin:
1. OSM_ID: ID OpenStreetMap para cada segmento de carretera o borde en el grfico.
2. LONGITUD: Web Mercaptor (formato de Google) de longitud
3. LATITUD: Web Mercaptor (formato de Google) latitud
4. ALTITUD:. Altura en metros Nota: OSM_ID es el identificador asignado por OpenStreetMaps
( [Web de enlace] ) para los segmentos de carretera. Cada (largo, lat, altitud) apuntan en un
segmento de carretera (con ID nico OSM) se ordena en el mismo orden en que aparecen en el
camino. As que una polilnea 3D se puede dibujar uniendo los puntos de cada fila para cada
segmento de carretera OSM_ID.
Documentos pertinentes:
[1] Chenjuan Guo Yu Ma, Bin Yang, Christian S. Jensen, Manohar Kaul: EcoMark: evaluacin de
modelos de impacto ambiental vehicular. SIGSPATIAL / GIS 2012: 269-278
Cita de pedidos:
El uso de este conjunto de datos en las publicaciones debe ser reconocido por referencia a la
siguiente publicacin: Construyendo Redes espaciales precisos en 3D para permitir a la prxima
generacin de sistemas de transporte inteligentes (Aceptado y que se publicar en junio) Actas de
la Conferencia Internacional sobre la Gestin de Datos Mviles (IEEE MDM), junio 3-6 de 2013,
Miln, Italia
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 213047
perdidos?
Accesos:
Fuente:
Los datos provienen de un estudio original (no-mquina-learning):
Warwick J Nash, Tracy L Sellers, Simon R Talbot, Andrew J Cawthorn y Wes B Ford (1994)
. "La Biologa de Poblacin de Abuln (especie _Haliotis_) en Tasmania I . Blacklip Abuln (rubra_
_H.) de la Costa Norte y las Islas del Estrecho de Bass ",
Divisin de Pesca Martima, el Informe Tcnico N 48 (ISSN 1034-3288) Los propietarios
originales de base de datos: Recursos Marinos Divisin Marine Research Laboratories -
Taroona Departamento de Primaria Industria y Pesca, Tasmania GPO Box 619F, Hobart, Tasmania
7001, Australia (contacto: Warwick Nash +61 02 277277, wnash '@' dpi.tas.gov.au ) Donantes de
base de datos: Sam Waugh ( Sam.Waugh '@' cs.utas.edu.au )Departamento de Ciencias de la
Computacin de la Universidad de Tasmania GPO Box 252C, Hobart, Tasmania 7001, Australia
Documentos pertinentes:
Sam Waugh (1995) "La extensin y la evaluacin comparativa de Cascade-Correlacin", tesis de
doctorado, Departamento de Informtica de la Universidad de Tasmania. [Web Link] David Clark,
Zoltan Schreter, Anthony Adams "Comparacin cuantitativa de Dystal y backpropagation",
presentado a la Conferencia australiana sobre Redes Neuronales (ACNN'96).
cido abscsico sealizacin del conjunto de datos de red
Resumen : El objetivo es determinar el conjunto de reglas booleanas que describen las
interacciones de los nodos de esta red de sealizacin de la planta. El conjunto de datos incluye
300 simulaciones pseudodynamic booleanas separadas utilizando un esquema de actualizacin
asncrona.
Fuente:
Jerry W. Jenkins, Ph.D.
Biologa de Sistemas y Bioinformations Group
CFD Research Corporation
215 Wynn Drive
Huntsville, AL 35805
email: TcJ '@' cfdrc.com
Multivariante,
Conjunto de datos Nmero de
Secuencial, 2747 rea: Ordenador
Caractersticas: instancias:
Time-Series
Nmero de
Clasificacin, Valores
Tareas asociadas: N/A Web 9497
Clustering perdidos?
Accesos:
Fuente:
Francisco Javier Orda ez, Universidad Carlos III de Madrid, fordonez '@' inf.uc3m.es
Documentos pertinentes:
N/A
Cita de pedidos:
Orda ez, FJ; de Toledo, P.; Sanchis, A. Actividad Reconocimiento Usando hbridos
generativos / Modelos discriminativas en Inicio entornos utilizando binarios Sensores. Sensores de
2013, 13, 5460 a 5477
Actividad Reconocimiento de Single Chest-Mounted Acelermetro Data
Set
Resumen : El conjunto de datos recoge datos a partir de un acelermetro porttil montado en el
pecho. El conjunto de datos est prevista para fines de investigacin de reconocimiento de la
actividad.
Univariante, N
Conjunto de datos Nmero de
Secuencial, Time- / rea: N/A
Caractersticas: instancias:
Series A
N
Caractersticas del Nmero de Fecha
Real / 02/03/2014
atributo: atributos: Donado
A
N Nmero de
Clasificacin, Valores
Tareas asociadas: / Web 593
Clustering perdidos?
A Accesos:
Fuente:
Sin calibrar datos del acelermetro se recogen de 15 Participantes que realizan 7 actividades. El
conjunto de datos proporciona desafos para la identificacin y autenticacin de personas que
utilizan los patrones de movimiento.
Documentos pertinentes:
--- Casale, P. Pujol, O. y Radeva, P.
'BeaStreamer-v0.1: una nueva plataforma para mltiples sensores de adquisicin de datos en
aplicaciones Wearable Computing',
CVCRD09, ISBN: 978-84-937261-1 - 9, 2009
disponible en [Web Link]
Cita de pedidos:
Casale, P. Pujol, O. y Radeva, P.
"La personalizacin y verificacin del usuario en sistemas porttiles que utilizan los patrones de
caminar biomtricos '
Personal y Computacin Ubicua, 16 (5), 563-580, 2012
Conjunto de datos inflamaciones agudas
Resumen : Los datos fue creada por un experto mdico como un conjunto de datos para poner a
prueba el sistema experto, que llevar a cabo el diagnstico presuntivo de dos enfermedades del
sistema urinario.
Valores Nmero de
Tareas asociadas: Clasificacin No 49522
perdidos? Web Accesos:
Fuente:
Jacek Czerniak, Ph.D., profesor adjunto
del Instituto de Investigacin de Sistemas
de la Academia Polaca de Ciencias
Laboratorio de Sistemas Inteligentes
ul. Newelska 6, Room 218
01-447 Warszawa, Polonia
e-mail: jacek.czerniak '@' ibspan.waw.pl o jczerniak '@' ukw.edu.pl
Atributo de la informacin:
a1 Temperatura del paciente {35C-42C}
a2 La aparicin de nuseas {s, no}
a3 dolor lumbar {s, no}
a4 orina empuje (continua necesidad de orinar) {s, no}
miccin a5 dolores {s, no}
a6 Ardientes de uretra, picor, hinchazn de la salida de la uretra {s, no}
decisin d1: Inflamacin de la vejiga urinaria {s, no}
decisin d2: Nefritis de origen pelvis renal {s, no}
Documentos pertinentes:
J.Czerniak, H.Zarzycki, Aplicacin de los conjuntos aproximados en el diagnstico presuntivo de
las enfermedades del sistema urinario,
Artificial Inteligence y Seguridad en Sistemas de Informtica, ACS'2002 noveno actas de congresos
internacionales,
Kluwer Academic Publishers, 2003, pp 41-51
Cita de pedidos:
Para citar este artculo: J.Czerniak, H.Zarzycki, Aplicacin de los conjuntos aproximados en el
diagnstico presuntivo de las enfermedades del sistema urinario, Artificial Inteligence y Seguridad
en Sistemas de Informtica, ACS'2002 noveno Actas del Congreso Internacional, Kluwer Academic
Publishers, 2003, pp 41 - 51
Adultos Data Set
Resumen : Predecir si el ingreso es superior a $ 50K/yr basado en los datos del censo. Tambin
conocido como conjunto de datos "Resultado del Censo".
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 383122
perdidos?
Accesos:
Fuente:
Donante: Ronny Kohavi y Barry Becker de minera de datos y visualizacin . Silicon Graphics e-
mail: ronnyk '@' live.com para preguntas.
Datos Conjunto de Informacin:
La extraccin se realiza por Barry Becker, de la base de datos del Censo de 1994. Un conjunto de
registros razonablemente limpias fue extrado por medio de las siguientes condiciones: ((AAGE>
16) && (AGI> 100) && (AFNLWGT> 1) && (HRSWK> 0)) Prediccin tarea es determinar si una
persona hace ms de 50 mil al aos.
Atributo de la informacin:
Listado de atributos: .> 50K, <= 50K edad:. continua workclass: Privada, Auto-emp-no-inc, Auto-
emp-inc, Federal-gov, Local-gov, Estado-gov, sin sueldo, nunca .-trabajado fnlwgt:
continuo. Diploma, Some-universidad, 11, HS-graduado, el profesor de la escuela, Assoc-ACDM,
Assoc-voc, 9, 7 -8 , 12 , Masters, primera a cuarta, dcima, Doctorado ., 5to-6to,
Preschool educacin-num:. continuo civil-Estado civil: Casado-civ-cnyuge, Divorciado, Nunca se
ha casado-, Separado, Viudo, Casado-cnyuge ausente, Casado-AF-cnyuge. ocupacin: Tech-
apoyo , para naves de reparacin, y de servicio, ventas,, Prof-especialidad, Manipuladores
limpiadores Exec-gerenciales, Machine-op-Inspct, Adm-clerical, Agricultura pesca, de transporte y
de movimiento, Priv-casa-serv, protector-serv , Fuerzas Armadas-. relacin: Esposa, propia e hijos,
marido, no-en-familia,-Otro pariente, soltera. raza: blanca, de Asia y el Pac-Islander, Amer-Indian-
esquimal, Otros, Negro. Sexo: Mujer ., Hombre de capital-ganancia:. continua prdida de capital:.
continua hora-por-semana:. continua nativo-Pas: Estados Unidos-, Camboya, Inglaterra, Puerto-
Rico, Canad, Alemania, Outlying-US (Guam-Islas Vrgenes -etc), India, Japn, Grecia, Sur, China,
Cuba, Irn, Honduras, Filipinas, Italia, Polonia, Jamaica, Vietnam, Mxico, Portugal, Irlanda,
Francia, Repblica Dominicana-, Laos, Ecuador, Taiwn, Hait, Columbia, Hungra, Guatemala,
Nicaragua, Escocia, Tailandia, Yugoslavia, El-Salvador, Trinadad y Tobago, Per, Hong, Holand-
Pases Bajos.
Documentos pertinentes:
Ron Kohavi, "Ampliar los efectivos Precisin de Naive-Bayes clasificadores: un hbrido de rbol de
decisiones", Actas de la Segunda Conferencia Internacional de Descubrimiento de Conocimiento y
Minera de Datos, 1996 [Web Link]
Nmero de
Valores
Tareas asociadas: Regresin N/A Web 970
perdidos?
Accesos:
Fuente:
Proporcionar los nombres, direcciones de correo electrnico, instituciones y otros datos de contacto
de los donantes y los creadores de la serie de datos.
Donante:
Dr. Roberto Lpez robertolopez '@' intelnics.com Intelnics Creadores: Thomas F. Brooks, D. Stuart
Papa y Michael A . Marcolini NASA
Atributo de la informacin:
Este problema tiene las siguientes entradas:
1. Frecuencia, en hertzs.
2. El ngulo de ataque, en grados.
3. Longitud de la cuerda, en metros.
4. Velocidad gratuito-stream, en metros por segundo.
5. . Espesor de desplazamiento lateral de aspiracin, en metros La nica salida es: 6. Scaled nivel
de presin acstica, en decibelios.
Documentos pertinentes:
TF Brooks, DS Papa, y AM Marcolini.
Airfoil ruido propio y prediccin.
Memoria tcnica, la NASA RP-1218, julio de 1989. K. Lau. A neural enfoque de redes para la
prediccin del ruido aerodinmico. tesis s ster, Departamento de Aeronutica. Colegio Imperial
de Ciencia, Tecnologa y Medicina (Londres, Reino Unido), 2006. R. Lpez. Redes Neuronales
para los problemas variacionales en Ingeniera. Tesis doctoral, Universidad Politcnica de
Catalua, 2008.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Muestras Amazon Access Data Set
Resumen : InfoSec de Amazon se vuelven ms inteligentes acerca de la forma de datos de
Access est apalancada. Esta es una muestra annima de acceso provisionado en la empresa.
Regresin,
Nmero de
Clustering, Valores
Tareas asociadas: N/A Web 68969
causal- perdidos?
Accesos:
Discovery
Fuente:
Creador de conjunto de datos y donante: Ken Montaez email: kenmonta [at] cal.berkeley.edu
institucin: Seguridad de la Informacin, Amazon Corp.
Atributo de la informacin:
_amzn-anon-access-muestras-2.0.csv__
trata de un conjunto de datos dispersos que contiene los usuarios y su acceso asignado. El archivo
contiene 4 categoras de atributos.
1) [PERSON_ {ATRIBUTO}] Esta categora describe el "usuario" que se le dio acceso. El
[PERSON_ID] columna es la columna de clave principal para el archivo. Hay una fila por cada
usuario.
PERSON_ID: id del usuario
PERSON_MGR_ID: Identificacin de administrador del usuario
PERSON_ROLLUP_1: agrupacin de usuarios Identificacin
PERSON_ROLLUP_2: agrupacin de usuarios Identificacin
PERSON_ROLLUP_3: agrupacin de usuarios Identificacin
PERSON_DEPTNAME: desciption departamento Identificacin
PERSON_LOCATION: ID de la regin
PERSON_BUSINESS_TITLE: ttulo de id
PERSON_BUSINESS_TITLE_DETAIL: Descripcin Identificacin
PERSON_JOB_CODE: Cdigo de Identificacin del Aviso
Identificacin compaa: PERSON_COMPANY
PERSON_JOB_FAMILY: id familia de puestos 2) [RESOURCE_ {ID}] Esta categora de atributos
son los recursos que un usuario puede posiblemente tener acceso. Un usuario tendr un 1 en esta
columna si el acceso a ella de lo contrario ser 0. 3) [GROUP_ {ID}] - Esta categora de atributos
son los grupos que un usuario puede posiblemente tener acceso. Un usuario tendr un 1 en esta
columna si el acceso a ella de lo contrario ser 0. 4) [SYSTEM_SUPPORT_ {ID}] - Esta categora
de atributos son el sistema que un usuario puede posiblemente apoyar. Un usuario tendr un 1 en
esta columna si el haber posiblemente puede ser que lo apoyan, de lo contrario ser 0. __amzn-
anon-access-muestras-historia-2.0.csv__ datos de series de tiempo Permisos. He aqu una breve
descripcin de las columnas: ACCIN: o 'remove_access' o 'add_access' target_name: o bien el
id_recurso {} o {} group_id LOGIN: el id del usuario que va a obtener o perder el
acceso REQUEST_DATE: AAAA-MM-DD HH: MM: SS AUTHORIZATION_DATE: AAAA-MM-DD
HH: MM: SS
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor refirase a la poltica de la citacin del Aprendizaje Repositorio Machine.
Multivariante,
Conjunto de datos Nmero de
Texto, Domain- 1500 rea: Fsico
Caractersticas: instancias:
Theory
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 43780
perdidos?
Accesos:
Fuente:
Creador de conjunto de datos y donante: ZhiLiu, e-mail: liuzhi8673 '@' gmail.com , institucin:
Centro de Investigacin de Ingeniera Nacional de E-Learning de Hubei, Wuhan, China
Atributo de la informacin:
atribucin incluye 'estilo LINGSTICA, como el uso de dgitos, puntuacion, palabras y oraciones'
autores longitud y frecuencia de uso de las palabras y as sucesivamen
Documentos pertinentes:
Sanya Liu, Liu Zhi, Jianwen Sun, Lin Liu, 'Aplicacin de Synergetic red neuronal en lnea Writeprint
Identificacin', JDCTA: Revista Internacional de la tecnologa digital de contenidos y sus
Aplicaciones, vol. 5, No. 3, pp 126 ~ 135, 2011
Jianwen Sun, Zongkai Yang, Wang Pei, Sanya Liu, 'Longitud de caracteres Enfoque N-Gram
variable para Online Writeprint Identificacin,' minas, pp.486-490, Conferencia Internacional 2010
de Informacin Multimedia Networking y Seguridad, 2010
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Recocido Data Set
Resumen de datos de recocido de acero:
Valores Nmero de
Tareas asociadas: Clasificacin S 46335
perdidos? Web Accesos:
Fuente:
Donantes: David Sterling y Wray Buntine
Atributo de la informacin:
Atributo de listado:
1. familia: -, GB, GK, GS, TN, ZA, ZF, ZH, ZM, ZS
2. tipo de producto: C, H, G
3. Acero: -, R, A, U, K, M, S, W, V
4. carbono: continua
5. dureza: continua
6. temper_rolling: -, T
7. condiciones: -, S, A, X
8. conformabilidad: -, 1,2,3,4,5
9. fuerza: continua
10. no envejece: -, N
11. acabado superficial: P, M, -
12. calidad de superficie: -, D, E, F, G
13. enamelability: -, 1,2,3,4,5
14. bc: Y, -
15. bf: Y, -
16. bt: Y, -
17. pc / me: B, M, -
18. bl: Y, -
19. m: Y, -
20. chrom: C, -
21. phos: P, -
22. cbond: Y, -
23. marvi: Y, -
24. exptl: Y, -
25. ferro: Y, -
26. corr: Y, -
27. azul / brillante / varn / limpia: B, R, V, C, -
28. brillo: Y, -
29. jurofm: Y, -
30. s: Y, -
31. p: Y, -
32. forma: BOBINA, HOJA
33. de espesor: continua
34. anchura: continua
35. len: continua
36. aceite: -, Y, N
37. dimetro: 0000,0500,0600,0760
38. embalaje: -, 1,2,3
clases: 1,2,3,4,5, U - La '-' los valores son en realidad los valores de los not_applicable 'en vez de'
missing_values '(y por lo que se pueden tratar como valores legales discretas en lugar de como
muestra la ausencia de un valor discreto).
Documentos pertinentes:
N/A
Anonymous Microsoft Data Web Data Set
Resumen : Registro de usuarios annimos de www.microsoft.com; predecir las reas del sitio
web de una persona visit en base a datos de otras reas que el usuario visit.
Nmero de
Recommender- Valores
Tareas asociadas: N/A Web 46480
Systems perdidos?
Accesos:
Fuente:
Creadores: Jack S. Breese, David Heckerman, Carl M. Kadie Microsoft Research, Redmond, WA,
98052-6399,
EE.UU. breese '@' microsoft.com , heckerma '@' microsoft.com , carlk '@' microsoft.com Donantes
: Breese:, Heckerman, y Kadie
Atributo de la informacin:
Cada atributo es un rea ("vroot") del sitio web www.microsoft.com. El registro de datos que cada
usuario vroots visitado en un plazo de una semana en de Feburary de 1998.
Documentos pertinentes:
J. Breese, D. Heckerman., C. Kadie _Empirical Anlisis de Algoritmos de prediccin para la
prestacin conjunta Filtering_ Actas de la XIV Conferencia sobre la Incertidumbre en Inteligencia
Artificial, Madison, WI, julio de 1998.[Web Link] Por otra parte, se expandi como Microsoft
Investigacin Tcnica Informe MSR-TR-98-12, Los documentos estn disponibles en lnea
en: [Web Link]
Valores Nmero de
Tareas asociadas: Clasificacin N/A 47068
perdidos? Web Accesos:
Fuente:
una. Propietarios originales
Los datos se obtuvieron a partir de dos fuentes: el Instituto Nacional del Cncer (NCI) y la Escuela
de Medicina de Virginia Oriental (EVMS). Todos los datos consisten en masa espectros obtenidos
con la tcnica de SELDI. Las muestras incluyen a los pacientes con cncer (ovario o cncer de
prstata), y pacientes sanos o control. b. Donante de base de datos Esta versin de la base de
datos estaba preparado para la variable y la funcin de seleccin de referencia NIPS 2003 por
Isabelle Guyon, 955 Creston Road, Berkeley, CA 94708, EE.UU. ( isabelle '@' clopinet.com ).
Atributo de la informacin:
No proporcionamos informacin de atributos para evitar sesgar el proceso de seleccin de
caractersticas.
Documentos pertinentes:
Los mejores participantes desafo escribieron artculos recogidos en el libro:
Isabelle Guyon, Steve Gunn, Masoud Nikravesh, Lofti Zadeh (Eds.), extraccin de caractersticas,
fundamentos y aplicaciones. Los estudios en Tolerancia y Soft Computing. . Physica-Verlag,
Springer [Web Link]
Ver tambin:
Isabelle Guyon, et al, 2007. Mtodos de referencia competitivos establecen nuevas normas para la
seleccin de caractersticas de referencia NIPS 2003. Pattern Recognition Letters 28 (2007) 1438
1444?.
y el informe tcnico correspondiente:
Isabelle Guyon, et al. 2006. La seleccin de caractersticas con el paquete CLOP. Informe
Tcnico. [Web Link] .
Cita de pedidos:
Isabelle Guyon, Steve R. Gunn, Asa Ben-Hur, Gideon Dror, 2004. Anlisis de los resultados del
desafo de seleccin de caractersticas NIPS 2003. En:. NIPS [Web Link] .
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 66012
perdidos?
Accesos:
Fuente:
Los propietarios originales de base de datos: 1. H. Altay Gvenir, PhD,. Bilkent
University, Departamento de Ingeniera Informtica y Ciencias de la Informacin, 06533 Ankara,
Turqua Telfono: +90 (312) 266 4133 Email: Gvenir'@' cs.bilkent.edu.tr 2. Burak Acar,
MS, Universidad de Bilkent, EE Eng. Dept. 06533 Ankara,
Turqua Email: buraka '@' ee.bilkent.edu.tr 3. Haldun Muderrisoglu, MD, Ph.D., de la Universidad
Baskent, Facultad de MedicinaAnkara, Turqua Donante: H. Altay Gvenir Universidad
Bilkent, Departamento de Ingeniera Informtica y Ciencias de la Informacin, 06533 Ankara,
Turqua Telfono: +90 (312) 266 4133 Email: Gvenir '@' cs.bilkent.edu.tr
Atributo de la informacin:
- La documentacin completa de atributos:
1 Edad: Edad en aos, lineal
2 Sexo: El sexo (0 = hombre, 1 = mujer), nominal
3 Altura: Altura en centmetros, lineal
4 Peso: Peso en kilogramos, lineal
duracin 5 QRS: Promedio de la duracin del QRS en milisegundos, lineal.
6 Intervalo PR:. Duracin promedio entre la aparicin de las ondas P y Q en ms, lineal
7 intervalo QT:. Duracin promedio entre el inicio de Q y el desplazamiento de las ondas T en ms,
lineal
8 T intervalo: . Duracin media de la onda T en ms, lineal
9 P intervalo:. Duracin media de la onda P en ms, lineales
ngulos vectoriales en grados en plano frontal: lineales,
10 QRS
11 T
12 P
13 QRST
14 J 15 La frecuencia cardaca: Nmero latidos del corazn por minuto, lineal de DI canal: .
Anchura media, en milisegundos, de: lineal de ondas Q 16 17 onda R 18 S de la onda 19 R 'onda,
pequeo pico justo despus de R 20 S 'wave 21 Nmero de desviaciones intrnsecas, lineal 22
Existencia de onda R desigual, nominal 23 Existencia de derivacin bifsica de la onda R,
nominal 24 Existencia de onda P desigual, nominal 25 Existencia de derivacin bifsica de la onda
P, nominal 26 Existencia de la onda T desigual, nominal 27 Existencia de derivacin difsica de la
onda T, nominal de DII canal: 28 .. 39 (similar a 16 .. 27 de canal DI) de los canales de DIII: 40 ..
51 De AVR canal: 52 .. 63 de canal AVL: 64 .. 75 de canal FAV: 76 .. 87 Por V1 canal: 88 .. 99 Por
V2 canal: 100 .. 111 De V3 canal: 112 .. 123 De V4 canal: 124 .. 135 De V5 canal: 136 .. 147 De V6
canal: 148 .. 159 de DI canal: Amplitud, * 0,1 milivoltios, de 160 ola JJ, lineal de ondas Q 161,
linear onda 162 R, lineal S wave 163, lineal 164 R 'onda, lineal 165 S 'onda, lineal de ondas P 166 ,
lineal 167 de la onda T, lineal 168 QRSA, Suma de las reas de todos los segmentos divididos por
10, (rea = ancho * altura / 2), lineal 169 QRSTA = QRSA + 0,5 * ancho de la onda T * 0,1 * altura
de la onda T. (Si T es bifsica entonces se considera el segmento ms grande), lineal de DII
canal: 170 .. 179 De DIII canal: 180 .. 189 De AVR canal: 190 .. 199 de canal AVL: 200 .. 209 de
canal FAV: 210 .. 219 de V1 canal: 220 .. 229 V2 de canal: 230 .. 239 De V3 canal: 240 .. 249 De
V4 canal: 250 .. 259 De V5 canal: 260 .. 269De V6 canal: 270. . 279
Documentos pertinentes:
H. Altay Gvenir, Burak Acar, Gulsen Demiroz, Ayhan Cekin "Un algoritmo de aprendizaje
automtico supervisado para el Anlisis de Arritmia". Actas de los Ordenadores en Cardiologa
Conferencia, Lund, Suecia, 1997. [Web Enlace]
Personajes Artificiales Conjunto de Datos
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 69424
perdidos?
Accesos:
Fuente:
Los propietarios originales de base de datos: 1. H. Altay Gvenir, PhD,. Bilkent
University, Departamento de Ingeniera Informtica y Ciencias de la Informacin, 06533 Ankara,
Turqua Telfono: +90 (312) 266 4133 Email: Gvenir'@' cs.bilkent.edu.tr 2. Burak Acar,
MS, Universidad de Bilkent, EE Eng. Dept. 06533 Ankara,
Turqua Email: buraka '@' ee.bilkent.edu.tr 3. Haldun Muderrisoglu, MD, Ph.D., de la Universidad
Baskent, Facultad de MedicinaAnkara, Turqua Donante: H. Altay Gvenir Universidad
Bilkent, Departamento de Ingeniera Informtica y Ciencias de la Informacin, 06533 Ankara,
Turqua Telfono: +90 (312) 266 4133 Email: Gvenir '@' cs.bilkent.edu.tr
Atributo de la informacin:
TIPO: el primer atributo describe el tipo de segmento y se establece siempre en la "lnea"
cadena. Su tipo de lenguaje C es de tipo char. XX1, YY1, XX2, YY2: estos atributos contienen las
coordenadas iniciales y finales de un segmento en un plano cartesiano. Su tipo de lenguaje C es
int. TAMAO: esta es la longitud de un segmento, calculado utilizando la distancia geomtrica
entre dos puntos A (X1, Y1) y B (X2, Y2). Su tipo de lenguaje C es flotador. DIAG: esta es la
longitud de la diagonal del rectngulo ms pequeo que incluye la imagen del carcter. El valor de
este atributo es la misma en cada objeto. Su tipo de lenguaje C es float.
Documentos pertinentes:
M. Botta, A. Giordana, L. Saitta: "Aprender las definiciones de conceptos difusos", IEEE-Fuzzy
Conferencia de 1993. [Web Link] M. Botta, A. Giordana:. "Aprender Caracterstica cuantitativa en
un entorno simblico", LNAI 542, 1991, pp 296-305 [Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 32009
perdidos?
Accesos:
Fuente:
Propietario original: Profesor Jergen en el Colegio Baylor de Medicina Donante: Bruce Porter
( Porter '@' fall.cs.utexas.EDU )
Atributo de la informacin:
(Todos los atributos son valoradas nominalmente)
1. identificador de caso.
2. clasificacin (24 clases)
3. Lista de las caractersticas del caso
- Formato: forma f (v) debe leerse como "funcin f tiene un valor v"
Documentos pertinentes:
Bareiss, E. Ray, & Porter, Bruce (1987). Protos: Un aprendiz Aprendizaje Basado Ejemplar. En las
Actas de la 4 Taller Internacional sobre Aprendizaje Automtico, 12-23, Irvine, CA:. Morgan
Kaufmann [Web Link]
Audiologa (Estandarizado) Conjunto de datos
Resumen : La versin estandarizada de la base de datos original de audiologa
Valores Nmero de
Tareas asociadas: Clasificacin S 33402
perdidos? Web Accesos:
Fuente:
Versin original: (a) Propietario original: Profesor Jergen en el Colegio Baylor de Medicina (b)
Donante: Bruce Porter ( Porter '@' fall.cs.utexas.EDU ) Estandarizado Versin: (a) Donante: Ross
Quinlan
Atributo de la informacin:
age_gt_60: f, t.
aire ():. leve, moderada, severa, normal, profundo
airBoneGap:. f, t
ar_c (): normal, elevado, ausente.
ar_u (): ausente normal, elevado.
seo (): leve, moderado, normal, no medida.
boneAbnormal:. f, t
BSER ():. normal de degradado,
history_buzzing: f, t.
history_dizziness: f, t.
history_fluctuating:. f, t
history_fullness:. f, t
history_heredity: f, . t
history_nausea:. f, t
history_noise: f, t.
history_recruitment:. f, t
history_ringing: f, t.
history_roaring:. f, t
history_vomiting:. f, t
late_wave_poor:. f, t
m_at_2k: f, t.
m_cond_lt_1k:. f, t
m_gt_1k: f, t.
m_m_gt_2k:. f, t
m_m_sn:. f, t
m_m_sn_gt_1k:. f, t
m_m_sn_gt_2k:. f, t
m_m_sn_gt_500:. f, t
m_p_sn_gt_2k: f, t.
m_s_gt_500: f, t.
m_s_sn: f, t.
m_s_sn_gt_1k: f, t.
m_s_sn_gt_2k:. f, t
m_s_sn_gt_3k:. f, t
m_s_sn_gt_4k:. f, t
m_sn_2_3k: f, t.
m_sn_gt_1k:. f, t
m_sn_gt_2k: f, . t
m_sn_gt_3k:. f, t
m_sn_gt_4k:. f, t
m_sn_gt_500: f, t.
m_sn_gt_6k:. f, t
m_sn_lt_1k:. f, t
m_sn_lt_2k: f, t.
m_sn_lt_3k:. f, t
middle_wave_poor: f, t.
mod_gt_4k:. f, t
mod_mixed:. f, t
mod_s_mixed:. f, t
mod_s_sn_gt_500: f, t.
mod_sn:. f, t
mod_sn_gt_1k:. f, t
mod_sn_gt_2k: f, t.
mod_sn_gt_3k:. f, t
mod_sn_gt_4k: f, t.
mod_sn_gt_500: f, t.
notch_4k:. f, t
notch_at_4k:. f, t
o_ar_c (): normal, elevado, ausente.
o_ar_u ():. normalidad ausente, elevado,
s_sn_gt_1k:. f, t
s_sn_gt_2k: f, t.
s_sn_gt_4k:. f, t
discurso (): normal, bueno, very_good, very_poor, pobre, no medida.
static_normal:. f, t
timpa (): a, como, b, ad, c.
viith_nerve_signs: f, t.
wave_V_delayed: f, t.
waveform_ItoV_prolonged:. f, t
indentifier (nico para cada
instance) class: cochlear_unknown,mixed_cochlear_age_fixation,poss_central mixed_cochlear_ag
e_otitis_media,mixed_poss_noise_om,cochlear_age,normal_ear,cochlear_poss_noise,cochlear_ag
e_and_noise, acoustic_neuroma,mixed_cochlear_unk_ser_om,conductive_discontinuity, retrocochl
ear_unknown,conductive_fixation,bells_palsy,cochlear_noise_and_heredity,mixed_cochlear_unk_fi
xation, otitis_media,possible_menieres,possible_brainstem_disorder, cochlear_age_plus_poss_me
nieres,mixed_cochlear_age_s_om,mixed_cochlear_unk_discontinuity,mixed_poss_central_om
Documentos pertinentes:
Bareiss, E. Ray, & Porter, Bruce (1987). Protos: Un aprendiz Aprendizaje Basado Ejemplar. En las
Actas de la 4 Taller Internacional sobre Aprendizaje Automtico, 12-23, Irvine, CA:. Morgan
Kaufmann [Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 32474
perdidos?
Accesos:
Fuente:
Propietario original y los donantes: Mohammed Waleed Kadous Facultad de Ciencias de la
Computacin de Ingeniera de la Universidad de Nueva Gales del Sur Sydney NSW 2052
Australia waleed '@' cse.unsw.edu.au
Atributo de la informacin:
x:
- Continua.
- Descripcin: x posicin entre -1 y 1. Las unidades son * metros aproximadamente *.
y:
- Continua.
- Descripcin: posicin y entre -1 y 1. Las unidades son aproximadamente metros.
z:
- Continua.
- Descripcin: posicin z entre -1 y 1. Las unidades no son metros.
Este espacio no debe ser tratado como realmente lineal, aunque es seguro que
lo tratan como montona creciente.
rodar:
- Continua.
- Descripcin: Rodillo con el 0 significa "palma hacia abajo", que gira clcokwise hasta un mximo
de 1 (no incluido), que es tambin "la palma hacia abajo."
pitch:
- Tiene un valor de -1, lo que indica que no se dispone de estos datos.
deben ser ignorados.
guiada:
- Tiene un valor de -1, lo que indica que que no est disponible para estos datos.
deben ser ignorados.
pulgar:
- Continua.
- Descripcin: Curva del pulgar. tiene un valor de 0 (recta) a 1 (totalmente doblada).
plano:
-. Continuo
- Descripcin: ndice curva. tiene un valor de 0 (recta) a 1 (totalmente doblada).
ndice:
-. Continuo
- Descripcin: El dedo ndice de curvatura. tiene un valor de 0 (recta) a 1 (totalmente doblada).
anillo:
-. Continuo
- Descripcin: finger curva Anillo. tiene un valor de 0 (recta) a 1 (totalmente doblada).
poco:
- En este caso, se trata de una copia de la curva del anillo. En caso de ser ignorado.
keycode:
- Indica que se ha pulsado en el guante. En caso de ser ignorado.
GS1:
- Estado guante 1 debe ser ignorada.
gs2:
- Estado guante 2 debe ser ignorada.
valores del receptor:
- Determina si todos los receptores reciben los valores de todos los transmisores. Un valor 0x3F
indica todos los receptores recibieron informacin de todos los transmisores. Otros valores indican
que esto no es el caso.
Documentos pertinentes:
MW Kadous, GRASP:. Reconocimiento de la Lengua de Signos Australiana usando guantes
instrumentados, con honores tesis, Escuela de Ciencias de la Computacin e Ingeniera de la
Universidad de Nueva Gales del Sur, 1995[Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 43007
perdidos?
Accesos:
Fuente:
Propietario original y los donantes: Mohammed Waleed Kadous Facultad de Ciencias de la
Computacin de Ingeniera de la Universidad de Nueva Gales del Sur Sydney NSW 2052
Australia Tel.: 61 2 9385 6922 waleed '@'cse.unsw.edu.au
Atributo de la informacin:
Los siguientes datos fueron registrados para cada mano: * x posicin expresada con relacin a un
punto de ajuste ligeramente por debajo de la barbilla cero. Expresado en metros. * posicin y,
expresado con relacin a un punto de ajuste ligeramente por debajo de la barbilla cero. Expresado
en metros. * posicin z expresa en relacin a un punto de ajuste ligeramente por debajo de la
barbilla cero. Expresado en metros. * rollo expresado como un valor entre -0,5 y 0,5, siendo 0 la
palma hacia abajo. Positivo significa la palma se rueda en sentido horario desde la perspectiva de
la persona que firma. Para obtener grados, multiplquelo por 180. * pitch expresado como un valor
entre -0,5 y 0,5, siendo 0 la palma plana (horizontal). Positivo significa la palma apunte hacia
arriba. Para obtener un ttulo, multiplquelo por 180. * guiada expresa un valor entre -1,0 y 1,0,
siendo 0 la palma hacia el frente desde la perspectiva de la persona que firma. Medios positivos
hacia la derecha desde la perspectiva arriba firmante. Para obtener grados, multiplquelo por 180. *
medida bend Pulgar entre 0 y 1. 0 significa totalmente plana, 1 es totalmente doblada. Sin
embargo, las mediciones de doblar el dedo no son muy exacta. * medida curva dedo ndice entre 0
y 1. 0 significa totalmente plana, 1 significa totalmente doblada. Sin embargo, los mediciones
doblar el dedo no son muy exacta. * medida doblar el dedo medio entre 0 y 1. 0 significa totalmente
plana, 1 es totalmente doblada. Sin embargo, las mediciones de doblar el dedo no son muy
exacta. * medida de curvatura dedo anular entre 0 y 1. 0 significa totalmente plana, 1 es totalmente
doblada. Sin embargo, las mediciones de doblar el dedo no son muy exacta. * Poco medida curva
dedo entre 0 y 1. 0 significa totalmente plana, 1 es totalmente doblada.Sin embargo, las
mediciones de doblar el dedo no son muy exacta.
Documentos pertinentes:
Kadous, MW, "Clasificacin temporal: Ampliacin de la Clasificacin Paradigma para multivariante
de series temporales", Tesis de Doctorado (borrador), Facultad de Ciencias de la Computacin e
Ingeniera de la Universidad de Nueva Gales del Sur, 2002. [Web Link] Tambin disponible
en: [Web Enlace ]
Valores Nmero de
Tareas asociadas: Regresin S 101000
perdidos? Web Accesos:
Fuente:
Este conjunto de datos fue tomada de la biblioteca StatLib que se mantiene en la Universidad
Carnegie Mellon. El conjunto de datos se utiliza en el 1983 Asociacin Americana de Estadstica
Exposicin.
Atributo de la informacin:
1. mpg: continua
2. cilindros: varios valores discretos
3. desplazamiento: continua
4. caballos de fuerza: continua
5. peso: continua
6. aceleracin: continua
7. Ao de construccin: varios valores discretos
8. origen: varios valores discretos
9. nombre del coche: string (nico para cada instancia)
Documentos pertinentes:
Quinlan, R. (1993). Combinando Instancia-con base y basado en modelos de aprendizaje. En
Actas de la Dcima Conferencia Internacional de Aprendizaje Automtico, 236-243, Universidad de
Massachusetts, Amherst. Morgan Kaufmann. [Web Link]
Nmero de
Valores
Tareas asociadas: Regresin S Web 85130
perdidos?
Accesos:
Fuente:
Creador / Donante: Jeffrey C. Schlimmer ( Jeffrey.Schlimmer '@' a.gp.cs.cmu.edu ) Fuentes: 1.)
Modelo 1985 Importacin de coches y camiones Especificaciones, 1985 de Ward Automotive
Yearbook 2) Personal Auto Manuales, Servicios de aseguramiento Oficina, 160 Water Street,
Nueva York, NY 10038 3) Seguro Reportar colisin, Instituto de Seguros para Seguridad en las
Carreteras, Watergate 600, Washington, DC 20037
Atributo de la informacin:
Atributo: Rango Atributo 1. symboling: -3, -2, -1, 0, 1, 2, 3. 2. normalizados-prdidas: continua 65-
256. 3. hacer: alfa-romero, audi, bmw, chevrolet, dodge, honda, isuzu, jaguar, Mazda, Mercedes-
Benz, el mercurio, mitsubishi, nissan, Peugeot, plymouth, porsche, renault, saab, subaru, toyota,
volkswagen, volvo 4 . tipo de combustible: disel, gas. 5. aspiracin: std, turbo. 6. num-de-puertas:
cuatro, dos. 7. al estilo de cuerpo: techo duro, carro, sedn, hatchback, convertible. 8. drive-ruedas:
4wd, fwd, rwd. 9. motor ubicacin: delantero, trasero. 10. distancia entre ejes: continuo desde 86.6
120.9. 11. longitud: continua 141,1-208,1. 12. anchura: continua 60,3-72,3. 13. altura: continua
47,8-59,8. 14. frenar peso: continua 1.488-4066. 15. -Tipo de motor: DOHC, dohcv, l, OHC,
tamaos grandes, ohcv, rotor. 16. num-of-cilindros: ocho, cinco, cuatro, seis, tres, doce,
dos. 17. motor-size: continua 61-326.18. combustible-sistema:. 1BBL, 2bbl, 4bbl, idi, mfi, mpfi,
SPDI, ISPS 19. dimetro: continua 2,54-3,94. 20. Carrera: continua 2,07-4,17. 21. compresin-
razn: continua del 7 al 23. 22. caballos de fuerza: continua 48-288. 23. pico rpm: continua desde
4150 hasta 6600. 24. ciudad-mpg: continua 13 a 49. 25. autopista de mpg: continua 16-
54. 26. precio: continua 5.118-45.400.
Documentos pertinentes:
Kibler, D., Aha, DW, y Albert, M. (1989). Prediccin basada en instancia de atributos con valores
reales. Inteligencia Computacional, Vol. 5, 51 - 57. [Web Link]
AutoUniv Data Set
Resumen : AutoUniv es un generador avanzado de datos para tareas de clasificaciones. El
objetivo es reflejar los matices y la heterogeneidad de los datos reales. Los datos pueden ser
generados en. Csv, ARFF o formatos C4.5.
N
Conjunto de datos Nmero de
Multivariante / rea: N/A
Caractersticas: instancias:
A
N
Caractersticas del Categrico, Nmero de 2010-
/ Fecha Donado
atributo: entero, real atributos: 11-03
A
N
Valores Nmero de
Tareas asociadas: Clasificacin / 21946
perdidos? Web Accesos:
A
Fuente:
AutoUniv fue desarrollado por Ray. J. Hickey. Email: ray.j.hickey '@' gmail.com
AutoUniv web-site: http://sites.google.com/site/autouniv/
Atributo de la informacin:
Los atributos pueden ser discretos con un mximo de 10 valores o continua. Un atributo discreto
puede ser nominal con valores v1, v2, v3 ... o enteros con valores 0, 1, 2, ....
Documentos pertinentes:
Marrs, G, Hickey, RJ y Negro, MM (2010) Modelacin del ciclo de vida de ejemplo, en un
estudiante de la clasificacin en lnea. En Actas de HaCDAIS 2010:. Taller Internacional sobre
Manejo Concepto Drift Adaptive Information Systems [Web Link] # proc. Marrs, G, Hickey, RJ y
Negro, MM (2010) El impacto de la latencia en el aprendizaje de Clasificacin Online con Concept
Drift. En Y. Bi y MA Williams (Eds.): KSEM 2010, LNAI 6291, Springer-Verlag, Berlin, pp 459A
"469. Hickey, RJ (2007) Estructura y clases mayoritarias en la Decisin Learning Tree. Journal of
Machine Learning Research, 8, pp 1747-1768.
Valores Nmero de
Tareas asociadas: N/A No 39308
perdidos? Web Accesos:
Fuente:
Corales: Mainous y Ottman edition.Mainous, Frank D. y Robert W. Ottman, eds. 1966.
Los 371 Corales de Bach. . Holt, Rinehart and Winston, Nueva York propietarios originales de base
de datos: Darrell Conklin ZymoGenetics Inc. 1201 Eastlake Avenue East Seattle WA,
98102 conklin '@' zgi.com Donantes de base de datos: Igual que el propietario. Ann Blombach de
la Universidad Estatal de Ohio me suministr originalmente con codificaciones de 4 voces de 100
corales. La actual base de datos es la lnea de soprano, convertida en formato Lisp legible y
ampliamente corregida.
Atributo de la informacin:
Nmero de Atributos: 6 (nominal) por evento (a) puesta en el tiempo, medido en notas 16a de
principio coral (tiempo 0) (b) de paso, nmero de MIDI (60 = C4, 61 = C # 4, 72 = C5, etc) (c) la
duracin, medida en notas 16o (d) firma de clave, nmero de sostenidos o bemoles, positivo si
firma dominante tiene sostenidos, negativo si firma dominante tiene pisos (e) de comps, en las
notas de 16o por barra (f ) caldern, verdadero o falso dependiendo de si est en un evento
fermata dominios Atributo (todos los enteros): (a) {0,1,2, ...} (b) {60, ..., 75} (c) {1, ..., 16} (d) {-4, ...,
4} (e) {12,16} (f) {0,1}
Documentos pertinentes:
Conklin, Darrell y Witten, Ian. 1995. Viewpoint Systems mltiples para Music Prediccin. Diario de
Nueva Music Research. 24 (1) :51-73. [Web Link]
Insignias conjunto de datos
Resumen : Insignias marcadas con un "+" o "-" en funcin del nombre de una persona
Valores Nmero de
Tareas asociadas: Clasificacin No 32727
perdidos? Web Accesos:
Fuente:
Creador: Haym Hirsh, despus de una idea de Rob Schapire Donante: Haym Hirsh
( hirsh '@' cs.rutgers.edu )
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Bag of Words Data Set 2008-03-12
2008-03-12
Caractersticas Nmero de Fecha de
Entero 100000
del atributo: atributos: Donacin
122589
Tareas Valores Nmero de
Clustering N/A
asociadas: perdidos? accesos Web:
Fuente:
David Newman newman'@' uci.edu University of California, Irvine
NYTimes noticias :
fuente orig : ldc.upenn.edu
D = 300000
W = 102660
N = 100 000 000 ( aprox )
PubMed resmenes:
fuente orig : www.pubmed.gov
D = 8200000
W = 141043
N = 730 000 000 ( aprox )
Documentos relevantes:
N/A
Citas:
Por favor,consulte elRepositoriode polticascitacinAprendizaje Automtico
Balance Scale Data Set 1994-04-22
Nmero
70436
Valores de
Tareas asociadas: Clasificacin No
perdidos? accesos
Web:
Fuente:
Generadopara modelarexperimentos psicolgicosreportados porSiegler, RS (1976).
Tresaspectos del desarrollocognitivo. Psicologa Cognitiva, 8, 481-520.
Donante:
TimHume(Hume '@'ics.uci.edu)
Documentos relevantes:
Klahr, D., &Siegler, R.S. (1978). The Representation of Children's Knowledge. In H. W.
Reese & L. P. Lipsitt (Eds.), Advances in Child Development and Behavior, pp. 61-116.
New York: Academic Press
Newell, A. (1990). Unified Theories of Cognition. Cambridge, MA: Harvard University Press
McClelland, J.L. (1988). Parallel Distibuted Processing: Implications for Cognition and
Development. Technical Report AIP-47, Department of Psychology, Carnegie-Mellon
University
Shultz, T., Mareschal, D., & Schmidt, W. (1994). Modeling Cognitive Development on
Balance Scale Phenomena. Machine Learning, Vol. 16, pp. 59-88.
Zhi-Hua Zhou and Yuan Jiang and Shifu Chen. Extracting symbolic rules from trained
neural network ensembles. AI Commun, 16. 2003.
Jianbin Tan and David L. Dowe. MML Inference of Decision Graphs with Multi-way Joins
and Dynamic Attributes. Australian Conference on Artificial Intelligence. 2003.
Remco R. Bouckaert. Accuracy bounds for ensembles under 0 { 1 loss. Xtal Mountain
Information Technology & Computer Science Department, University of Waikato. 2002.
Nir Friedman and MoissGoldszmidt and Thomas J. Lee. Bayesian Network Classification
with Continuous Attributes: Getting the Best of Both Discretization and Parametric Fitting.
ICML. 1998.
Citas:
Por favor,consulte elRepositoriode polticascitacinAprendizaje Automtico
Balloons Data Set
Resumen: Los datos utilizadospreviamente enexperimento de psicologacognitiva,
4conjuntos de datosrepresentan diferentescondicionesde un experimento
Social
Caractersticas del Nmero de
Multivariado 16 rea:
Conjunto de datos: instancias:
N/A
Caractersticas del Nmero de Fecha de
Categrico 4
atributo: atributos: Donacin
70430
Valores Nmero de
Tareas asociadas: Clasificacin No
perdidos? accesos Web:
Fuente:
Michael Pazzani (pazzani'@' ics.uci.edu)
Color:amarillo, morado
Tamao: grande, pequeo
acto: estiramiento, inmersin
edad:adulto, nio
inflado: T, F
Documentosrelevantes:
Ron Kohavi and George H. John and Richard Long and David Manley and Karl Pfleger.
MLC++: A Machine Learning Library in C. ICTAI. 1994.
Citas:
Por favor,consulte elRepositoriode polticascitacinAprendizaje Automtico
Bank Marketing Data Set
Resumen: Los datos serelacionacon las campaasde marketing directo(llamadas
telefnicas) deuna institucin bancariaportuguesa.El objetivode clasificacines predecirsi
elcliente va asuscribirun depsito a plazo(variabley). datos utilizadospreviamente
enexperimento de psicologacognitiva, 4conjuntos de datosrepresentan
diferentescondicionesde un experimento
Caractersticas del 45211 Negocios
Nmero de
Conjunto de Multivariado rea:
instancias:
datos:
2012-02-
14
Caractersticas del Nmero de Fecha de
Real 17
atributo: atributos: Donacin
Nmero de 73510
Valores
Tareas asociadas: Clasificacin N/A accesos
perdidos?
Web:
Fuente:
[Moro et al., 2011] S. Moro, R. Laureano and P. Cortez. Using Data Mining for Bank Direct
Marketing: An Application of the CRISP-DM Methodology. In P. Novais et al. (Eds.),
Proceedings of the European Simulation and Modelling Conference - ESM'2011, pp. 117-
121, Guimaraes, Portugal, October, 2011. EUROSIS (http://hdl.handle.net/1822/14838)
Documentos relevantes:
Citas:
Este conjunto de datoses pblicadisponibles para la investigacin. Losdetalles se
describen en[Moro et al., 2011].
Por favor, incluyaesta citasitiene previsto utilizaresta base de datos:
Resumen:
Los datos se obtuvieron a partir de imgenes que fueron tomadas para la evaluacin de un
procedimiento de autenticacin para los billetes de banco.
Caractersticas del Computacin
Nmero de
Conjunto de Multivariable 1372 rea:
instancias:
datos:
2013-04-16
Caractersticas del Nmero de Fecha de
Real 5
atributo: atributos: Donacin
Nmero
8049
Valores de
Tareas asociadas: Clasificacin N/A
perdidos? accesos
Web:
Informacin del Conjunto de datos: Los datos fueron obtenidos a partir de imgenes
que fueron tomadas de genuino y forjaron especmenes de billetes similares. Para la
digitalizacin, se utiliz una cmara industrial por lo general utilizados para la inspeccin
de impresin. Las imgenes finales tienen 400x 400 pxeles. Debido a se ganaron la lente
objetivo y la distancia a los objetos de las imgenes en escala de grises investigados con
una resolucin de unos 660 dpi. Wavelet Transform herramienta se utiliza para extraer las
caractersticas de las imgenes.
Documentos relevantes:
documento presentado (informacin ser subido lo antes posible)
Citas:
Por favor refirase a la poltica de la citacin del Aprendizaje Repositorio Machine
2013-07-06
Caractersticas del Nmero de Fecha de
N/A 6
atributo: atributos: Donacin
Nmero
9950
Valores de
Tareas asociadas: Clasificacin N/A
perdidos? accesos
Web:
Fuente: http://www.ijcaonline.org/archives/volume47/number18/7291-0509
Documentos relevantes:
FS GHAREHCHOPOGH, SRKHAZE, 'Aplicacin de minera de datos para la Tendencia
Cyber Space en la escritura de blog: A Case Studya , Revista Internacional de
Aplicaciones Informticas (IJCA), vol:?? 47, n 18, pp: 40-46 de Julio del 2012 .
Citas: Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo
en blanco.
Bike Sharing Dataset Data Set 2013-12-20
Resumen:
Este conjunto de datos contiene el nmero de hora y da de alquiler de bicicletas entre los
aos 2011 y 2012 en el sistema de Bikeshare capital con el clima y la informacin
correspondiente de temporada.
Social
Caractersticas del Nmero de
Univariante 17389 rea:
Conjunto de datos: instancias:
2013-12-20
Caractersticas del Entero, Nmero de Fecha de
16
atributo: Real atributos: Donacin
Nmero
8789
Valores de
Tareas asociadas: Regresin N/A
perdidos? accesos
Web:
Fuente:
Laboratorio de Inteligencia Artificial y Apoyo de Decisiones (LIAAD), Universidad de Porto
INESC Porto, Campus da FEUP
Rua Dr. Roberto Fras, 378
4200 - 465 Oporto, Portugal
Documentos relevantes:
Fanaee-T, Hadi, y Gama, Joao, etiquetado Evento combinando detectores de conjunto y
el conocimiento de fondo", Avances en Inteligencia Artificial (2013): pp 1-15, Springer
Berlin Heidelberg
Citas:
Fanaee-T, Hadi, y Gama, Joao, etiquetado Evento combinando detectores de conjunto y
el conocimiento de fondo", Avances en Inteligencia Artificial (2013): pp 1-15, Springer
Berlin Heidelberg, [Web Link].
@ article {
ao = {2013},
ISSN = {2192-6352},
journal = {Avances en Inteligencia Artificial},
doi = {} 10.1007/s13748-013-0040-3,
title = {etiquetado Evento combinando detectores de conjunto y el conocimiento de fondo},
url = {[Web Link]},
publisher = {} Springer Berlin Heidelberg,
keywords = {etiquetado de eventos, deteccin de eventos, el aprendizaje Ensemble;
Conocimientos previos},
author = {Fanaee-T, Hadi y Gama, Joao},
pages = {1-15}
}
Blood Transfusion Service Center 2008-10-03
Data Set
Resumen:
Datos tomados del Centro de Transfusin de Sangre de servicios en Hsin-Chu City en
Taiwn - se trata de un problema de clasificacin..
Negocios
Caractersticas del Nmero de
Multivariable 748 rea:
Conjunto de datos: instancias:
2008-10-03
Caractersticas del Nmero de Fecha de
Real 5
atributo: atributos: Donacin
Nmero
71382
Valores de
Tareas asociadas: Clasificacin N/A
perdidos? accesos
Web:
Fuente:
Propietario original y Donantes
Prof. I-Cheng Yeh
Departamento de Gestin de la Informacin
Chung-Hua Universidad,
Hsin Chu, Taiwn 30067, R.O.C.
e-mail: Icyeh '@' chu.edu.tw
TEL :886-3-5186511
Citas:
NOTE: Reuse of this database is unlimited with retention of copyright notice for Prof. I-
Cheng Yeh and the following published paper:
Yeh, I-Cheng, Yang, King-Jang, and Ting, Tao-Ming, "Knowledge discovery on RFM model
using Bernoulli sequence, "Expert Systems with Applications, 2008,
1988-07-11
1988-07-11
Caractersticas del Nmero de Fecha de
Categricos 9
atributo: atributos: Donacin
Nmero
108124
Valores de
Tareas asociadas: Clasificacin Yes
perdidos? accesos
Web:
Fuente:
Creadores:
donantes:
Ming Tan y Jeff Schlimmer (Jeffrey.Schlimmer '@' a.gp.cs.cmu.edu)
Informacin del Conjunto de datos: Este es uno de los tres dominios proporcionados
por el Instituto de Oncologa que ha aparecido repetidamente en la literatura de
aprendizaje de mquina. (Ver tambin la linfografa y-tumor primario.)
Este conjunto de datos incluye 201 casos de una clase y 85 casos de otra clase. Los
casos son descritos por 9 atributos, algunos de los cuales son lineales y algunos son
nominales.
Igor Fischer y Jan Polonia. Amplificar la estructura de la matriz de bloques para Espectral
Clustering. Laboratorio de Telecomunicaciones . 2005 . [Ver Contexto ] .
Saher Esmeir y Sal Markovitch . Algoritmos basados en la bsqueda hacia delante para
en cualquier momento de la induccin de rboles de decisin . ICML . 2004 . [Ver Contexto
].
Kaizhu Huang y Yang Haiqin e Irwin Rey y Michael R. Lyu y Laiwan Chan. Sesgo Machine
Probabilidad Minimax para el diagnstico mdico . AMAI . 2004 . [Ver Contexto ] .
Andrs Antos y Balzs Kgl y Tams Linder y Gbor Lugosi . Generalizacin basada
margin- dependiente de los datos limita para la clasificacin. Journal of Machine Learning
Research , 3 . 2002 . [Ver Contexto ] .
Michael G. Madden. Evaluacin del Desempeo de la cadena de Markov clasificador
bayesiano Algoritmo . CoRR , csLG/0211003 . 2002 . [Ver Contexto ] .
Remco R. Bouckaert . Precisin limita para conjuntos bajo 0 { 1 derrota . Xtal Montaa
Tecnologa de la Informacin y Departamento de Ciencias de la Computacin de la
Universidad de Waikato . 2002 . [Ver Contexto ] .
Robert Burbidge y Matthew Trotter y Bernard F. Buxton y Sean B. Holden. STAR - Sparsity
travs Rechazo automatizado . IWANN ( 1 ) . 2001 . [Ver Contexto ] .
W. Nick Street y Yoo- Hyon Kim. Un conjunto algoritmo de secuencias ( SEA ) para la
clasificacin de gran escala. KDD . 2001 . [Ver Contexto ] .
Endre Boros y Peter Hammer y Toshihide Ibaraki y Alexander Kogan y Eddy Mayoraz e
Ilya B. Muchnik . Una Aplicacin del anlisis lgico de datos . IEEE Trans . Conocimiento .
Datos Eng, 12 . 2000 . [Ver Contexto ] .
Sally A. Goldman y Yan Zhou. La mejora de Aprendizaje Supervisado con datos sin
etiqueta . ICML . 2000 . [Ver Contexto ] .
Yuh- Jeng Lee. Alise Mquinas de Vectores Soporte . Propuesta Preliminar Tesis
Computer Sciences Department de la Universidad de Wisconsin. 2000 . [Ver Contexto ] .
Petri Kontkanen y Petri Myllym y Tomi Silander y Henry Tirri y Peter Gr . En las
distribuciones predictivas y las redes bayesianas . Departamento de Ciencias de la
Computacin de la Universidad de Stanford. 2000 . [Ver Contexto ] .
Mateo Mullin y Rahul Sukthankar . Validacin cruzada completa para clasificadores vecino
ms cercano . ICML . 2000 . [Ver Contexto ] .
Chun -Nan Hsu y Hilmar Schuschel y Ya- Ting Yang. El Enfoque ANNIGMA - Envoltura
con Redes Neuronales funcin de seleccin de Descubrimiento de Conocimiento y Minera
de Datos . Instituto de Ciencias de la Informacin . 1999 . [Ver Contexto ] .
David M J Tax y Robert P W Duin . Apoyar descripcin del dominio del vector. Pattern
Recognition Letters , 20 . 1999 . [Ver Contexto ] .
Kai Ming Ting y Ian H. Witten . Problemas en Stacked generalizacin. J. Artif . Intell . Res. .
( JAIR , 10 . 1999 . [Ver Contexto ] .
Lorne Mason y Jonathan Baxter y Peter L. Bartlett y Marcus Frean . Impulsar Algoritmos
como Gradient Descent . PNI. 1999 . [Ver Contexto ] .
Iaki Inza y Pedro Larraaga y Basilio Sierra y Ramn Etxeberria y Jos Antonio Lozano y
Jos Manuel Pea. En representacin del comportamiento de los algoritmos de
aprendizaje de clasificacin supervisada por redes bayesianas . Pattern Recognition
Letters , 20 . 1999 . [Ver Contexto ] .
Richard Maclin . Impulsar Clasificadores nivel regional . AAAI / IAAI . 1998 . [Ver Contexto
].
Huan Liu y Hiroshi Motoda y Manoranjan Dash. A Medida Monotnica ptima Seleccin
de caractersticas. ECML . 1998 . [Ver Contexto ] .
W. Nick Street. Un modelo de red neuronal para la prediccin pronstica . ICML . 1998 .
[Ver Contexto ] .
Rudy Setiono y Huan Liu. NeuroLinear : De redes neuronales para las reglas de decisin
oblicuos. Neurocomputing , 17 . 1997 . [Ver Contexto ] .
Kamal Ali y Michael J. Pazzani . Reduccin de errores a travs del aprendizaje mltiples
descripciones. Aprendizaje Automtico , 24 . 1996 . [Ver Contexto ] .
Rong Jin Yan y Liu y Luo Si y Jaime Carbonell y Alexander G. Hauptmann . Un Nuevo
Impulso algoritmo utilizando regularizador Input- Dependiente. Facultad de Ciencias de la
Computacin , de la Universidad Carnegie Mellon. [Ver Contexto ] .
David Kwartowitz y Sean Brophy y Horace Mann. Sesin S2D Work In Progress : El
establecimiento de mltiples contextos de refinamiento progresivo de los estudiantes de la
minera de datos. [Ver Contexto ] .
D. Randall Wilson y Roel Martinez . Mejora Seleccin Center Point para probabilsticos
Redes Neuronales . Actas de la Conferencia Internacional sobre Redes Neuronales
Artificiales y Algoritmos Genticos . [Ver Contexto ] .
Bart Baesens y Stijn Viaene y Tony Van Gestel y JA K Suykens y Guido Dedene y Bart De
Moor y Jan VANTHIENEN y Universidad Catlica de Lovaina . Estudio emprico de tipo
Kernel Desempeo de Mnimos Cuadrados Apoyo Vector Machine clasificadores . Dept.
Aplicadas Ciencias Econmicas . [Ver Contexto ] .
Rafael S. Parpinelli y Heitor S. Lopes y Alex Alves Freitas . Un sistema basado en Colonia
de Hormigas para minera de datos : Aplicaciones a los datos mdicos . CEFET -PR ,
CPGEI Av . Sete de Setembro, 3165 . [Ver Contexto ] .
John G. Cleary y Leonard E. Trigg . Las experiencias con el OB 1 , una decisin ptima
Bayes Tree alumno. Departamento de Informtica Universidad de Waikato . [Ver Contexto
].
Wl / odzisl / aw Duch y Rafal / Adamczak Email: duchraad @ fs . uni . Torun . pl. Mtodos
estadsticos para la construccin de las redes neuronales . Departamento de Mtodos
Computacionales , Universidad Nicols Coprnico
Citas:
Este dominio del cncer de mama se obtuvo del Centro Mdico de la Universidad, Instituto
de Oncologa, Ljubljana, Yugoslavia. Damos las gracias a M. y M. Zwitter Soklic de
proporcionar los datos. Por favor, incluya esta cita si tiene previsto utilizar esta base de
datos.
Breast Cancer Wisconsin (Original) Data Set 1992-07-15
Resumen:
Base de datos Wisconsin Breast Cancer original.
Vida
Caractersticas del Nmero de
Multivariable 699 rea:
Conjunto de datos: instancias:
1992-07-15
Caractersticas del Nmero de Fecha de
Entero 10
atributo: atributos: Donacin
Nmero
112739
Valores de
Tareas asociadas: Clasificacin Yes
perdidos? accesos
Web:
Fuente:
Creador:
Donante:
Informacin del Conjunto de datos: Las muestras llegan peridicamente segn informa
el Dr. Wolberg sus casos clnicos. Por consiguiente, la base de datos refleja esta
agrupacin cronolgica de los datos . Esta informacin de agrupacin aparece
inmediatamente a continuacin , despus de haber sido retirado de los datos en s :
Documentos relevantes:
Wolberg, W. H., y Mangasarian, O.L. (1990). Mtodo MultiSurface de separacin patrn
para el diagnstico mdico aplicado a la citologa de mama. En Actas de la Academia
Nacional de Ciencias, 87, desde 9.193 hasta 9.196.
[Web Link]
Andrs Antos y Balzs Kgl y Tams Linder y Gbor Lugosi . Generalizacin basada
margin- dependiente de los datos limita para la clasificacin. Journal of Machine Learning
Research , 3 . 2002 . [Ver Contexto ] .
Yuh- Jeng Lee. Alise Mquinas de Vectores Soporte . Propuesta Preliminar Tesis
Computer Sciences Department de la Universidad de Wisconsin. 2000 . [Ver Contexto ] .
Endre Boros y Peter Hammer y Toshihide Ibaraki y Alexander Kogan y Eddy Mayoraz e
Ilya B. Muchnik . Una Aplicacin del anlisis lgico de datos . IEEE Trans . Conocimiento .
Datos Eng, 12 . 2000 . [Ver Contexto ] .
Chun -Nan Hsu y Hilmar Schuschel y Ya- Ting Yang. El Enfoque ANNIGMA - Envoltura
con Redes Neuronales funcin de seleccin de Descubrimiento de Conocimiento y Minera
de Datos . Instituto de Ciencias de la Informacin . 1999 . [Ver Contexto ] .
Huan Liu y Hiroshi Motoda y Manoranjan Dash. A Medida Monotnica ptima Seleccin
de caractersticas. ECML . 1998 . [Ver Contexto ] .
W. Nick Street. Un modelo de red neuronal para la prediccin pronstica . ICML . 1998 .
[Ver Contexto ] .
Rudy Setiono y Huan Liu. NeuroLinear : De redes neuronales para las reglas de decisin
oblicuos. Neurocomputing , 17 . 1997 . [Ver Contexto ] .
Rafael S. Parpinelli y Heitor S. Lopes y Alex Alves Freitas . Un sistema basado en Colonia
de Hormigas para minera de datos : Aplicaciones a los datos mdicos . CEFET -PR ,
CPGEI Av . Sete de Setembro, 3165 . [Ver Contexto ] .
Wl / odzisl / aw Duch y Rafal / Adamczak Email: duchraad @ fs . uni . Torun . pl. Mtodos
estadsticos para la construccin de las redes neuronales . Departamento de Mtodos
Computacionales , Universidad Nicols Coprnico. [Ver Contexto ] .
Bart Baesens y Stijn Viaene y Tony Van Gestel y JA K Suykens y Guido Dedene y Bart De
Moor y Jan VANTHIENEN y Universidad Catlica de Lovaina . Estudio emprico de tipo
Kernel Desempeo de Mnimos Cuadrados Apoyo Vector Machine clasificadores . Dept.
Aplicadas Ciencias Econmicas . [Ver Contexto ] .
Citas:
Esta base de datos de cncer de mama se obtuvo de la Universidad de Wisconsin
Hospitales , Madison del Dr. William H. Wolberg . Si publica resultados al utilizar esta base
de datos , a continuacin, por favor incluya esta informacin en sus agradecimientos.
Tambin, por favor, cite uno o ms de :
1 . OL Mangasarian y WH Wolberg : " El diagnstico de cncer a travs de la
programacin lineal " , SIAM News, Volumen 23 , Nmero 5, septiembre de 1990, pp 1 y
18 .
2 . William H. Wolberg y O.L. Mangasarian : " mtodo MultiSurface de separacin patrn
para el diagnstico mdico aplicado a la citologa de mama " , Actas de la Academia
Nacional de Ciencias, EE.UU. , Volumen 87 , diciembre de 1990, pp 9193-9196 .
3 . O. L. Mangasarian , R. Setiono , y W. H. Wolberg : " El reconocimiento de patrones a
travs de la programacin lineal : teora y aplicacin al diagnstico mdico ", en: "La
optimizacin a gran escala numrica " , Thomas F. Coleman y Yuying Li, editores , SIAM
Publicaciones , Philadelphia 1990 , pp 22-30 .
4 . KP Bennett & OL Mangasarian : "discriminacin programacin lineal robusta de dos
conjuntos linealmente inseparables " , Mtodos de Optimizacin y Software 1 , 1992 , 23-
34 (Gordon & Breach Science Publishers ) .
Breast Cancer Wisconsin (Prognostic) Data Set 1995-12-01
Resumen:
Base de datos Wisconsin Cncer de Mama pronstico.
Vida
Caractersticas del Nmero de
Multivariable 198 rea:
Conjunto de datos: instancias:
1995-12-01
Caractersticas del Nmero de Fecha de
Real 34
atributo: atributos: Donacin
Nmero
53640
Clasificacin y Valores de
Tareas asociadas: Yes
Regresi perdidos? accesos
Web:
Fuente:
Creadores:
Donante:
Nick Street
Informacin del Conjunto de datos: Cada registro representa los datos de seguimiento de
un caso de cncer de mama. Se trata de pacientes atendidos de forma consecutiva por el
Dr. Wolberg desde 1984, e incluyen slo aquellos casos que presentan cncer de mama
invasivo y sin evidencia de metstasis a distancia en el momento del diagnstico.
Esta base de datos tambin est disponible a travs del servidor ftp UW CS:
ftp ftp.cs.wisc.edu
cd math-prog/cpo-dataset/machine-learn/WPBC /
Documentos relevantes:
W. N. Street, O. L. Mangasarian y W.H. Wolberg . Un enfoque de aprendizaje inductivo para
la prediccin pronstica. En A. Prieditis y S. Russell, editores , Actas de la duodcima
Conferencia Internacional sobre Aprendizaje Automtico , pginas 522 a 530 , San
Francisco, 1995 . Morgan Kaufmann .
[Web Link]
Andrs Antos y Balzs Kgl y Tams Linder y Gbor Lugosi . Generalizacin basada
margin- dependiente de los datos limita para la clasificacin. Journal of Machine Learning
Research , 3 . 2002 . [Ver Contexto ] .
Robert Burbidge y Matthew Trotter y Bernard F. Buxton y Sean B. Holden. STAR - Sparsity
travs Rechazo automatizado . IWANN ( 1 ) . 2001 . [Ver Contexto ] .
Yuh- Jeng Lee. Alise Mquinas de Vectores Soporte . Propuesta Preliminar Tesis Computer
Sciences Department de la Universidad de Wisconsin. 2000 . [Ver Contexto ] .
Endre Boros y Peter Hammer y Toshihide Ibaraki y Alexander Kogan y Eddy Mayoraz e Ilya
B. Muchnik . Una Aplicacin del anlisis lgico de datos . IEEE Trans . Conocimiento . Datos
Eng, 12 . 2000 . [Ver Contexto ] .
Chun -Nan Hsu y Hilmar Schuschel y Ya- Ting Yang. El Enfoque ANNIGMA - Envoltura con
Redes Neuronales funcin de seleccin de Descubrimiento de Conocimiento y Minera de
Datos . Instituto de Ciencias de la Informacin . 1999 . [Ver Contexto ] .
Huan Liu y Hiroshi Motoda y Manoranjan Dash. A Medida Monotnica ptima Seleccin de
caractersticas. ECML . 1998 . [Ver Contexto ] .
Lorne Mason y Peter L. Bartlett y Jonathan Baxter. Optimizacin directo de Mrgenes
Mejora Generalizacin en clasificadores combinados . PNI. 1998 . [Ver Contexto ] .
W. Nick Street. Un modelo de red neuronal para la prediccin pronstica . ICML . 1998 . [Ver
Contexto ] .
Rudy Setiono y Huan Liu. NeuroLinear : De redes neuronales para las reglas de decisin
oblicuos. Neurocomputing , 17 . 1997 . [Ver Contexto ] .
Jennifer A. Azul y Kristin P. Bennett. Hbrido Extreme Point Bsqueda Tab . Departamento
de Ciencias Matemticas del Instituto Politcnico Rensselaer . 1996 . [Ver Contexto ] .
Geoffrey I. Webb. OPUS : Un Algoritmo admisible Eficiente para Unordered Buscar . J. Artif .
Intell . Res. . ( JAIR , 3 . 1995 . [Ver Contexto ] .
Rafael S. Parpinelli y Heitor S. Lopes y Alex Alves Freitas . Un sistema basado en Colonia
de Hormigas para minera de datos : Aplicaciones a los datos mdicos . CEFET -PR ,
CPGEI Av . Sete de Setembro, 3165 . [Ver Contexto ] .
Wl / odzisl / aw Duch y Rafal / Adamczak Email: duchraad @ fs . uni . Torun . pl. Mtodos
estadsticos para la construccin de las redes neuronales . Departamento de Mtodos
Computacionales , Universidad Nicols Coprnico. [Ver Contexto ] .
Bart Baesens y Stijn Viaene y Tony Van Gestel y JA K Suykens y Guido Dedene y Bart De
Moor y Jan VANTHIENEN y Universidad Catlica de Lovaina . Estudio emprico de tipo
Kernel Desempeo de Mnimos Cuadrados Apoyo Vector Machine clasificadores . Dept.
Aplicadas Ciencias Econmicas . [Ver Contexto ] .
Adil M. Bagirov y Alex Rubinov y AN Soukhojak y John Yearwood . Clasificacin de datos no
supervisada y supervisada a travs de no lisos y optimizacin global. Escuela de Tecnologa
de la Informacin y Ciencias Matemticas de la Universidad de Ballarat . [Ver Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Breast Tissue Data Set 2010-05-10
Resumen:
Conjunto de datos con las mediciones de impedancia elctrica de muestras de tejido
recin extirpadas de la mama.
Vida
Caractersticas del Nmero de
Multivariable 106 rea:
Conjunto de datos: instancias:
2010-05-10
Caractersticas del Nmero de Fecha de
Real 10
atributo: atributos: Donacin
Nmero
38869
Valores de
Tareas asociadas: Clasificacin N/A
perdidos? accesos
Web:
Fuente:
JP Marqus de S, INEB-Instituto de Engenharia Biomdica, Porto, Portugal; e-mail:
jpmdesa '@' gmail.com
J Jossinet, INSERM, Lyon, Francia
Documentos relevantes:
Jossinet J (1996) Variabilidad de impedivity en el tejido normal y patolgico de mama.
Med. Y Biol. Eng. Y Comput, 34: 346-350.
Silva JE, Marqus de S JP, Jossinet J (2000) Clasificacin del tejido mamario mediante
Espectroscopia de Impedancia Elctrica. Med & Bio Eng & Computing, 38:26-30.
Citas: Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Resumen:
Este conjunto de datos contiene ejemplos de eventos de moda de dos redes sociales
diferentes: Twitter y Hardware de Tom, una red foro se centra en las nuevas tecnologas
con una dinmica ms conservadoras.
Caractersticas 140000 Computacin
Time-Series., Nmero de
del Conjunto de rea:
Multivariado instancias:
datos:
2013-05-27
Caractersticas Nmero de Fecha de
Entero, Real 77
del atributo: atributos: Donacin
Nmero
Tareas Clasificacin Valores de
N/A 13006
asociadas: y Regresin perdidos? accesos
Web:
Fuente:
Creadores:
Franois Kawala (1.2) Ahlame Douzal (1) Eric Gaussier (1) Diemert Eustache (2)
Instituciones:
(1) de la Universidad Joseph Fourier (Grenoble I)
Laboratorio de Informtica de Grenoble (LIG)
(2) Grupo Bestofmedia Red
Donante:
Bestofmedia (ediemert '@' bestofmedia.com)
Documentos relevantes:
Las predicciones de la actividad en las redes sociales en lnea (F. Kawala, A. Douzal-
Chouakria, E. Gaussier, E. Dimert), En Actas de la Conferencia sobre Modelos y Anlisis
de Redes: Acercamientos Matemticas y Ciencias de la Computacin (Marami), p. 16,
2013.
Citas:
Las predicciones de la actividad en las redes sociales en lnea (F. Kawala, A. Douzal-
Chouakria, E. Gaussier, E. Dimert), En Actas de la Conferencia sobre Modelos y Anlisis
de Redes: Acercamientos Matemticas y Ciencias de la Computacin (Marami), p. 16,
2013.
CalIt2 Building People Counts Data Set 2006-12-01
Resumen:
Estos datos vienen de la puerta principal del edificio de Calit2 en UCI.
Multivariado,
Caractersticas 10080 N/A
Time-Series Nmero de
del Conjunto de rea:
instancias:
datos:
2006-12-01
Caractersticas Entero, Nmero de Fecha de
4
del atributo: Categrico atributos: Donacin
Nmero
19578
Valores de
Tareas asociadas: N/A No
perdidos? accesos
Web:
Fuente:
Creador y Mantenedor:
Jon Hutchins
UCI
johutchi '@' uci.edu
Filas: Cada porcin de tiempo media hora est representado por 2 filas: una para el
flujo durante ese perodo de tiempo (ID = 7) y una fila para el flujo durante ese
perodo de tiempo (ID = 9)
Citas:
Por favor refirase a la poltica de la citacin Machine Learning Repository.
1997-06-01
1997-06-01
Caractersticas del Nmero de Fecha de
Categrico 6
atributo: atributos: Donacin
Nmero
Valores de
Tareas asociadas: Clasificacin No 263399
perdidos? accesos
Web:
Fuente:
Creador: Marko Bohanec
Donantes
1. Marko Bohanec (marko.bohanec '@' ijs.si)
2. Blaz Zupan (blaz.zupan '@' ijs.si)
Debido a la estructura conocida concepto subyacente , esta base de datos puede ser
particularmente til para probar la induccin constructiva y mtodos de descubrimiento de
la estructura .
Atributos:
ofertas: En VHIGH, alto, Medio, Bajo.
maint: VHIGH, alto, Medio, Bajo.
puertas: 2, 3, 4, 5more.
personas: 2, 4, ms.
lug_boot: pequeo, med, grande.
seguridad: bajo, Medio, Alto.
Documentos relevantes:
M. Bohanec y V. Rajkovic: La adquisicin de conocimientos y la explicacin para la toma
de decisiones con atributos mltiples. En octavo Intl Taller sobre Sistemas Expertos y sus
Aplicaciones, Avignon, Francia. pginas 59-78, 1988.
[Web Link]
Jianbin Tan y David L. Dowe . MML Inferencia de la Decisin Grficos con varias vas se
une y atributos dinmicos . Conferencia australiana sobre Inteligencia Artificial. 2003 . [Ver
Contexto ] .
Marc Sebban y Richard Nock y Jean -Hugues Chauchat y Ricco Rakotomalala . Impacto
de la calidad del aprendizaje conjunto y el tamao de las actuaciones de rbol de decisin
. Int . J. Comput . Syst . Seal , 1 . 2000 . [Ver Contexto ] .
Jie Cheng y Russell Greiner . Comparando red bayesiana clasificadores . UAI . 1999 . [Ver
Contexto ] .
Zhiqiang Yang Sheng y Zhong y Rebecca N. Wright. Privacidad - Preservar Clasificacin
de los datos del cliente y sin prdida de precisin . Departamento de Informtica , Stevens
Institute of Technology. [Ver Contexto ] .
Shi Zhong y Weiyu Tang y Taghi M. Khoshgoftaar . Impulsado Filtros de ruido para
identificar Mislabeled Datos. Departamento de Ciencias de la Computacin e Ingeniera de
la Universidad Atlntica de la Florida. [Ver Contexto ] .
Hyunwoo Kim y Wei -Yin Loh . rboles de Clasificacin con modelos bivariados
discriminante lineal nodo. Departamento de Estadstica del Departamento de Estadstica
de la Universidad de la Universidad de Tennessee de Wisconsin. [Ver Contexto ] .
Daniel J. Lizotte y Omid Madani y Russell Greiner . Presupuestado Aprendizaje , Parte II:
El Na # ve- Bayes Case. Departamento de Informtica de la Universidad de Ciencias de
Alberta. [Ver Contexto ] .
Resumen:
El conjunto de datos consiste en la medicin de la frecuencia cardaca fetal (FCF) y la
contraccin uterina (CU) cuenta en cardiotocograms clasificados por obstetras expertos..
2126 Vida
Caractersticas del Nmero de
Multivariable rea:
Conjunto de datos: instancias:
2010-09-07
Caractersticas del Nmero de Fecha de
Real 23
atributo: atributos: Donacin
Nmero
Valores de
Tareas asociadas: Clasificacin N/A 40350
perdidos? accesos
Web:
Fuente:
Marqus de S, JP, jpmdesa '@' gmail.com, Instituto de Ingeniera Biomdica, Porto,
Portugal.
Bernardes, J., joaobern '@' med.up.pt, Facultad de Medicina de la Universidad de Oporto,
Portugal.
Ayres de Campos, D., sisporto '@' med.up.pt, Facultad de Medicina de la Universidad de
Oporto, Portugal.
Documentos relevantes:
Ayres de Campos et al. (2000) SisPorto 2.0 Un Programa para el Anlisis Automatizado de
Cardiotocograms. J Matern Fetal Med. 5:311-318
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
1996-05-01
1996-05-01
Caractersticas del Categrico, Nmero de Fecha de
14
atributo: Entero atributos: Donacin
Nmero
77805
Valores de
Tareas asociadas: Clasificacin Yes
perdidos? accesos
Web:
Fuente:
Ronny Kohavi y Barry Becker
Minera de Datos y Visualizacin
Silicon Graphics.
e-mail: ronnyk '@' sgi.com para preguntas.
edad: continuo.
workclass : Privada, Auto- emp - no -inc , Auto- emp -inc , Federal- gov, Local- gov, Estado
-gov , sin sueldo , de Nunca funcion.
fnlwgt : continuo.
Diploma , Some- universidad, 11 , HS- graduado , el profesor de la escuela, Assoc- ACDM
, Assoc- voc , 9 , 7 -8 , 12 , Masters, primero a cuarto , dcimo , Doctorado , 5to-6to ,
Preschool .
educacin - num: continuo.
civil - Estado Civil: Casado - civ - cnyuge , Divorciado, nunca se han casado , Separado,
Viudo, Casado - cnyuge ausente, Casado -AF- cnyuge.
Ocupacin: Tech- apoyo , para naves de reparacin, y de servicio , ventas , - Exec
gestin, Prof- especialidad, Manipuladores - limpiadores, Machine -op- Inspct , - Adm
clerical , Agricultura , pesca, transporte y movimiento, Priv - casa - serv , protector -serv ,
Fuerzas Armadas - .
relacin : Esposa, propia e hijos, marido, no - en - la familia, otro pariente , soltera .
carrera: Blanco , Asia y Pac- Islander, Amer -Indian- esquimal , Otros, Negro .
Sexo : Mujer, Hombre .
de capital - ganancia : continuo.
de capital -loss : continuo.
hora -por- semana : continuo.
- orgenes: Estados- Unidos , Camboya , Inglaterra , Puerto - Rico , Canad, Alemania ,
Outlying -US ( Guam- Islas Vrgenes -etc ) , India , Japn, Grecia, Sur , China, Cuba , Irn,
Honduras , Filipinas , Italia , Polonia , Jamaica , Vietnam, Mxico , Portugal, Irlanda,
Francia, Republica-Dominicana , Laos, Ecuador , Taiwn , Hait , Colombia, Hungra,
Guatemala , Nicaragua , Escocia , Tailandia , Yugoslavia , El- Salvador, Trinadad y
Tobago, Per , Hong , Holand -Pases Bajos .
Documentos relevantes:
Ron Kohavi , " Ampliar los efectivos Precisin de Naive - Bayes clasificadores : un hbrido
de rbol de decisiones " , Actas de la Segunda Conferencia Internacional de
Descubrimiento de Conocimiento y Minera de Datos , 1996
[Web Link]
Ke Wang y Zhou Shiyu y Ada Wai Chee - Fu y Jeffrey Xu Yu. Minera Cambios de
Clasificacin por correspondencia Tracing . SDM . 2003 . [Ver Contexto ] .
Douglas Burdick y Manuel Calimlim y Jason Flannick y Johannes Gehrke y Tomi Yiu .
MAFIA : Un estudio sobre los resultados de Minera mximas conjuntos de elementos
frecuentes . FIMI . 2003 . [Ver Contexto ] .
Eibe Frank y Geoffrey Holmes y Richard Kirkby y Mark A. Hall. Racing Comits de grandes
conjuntos de datos . Discovery Science . 2002 . [Ver Contexto ] .
Dan Pelleg y Andrew W. Moore. Las mezclas de los rectngulos : Interpretables Soft
Clustering . ICML . 2001 . [Ver Contexto ] .
Stephen D. Bay. Multivariante Discretizacin para Set Minera. Conocimiento . Inf . Syst , 3
. 2001 . [Ver Contexto ] .
Zhiyuan Chen y Johannes Gehrke y Flip Korn . Optimizacin de consultas en los sistemas
de base de datos comprimida . Conferencia SIGMOD . 2001 . [Ver Contexto ] .
Jie Cheng y Russell Greiner . Comparando red bayesiana clasificadores . UAI . 1999 . [Ver
Contexto ] .
Ron Kohavi . Ampliar los efectivos Precisin de Naive - Bayes clasificadores : Un hbrido
de rbol de decisiones . KDD . 1996 . [Ver Contexto ] .
David R. Musicant y Alexander Feinberg. Set Active Support Vector de regresin . [Ver
Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Census-Income (KDD) Data Set 2000-03-07
Resumen:
Este conjunto de datos contiene los datos del censo ponderados extrados de las
encuestas de poblacin actuales 1994 y 1995 realizadas por la Oficina del Censo de
EE.UU.
Caractersticas 299285 Social
Nmero de
del Conjunto de Multivariable rea:
instancias:
datos:
2000-03-07
Caractersticas Categrico, Nmero de Fecha de
40
del atributo: Entero atributos: Donacin
Nmero
44502
Valores de
Tareas asociadas: Clasificacin Yes
perdidos? accesos
Web:
Fuente:
Propietario original:
Oficina del Censo de EE.UU.
http://www.census.gov/
Departamento de Comercio de los Estados Unidos
Donante:
Terran Lane y Ronny Kohavi
Minera de Datos y Visualizacin
Silicon Graphics.
terran '@' ecn.purdue.edu, ronnyk '@' sgi.com
Informacin del Conjunto de datos: Este conjunto de datos contiene los datos del censo
ponderados extrados de la Encuesta de la Poblacin Actual de 1994 y 1995 realizadas
por la Oficina del Censo de EE.UU.. Los datos contienen 41 variables relacionadas
demogrficas y de empleo.
Una instancia por lnea con campos delimitados por comas. Hay 199.523 casos en el
archivo de datos y 99762 en el archivo de prueba.
Los datos se dividi en tren / test en aproximadamente 2/3, 1/3 de proporciones utilizando
MIndUtil MineSet-to-mlc de MineSet.
Documentos relevantes:
N/A
Documentos que citan este conjunto de datos
Eibe Frank y Geoffrey Holmes y Richard Kirkby y Mark A. Hall. Racing Comits de grandes
conjuntos de datos. Discovery Science. 2002. [Ver Contexto].
Stephen D. Bay. Multivariante Discretizacin para Set Minera. Conocimiento. Inf. Syst, 3.
2001. [Ver Contexto].
Resumen:
Tarea: predecir el nmero de juntas tricas que experimentan malestar trmico en un vuelo
a 31 grados F dado datos sobre los 23 vuelos previos de transporte.
Fsica
Caractersticas del Nmero de
Multivariable 23 rea:
Conjunto de datos: instancias:
1993-08-05
Caractersticas del Nmero de Fecha de
Entero 4
atributo: atributos: Donacin
Nmero
Valores de
Tareas asociadas: Regresin No 35773
perdidos? accesos
Web:
Fuente:
Propietario original:
David Draper (draper '@' math.ucla.edu)
Universidad de California, Los Angeles
Donante:
David Draper (draper '@' math.ucla.edu)
Informacin del Conjunto de datos: Hay dos bases de datos: ( ambos utilizan el mismo
conjunto de atributos 5 ) :
1 . Erosin Primaria o- ring y / o escape de combustin
2 . Slo primaria erosin o-ring
Las dos bases de datos son idnticos excepto por el segundo atributo del ejemplo 21a
(confirmado por David Draper el 08/05/93 ) .
La motivacin para la recogida de esta base de datos fue la explosin del transbordador
espacial Challenger EE.UU. el 28 de enero de 1986. Una investigacin se produjo en la
fiabilidad del sistema de propulsin del transbordador. La explosin fue finalmente remontar
al fallo de una de las tres articulaciones de campo en uno de los dos cohetes impulsores
slidos. Cada uno de estos seis articulaciones campo incluye dos juntas tricas,
designadas como primaria y secundaria , que fallan cuando los fenmenos llamados
erosin y escape de combustin tanto ocurrir.
La noche antes de la puesta en marcha de una decisin tena que ser hecho con respecto a
la seguridad del lanzamiento . La discusin entre los ingenieros y gerentes que llevan a
esta decisin incluy la preocupacin de que la probabilidad de fallo de las juntas tricas
dependa de la temperatura t en el lanzamiento, que fue forecase ser 31 grados F. Hay
razones fuertes de ingeniera basados en la composicin de la O anillos para apoyar el
juicio de que la probabilidad de falla puede aumentar montonamente como baja la
temperatura . Una otra variable , se realiz la presin a la que s pruebas de seguridad para
el campo se unen fugas , estaba disponible, pero su importancia para el proceso de fracaso
era poco clara.
El artculo de Draper incluye una figura amenazante graficar el nmero de juntas de campo
que experimentan estrs frente a la temperatura del despegue de los 23 vuelos de los
transbordadores anteriores al desastre del Challenger. No Temperatura despegue anterior
estaba bajo 53 grados F. Aunque tremenda extrapolacin debe hacerse a partir de los
datos dados para evaluar el riesgo a 31 grados F , es evidente incluso para el profano " de
prever el riesgo inaceptablemente alto creado por el lanzamiento en 31 grados F. " Para
obtener ms informacin, consulte Draper ( 1993 ) o los otros anlisis previos .
Documentos relevantes:
Draper , D. ( 1993 ) . Evaluacin y propagacin de la incertidumbre del modelo . En Actas
del IV Taller Internacional sobre Inteligencia Artificial y Estadstica (pp. 497-509 ) . Ft. .
Lauderdale, FL : indito .
[Web Link]
Lavine , M. ( 1991 ) . Los problemas en la extrapolacin ilustran con datos de las juntas
tricas del transbordador espacial. Revista de la Asociacin Americana Estadsticos , 86,
919-922 .
Pedro Domingos . Linear -Time Regla de induccin . KDD . 1996 . [Ver Contexto ] .
Mohammed Waleed Kadous y Claude Sammut . La Universidad de Nueva Gales del Sur
Escuela de Ciencias de la Computacin e Ingeniera Temporal Clasificacin : Ampliacin de
la Clasificacin Paradigma para multivariante de series temporales . [Ver Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Character Trajectories Data Set 2008-08-20
Resumen:
Mltiples muestras, etiquetado de las trayectorias de la punta del lpiz registran mientras
la escritura de caracteres individuales. Todas las muestras son del mismo autor, a los
efectos de la extraccin primitiva. Slo se consideraron los personajes con un solo
segmento visible.].
Caractersticas
Nmero de
del Conjunto de Time-Series 2858 rea: Computacin
instancias:
datos:
2008-08-20
Caractersticas Nmero de Fecha de
Real 3
del atributo: atributos: Donacin
Nmero
Clasificacin, Valores de
Tareas asociadas: N/A 59726
Agrupamiento perdidos? accesos
Web:
Fuente:
Ben H Williams
Escuela de Informticos,
Universidad de Edinburgo,
ben.williams '@' ed.ac.uk
Informacin del Conjunto de datos: Los personajes aqu se utilizaron para un estudio de
doctorado en la extraccin primitiva utilizando modelos HMM basados. Los datos
consisten en 2.858 muestras de carcter, que contiene la matriz celular 'mixout'. 'Consts'
La estructura variable contiene una consts.charlabels de campo que proporciona etiquetas
ennummerated para los personajes. consts.key proporciona la clave para cada etiqueta.
Los datos fueron capturados utilizando una tableta WACOM. 3 Dimensiones se
mantuvieron - x, y, y la fuerza de la punta del lpiz. Los datos han sido numricamente
diferenciada y Gauss alisada, con un valor de sigma de 2. De datos fue capturado en
200Hz. Los datos se normaliz con consts.datanorm. Slo se consideraron los personajes
con un solo segmento 'PEN-DOWN'. Segmentacin de caracteres se realiz con un punto
de corte de la fuerza punta del lpiz. Los personajes tambin se han desplazado de
manera que sus perfiles de velocidad mejor coinciden con la media del conjunto.
Documentos relevantes:
B.H. Williams, M.Toussaint, y A. J. Storkey. La extraccin de las primitivas de movimiento
a partir de datos de escritura a mano naturales. En la ICANN, volumen 2, pginas 634-
643, 2006.
N/A
Caractersticas del Nmero de Fecha de
N/A N/A
atributo: atributos: Donacin
Nmero
15954
Valores de
Tareas asociadas: N/A N/A
perdidos? accesos
Web:
Fuente:
1. "chess_flann_new" y "chess_flann_wyl" escrito por flann '@' cs.orst.edu
4 ) chess_vijay_1 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin relacional
de los estados , con cada cuadrado dado un nombre nico y conectividad cuadrado
calculado por una enumeracin de las relaciones conectados. Genera movimientos legales
de primera generacin peusdo mueve entonces eliminando aquellas que resultan en el
jugador que mueve estar en jaque.
5 ) chess_vijay_2 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin geomtrica
de los estados , con cada cuadrado designado por una X , coordenada Y y conectividad
cuadrado calculado por vectores. Genera movimientos legales de primera generacin
peusdo mueve entonces eliminando aquellas que resultan en el jugador que mueve estar
en jaque.
6 ) chess_vijay_3 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin lineal
especial para los estados, con cada cuadrado designado por un solo nmero y conectividad
cuadrado calculado por un nico valor delta. Genera movimientos legales de primera
generacin peusdo mueve entonces eliminando aquellas que resultan en el jugador que
mueve estar en jaque.
Cada teora de dominio incluye un estado de ejemplo denominado estado1 que describe la
posicin del tablero ilustrado como la Figura 4 ( d ) en Flann y Dietterich , " Un estudio de
los mtodos basados en la explicacin para el aprendizaje inductivo " en Aprendizaje
Automtico , 4 187-226 . Ver test_domain_theories de archivos para un ejemplo de carga y
de desarrollo de las teoras de dominio.
Adems de las teoras de dominio , un archivo llamado support_code est incluido que
contiene algunas rutinas de prlogo tiles. Una rutina toma una descripcin genrica de
tablero de ajedrez y un nombre de dominio de la teora , y produce una descripcin del
estado de prlogo adecuado para su uso con la teora del dominio dado. Ver
test_domain_theories de archivos para un ejemplo de la generacin de descripciones de
estado .
Documentos relevantes:
Flann y Dietterich , " Un estudio de los mtodos basados en la explicacin para el
aprendizaje inductivo ", Aprendizaje Automtico , 4 187-226 .
[Web Link]
4 ) chess_vijay_1 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin relacional
de los estados , con cada cuadrado dado un nombre nico y conectividad cuadrado
calculado por una enumeracin de las relaciones conectados. Genera movimientos legales
de primera generacin peusdo mueve entonces eliminando aquellas que resultan en el
jugador que mueve estar en jaque.
5 ) chess_vijay_2 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin geomtrica
de los estados , con cada cuadrado designado por una X , coordenada Y y conectividad
cuadrado calculado por vectores. Genera movimientos legales de primera generacin
peusdo mueve entonces eliminando aquellas que resultan en el jugador que mueve estar
en jaque.
6 ) chess_vijay_3 : Escrito por vijay '@' cs.orst.edu . Emplea una representacin lineal
especial para los estados, con cada cuadrado designado por un solo nmero y conectividad
cuadrado calculado por un nico valor delta. Genera movimientos legales de primera
generacin peusdo mueve entonces eliminando aquellas que resultan en el jugador que
mueve estar en jaque.
Cada teora de dominio incluye un estado de ejemplo denominado estado1 que describe la
posicin del tablero ilustrado como la Figura 4 ( d ) en Flann y Dietterich , " Un estudio de
los mtodos basados en la explicacin para el aprendizaje inductivo " en Aprendizaje
Automtico , 4 187-226 . Ver test_domain_theories de archivos para un ejemplo de carga y
de desarrollo de las teoras de dominio.
Adems de las teoras de dominio , un archivo llamado support_code est incluido que
contiene algunas rutinas de prlogo tiles. Una rutina toma una descripcin genrica de
tablero de ajedrez y un nombre de dominio de la teora , y produce una descripcin del
estado de prlogo adecuado para su uso con la teora del dominio dado. Ver
test_domain_theories de archivos para un ejemplo de la generacin de descripciones de
estado .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
1994-06-01
1994-06-01
Caractersticas del Categrico, Nmero de Fecha de
6
atributo: Entero atributos: Donacin
Nmero
38903
Valores de
Tareas asociadas: Clasificacin No
perdidos? accesos
Web:
Fuente:
Creadores:
Base de datos generada por Michael Bain y Arthur van Hoff en el Instituto Turing , Glasgow
, Reino Unido.
Donante:
Michael Bain ( mike '@' cse.unsw.edu.au ) , AI Lab, Ciencias de la Computacin
Universidad de Nueva Gales del Sur , Sydney 2052 , Australia .
( tel) +61 2 385 3939
(fax) +61 2 663 4576
Informacin del Conjunto de datos: Una programacin lgica inductiva (ILP ) o un marco
de aprendizaje relacional se supone ( Muggleton , 1992 ) . El sistema de aprendizaje se
proporciona con ejemplos de posiciones de ajedrez descritos slo por las coordenadas de
las piezas en el tablero . Tambin se suministra el conocimiento de fondo en forma de
diferencias de fila y columna . Las relaciones necesarias para formar un clasificador
correcta y concisa para el concepto de destino deben ser descubiertos por el sistema de
aprendizaje ( los ejemplos ya proporcionan una definicin extensional completa ) . La tarea
est estrechamente relacionada con ( 1983 ) la aplicacin de Quinlan de ID3 para clasificar
Blanco Rey y Torre contra posiciones Negro Rey y Caballero ( KRKN ) como perdida de 2
capas o perdida de 3 capas . El marco es similar en que el ejemplo se coloca slo los datos
de bajo grado de suministro . Una diferencia importante es que los predicados de fondo
adicionales del tipo suministrado en el estudio KRKN mediante atributos artesanales no se
proporcionan para este dominio KRK .
Los finales de ajedrez son dominios complejos que son enumerable . Bases de datos de
finales son tablas de valores de teora de juegos almacenados para los elementos
enumerados (posiciones jurdicas ) del dominio. Los valores de la teora de juegos
almacenados denota independientemente de si las posiciones se ganan por cada lado , o
incluir tambin la profundidad de la victoria ( nmero de movimientos ) suponiendo play-
minimax ptima. Desde el punto de vista de los experimentos sobre la induccin de
ordenador tales bases de datos proporcionan no slo una fuente de ejemplos , sino tambin
un orculo ( Roycroft , 1986 ) para las reglas de inducidos de prueba . Sin embargo, una
base de datos de final de juego de ajedrez se diferencia de , por ejemplo , una base de
datos relacional que contiene los detalles de las partes y los proveedores en el siguiente
aspecto importante. Los combinatoria del clculo de los valores de la teora de juegos
requeridos para las entradas individuales de posicin independiente seran prohibitivos .
Por lo tanto todas las entradas de la base de datos se generan en un solo proceso iterativo
utilizando el algoritmo ( Thompson , 1986 ) `` estndar '' de copia de seguridad .
Una base de datos KRK fue descrito por Clarke ( 1977 ) . La base de datos actual fue
descrito y utilizado para los experimentos de aprendizaje automtico en Bain ( 1992 ; 1994 )
. Cabe sealar que la base de datos no est garantizada correcta , pero la distribucin de
clase es la misma que la base de datos de Clarke . En ( Bain 1992 ; 1994 ) la tarea era la
clasificacin de puestos en la base de datos como ganaron por blanco en un nmero fijo de
movimientos , en el supuesto juego ptimo por ambos lados. El problema se ha
estructurado en sub- problemas separados por la profundidad de la victoria ordenado
empate , cero, uno , ..., diecisis. Cuando el aprendizaje de profundidad d todos los
ejemplos a profundidades > d se utilizan como negativos. Quinlan ( 1994 ) aplica la hoja de
aprender una solucin completa y correcta para esta tarea .
Documentos relevantes:
M. Bain. "Aprender estrategias ptimas de ajedrez " , ILP 92 : ICOT TM- 1182, S.
Muggleton , Instituto de Tecnologa de Computadoras de Nueva Generacin , Tokio ,
Japn.
[Web Link]
A. J. Roycroft . Base de datos " Orculos '': las caractersticas necesarias y deseables
Revista Internacional de la Asociacin de Ajedrez de ordenador 8 , 2, 1986 100-104 . . . .
[Web Link]
Ira Cohen y Fabio Gagliardi Cozman y Nicu Sebe y Marcelo Cesar Cirelo y Thomas S.
Huang. Semisupervised Aprendizaje de clasificadores : Teora, Algoritmos , y su aplicacin
a la Interaccin Persona-Ordenador . IEEE Trans . Patrn anal . Mach . Intell , 26 . 2004 .
[Ver Contexto ] .
Douglas Burdick y Manuel Calimlim y Jason Flannick y Johannes Gehrke y Tomi Yiu .
MAFIA : Un estudio sobre los resultados de Minera mximas conjuntos de elementos
frecuentes . FIMI . 2003 . [Ver Contexto ] .
Ron Kohavi . Ampliar los efectivos Precisin de Naive - Bayes clasificadores : Un hbrido de
rbol de decisiones . KDD . 1996 . [Ver Contexto ] .
Omid Madani y David M. Pennock y Gary William Flake . Co- validacin: El uso de modelos
Desacuerdo para validar algoritmos de clasificacin . Yahoo! Research Labs . [Ver Contexto
].
Jerome H. Friedman y Ron Kohavi y Youngkeol Yun. Para aparecer en AAAI - 96 rboles
de decisin de Lazy . Departamento de Estadstica y Stanford Linear Accelerator Center de
la Universidad de Stanford. [Ver Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Chess (King-Rook vs. King-Knight) Data Set 1988-10-03
Resumen:
1988-10-03
Caractersticas del Categrico, Nmero de Fecha de
22
atributo: Entero atributos: Donacin
Nmero
22819
Valores de
Tareas asociadas: Clasificacin No
perdidos? accesos
Web:
Fuente:
Base de datos originalmente descrito por Ross Quinlan .
Donante / Coder :
Jeff Schlimmer ( Jeff.Schlimmer '@' cs.cmu.edu )
El cdigo est liberado para experimentacin , slo para uso confidencial. Ver el final del
archivo de comandos de tiempo de carga que generan un archivo de ejemplos en formato
de Quinlan .
Nota: este programa genera duplicados. En una carrera , haba cerca de 370 copias en los
primeros 1.000 casos (es decir, 630 ejemplos diferentes) .
Documentos relevantes:
Quinlan , J. R. ( 1983 ) . Aprender los procedimientos de clasificacin eficaces y su
aplicacin al ajedrez End Games . En R.S. Michalski , J.G. Carbonell , y T.M. Mitchell ( Eds.
) , Aprendizaje Automtico - Un enfoque de Inteligencia Artificial , 463-482 , Palo Alto :
Tioga .
[Web Link]
Documentos que citan este conjunto de datos.
Ira Cohen y Fabio Gagliardi Cozman y Nicu Sebe y Marcelo Cesar Cirelo y Thomas S.
Huang. Semisupervised Aprendizaje de clasificadores : Teora, Algoritmos , y su aplicacin
a la Interaccin Persona-Ordenador . IEEE Trans . Patrn anal . Mach . Intell , 26 . 2004 .
[Ver Contexto ] .
Douglas Burdick y Manuel Calimlim y Jason Flannick y Johannes Gehrke y Tomi Yiu .
MAFIA : Un estudio sobre los resultados de Minera mximas conjuntos de elementos
frecuentes . FIMI . 2003 . [Ver Contexto ] .
Ron Kohavi . Ampliar los efectivos Precisin de Naive - Bayes clasificadores : Un hbrido de
rbol de decisiones . KDD . 1996 . [Ver Contexto ] .
Omid Madani y David M. Pennock y Gary William Flake . Co- validacin: El uso de modelos
Desacuerdo para validar algoritmos de clasificacin . Yahoo! Research Labs . [Ver Contexto
].
Jerome H. Friedman y Ron Kohavi y Youngkeol Yun. Para aparecer en AAAI - 96 rboles
de decisin de Lazy . Departamento de Estadstica y Stanford Linear Accelerator Center de
la Universidad de Stanford. [Ver Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Chess (King-Rook vs. King-Pawn) Data Set 1989-08-01
Resumen:
Rey + Torre contra Rey + Pen en a7 (KRKPA7 generalmente abreviado).
3196 Juego
Caractersticas del Nmero de
Multivariable rea:
Conjunto de datos: instancias:
1989-08-01
Caractersticas del Nmero de Fecha de
Categrico 36
atributo: atributos: Donacin
Nmero
Valores de
Tareas asociadas: Clasificacin No 36451
perdidos? accesos
Web:
Fuente:
Base de datos originalmente generados y descrito por Alen Shapiro.
Donante / Coder :
Rob Holte ( holte '@' uottawa.bitnet ) .
La base de datos fue suministrada a Holte por Peter Clark del Instituto Turing en Glasgow (
pete '@' turing.ac.uk ) .
Documentos relevantes:
Alen D. Shapiro ( 1983,1987 ) , "Induccin estructurada en sistemas expertos " , Addison -
Wesley . Este libro se basa en doctorado de Shapiro Tesis ( 1983 ) en la Universidad de
Edimburgo , titulado " El papel de la induccin estructurado en Sistemas Expertos " .
[Web Link]
Stephen Muggleton ( 1987 ) , " Estructuracin del conocimiento haciendo preguntas " ,
pp.218 - 229 en "El progreso en el aprendizaje de la mquina" , editado por I. Bratko y Nada
Lavrac , Sigma Press, Wilmslow , Inglaterra SK9 5BB .
[Web Link]
Robert C. Holte, Liane Acker, y Bruce W. Porter ( 1989 ) , " Concepto de Aprendizaje y el
problema de las pequeas disyunciones " , Actas de IJCAI . Tambin disponible como
informe tcnico AI89 -106, Departamento de Ciencias de la Computacin, Universidad de
Texas en Austin , Austin , Texas 78712 .
[Web Link]
Documentos que citan este conjunto de datos.
Manuel Oliveira. Biblioteca de formularios de lanzamiento Nombre del Autor : Stanley
Robson de Oliveira Medeiros Ttulo de la tesis: transformacin de datos para la privacidad -
Preservar Data Mining Titulacin: Doctor en Filosofa Ao este ttulo otorgado . Universidad
de Alberta Library . 2005 . [Ver Contexto ] .
Ira Cohen y Fabio Gagliardi Cozman y Nicu Sebe y Marcelo Cesar Cirelo y Thomas S.
Huang. Semisupervised Aprendizaje de clasificadores : Teora, Algoritmos , y su aplicacin
a la Interaccin Persona-Ordenador . IEEE Trans . Patrn anal . Mach . Intell , 26 . 2004 .
[Ver Contexto ] .
Douglas Burdick y Manuel Calimlim y Jason Flannick y Johannes Gehrke y Tomi Yiu .
MAFIA : Un estudio sobre los resultados de Minera mximas conjuntos de elementos
frecuentes . FIMI . 2003 . [Ver Contexto ] .
Ron Kohavi . Ampliar los efectivos Precisin de Naive - Bayes clasificadores : Un hbrido de
rbol de decisiones . KDD . 1996 . [Ver Contexto ] .
Omid Madani y David M. Pennock y Gary William Flake . Co- validacin: El uso de modelos
Desacuerdo para validar algoritmos de clasificacin . Yahoo! Research Labs . [Ver Contexto
].
Jerome H. Friedman y Ron Kohavi y Youngkeol Yun. Para aparecer en AAAI - 96 rboles
de decisin de Lazy . Departamento de Estadstica y Stanford Linear Accelerator Center de
la Universidad de Stanford. [Ver Contexto ] .
Citas:
Por favor, consulte el Repositorio de polticas citacin Aprendizaje Automtico
Clima Modelo de Simulacin 2014-02-12
Crashes Data Set
Resumen: Dada muestras hipercubo latino de 18 valores de los parmetros de entrada
del modelo del clima, predecir los accidentes de simulacin de modelos climticos y
determinar las combinaciones de valores de parmetros que causan los fracasos.
Caractersticas
Nmero de
del Conjunto de N/A 11000000 rea: Fsico
instancias:
datos:
Nmero
Tareas Valores de
Clasificacin N/A 4926
asociadas: perdidos? accesos
Web:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Lucas, DD, Klein, R., Tannahill, J., Ivanova, D., Brandon, S., Domyancic, D., y Zhang, Y.:
Anlisis de la falta de los accidentes de simulacin inducida por parmetros en los
modelos climticos, Geosci. Modelo Dev.. Discuta., 6, 585-623, [Web Link] , 2013.
[ [Web Link] ]
Nube Data Set 2014-02-12
Conjunto de datos Nmero de
Multivariante 1024 rea: Fsico
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: N/A N/A Web 43877
perdidos?
Accesos:
Fuente:
Philippe Collard
California Institute Espacio
A-021 de la UCSD
en La Jolla, CA 92093
(619) 534-6369
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 35280
perdidos?
Accesos:
Fuente:
Propietario original y los donantes: Tom Mitchell Escuela de Ciencias de la
Computacin de la Universidad Carnegie
Mellon tom.mitchell '@' cmu.eduhttp://www.cs.cmu.edu/ ~ tom /
Atributo de la informacin:
N/A
Documentos pertinentes:
T. Mitchell. Aprendizaje Automtico, McGraw Hill, 1997.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 12067
perdidos?
Accesos:
Fuente:
Patrick Marques Ciarelli, pciarelli '@' lcad.inf.ufes.br , Departamento de Ingeniera
Elctrica de la Universidad Federal de Esprito Santo
Elias Oliveira, elias '@' lcad.inf.ufes.br , Departamento de Ciencias de la Informacin de la
Universidad Federal de Esprito Santo
Atributo de la informacin:
En el conjunto de datos hay 857 atributos, 1 atributos con la clase de instancia y 856 con
frecuencia de la palabra:
1. categora: rango 1-9 (entero)
2-857. frecuencia de las palabras: (entero)
Documentos pertinentes:
Patrick Marques Ciarelli, Elias Oliveira, 'Aglomeracin y eliminacin de trminos para la
reduccin de dimensionalidad',
Novena Conferencia Internacional sobre Sistemas Inteligentes de Diseo y Aplicaciones,
pp.547-552, 2009 Patrick Marques Ciarelli, Elias Oliveira, Evandro OT Salles, "un sistema
en evolucin Basado en Probabilstico de red neuronal ", Simposio Brasileo de Redes
Neuronales Artificiales, 2010
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en
blanco.
Bobina de 1999 Datos de la 2014-02-12
competicin Data Set
Resumen : Este conjunto de datos es de la competencia 1999 de Inteligencia
Computacional y Aprendizaje (COIL). Los datos contienen mediciones de las
concentraciones qumicas ro y las densidades de algas.
Conjunto de datos Nmero de
Multivariante 340 rea: Fsico
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: N/A No Web 15942
perdidos?
Accesos:
Fuente:
Propietario original: Erudit Red Europea para la Lgica Fuzzy y Modelizacin de la incertidumbre
en Tecnologa de la Informacin http://www.erudit.de/ Donante: Jens Strackeljan Universidad
Tcnica de Clausthal Instituto de Mecnica Aplicada Graupenstr. 3, 38678 Clausthal-Zellerfeld,
Alemania ATM '@' itm.tu-clausthal.de
Atributo de la informacin:
Hay un total de 340 ejemplos que contienen cada uno 17 valores. Los primeros 11 valores
de cada conjunto de datos son de la temporada, el tamao del ro, la velocidad del fluido y
8 concentraciones qumicas que debern ser tiles para la distribucin de la poblacin de
algas. Los ltimos 8 valores de cada ejemplo son la distribucin de diferentes tipos de
algas. Estos 8 clases son slo una pequea parte de toda la comunidad, pero para la
competencia que limitan el nmero de 7. El valor 0,0 significa que la frecuencia es muy
baja. El conjunto de datos contiene tambin algunos campos vacos que se etiquetan con
el XXXXX cadena. Los datos de entrenamiento se guardan en el archivo:. analysis.data
(formato ASCII) Tabla 1: Estructura del archivo analysis.data A ... K a. .. g CC1, 1 ... CC1,
11 AG1, 1 ... AG1, 7 ... CC200, CC200 1 ... 11 AG200, 1 ... AG200, 7 Explicacin: CCi, j:
concentracin qumica o ro caracterstico AGi, j: frecuencia de algas Los parmetros
qumicos estn etiquetados como A, ..., K. Las columnas de las algas se etiquetan como,
.., g.
Documentos pertinentes:
N/A
Comunidades y el Delito 2014-02-12
Data Set
Resumen : Las comunidades dentro de los Estados Unidos. Los datos combina los
datos socioeconmicos del Censo de EE.UU. de 1990, los datos policiales de la
encuesta de 1990 EE.UU. LEMAS, y los datos de criminalidad del 1995 FBI UCR.
Conjunto de datos Nmero de
Multivariante 1994 rea: Social
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Regresin S Web 64464
perdidos?
Accesos:
Fuente:
Creador: Michael Redmond ( Redmond '@' lasalle.edu ); Ciencias de la Computacin, de
la Universidad La Salle, Philadelphia, PA, 19141, EE.UU.
- entresacado de 1990 del Censo de EE.UU., 1995 EE.UU. FBI Uniform Crime Report,
1990 EE.UU. Administracin de Aplicacin de la Ley y Administrativo Estadsticas
encuesta, disponible en ICPSR en la U de Michigan.
- Donante: Michael Redmond ( Redmond '@' lasalle.edu ); Ciencias de la Computacin, de
la Universidad La Salle, Philadelphia, PA, 19141, EE.UU.
- Fecha: Julio 2009
Atributo de la informacin:
Atributo Informacin: (122 predictivo, 5 no predictiva, 1 gol)
- Estado: estado de los EE.UU. (por nmero) - no se cuentan como predictivos arriba, pero
si se considera, se debe consided nominal (nominal)
- Condado: cdigo numrico para condado - no predictiva, y muchos valores perdidos
(numrico)
- Comunidad: cdigo numrico para la comunidad - no predictiva y muchos valores
perdidos (numricos)
- communityName: nombre de la comunidad - no predictiva - slo para informacin
(cadena)
- doble: nmero de veces para la validacin cruzada no aleatoria de 10 veces,
potencialmente til para la depuracin, pares de pruebas - no predictiva (numrico)
- Poblacin: La poblacin de la comunidad: (numrico - decimal)
- householdsize: personas promedio por hogar (numrico - decimales)
- racepctblack: porcentaje de la poblacin que es afroamericano (numrico - decimal)
- racePctWhite: porcentaje de la poblacin que es de raza blanca (numrico - decimal)
- racePctAsian: porcentaje de la poblacin que es de origen asitico (numrico - decimal)
- racePctHisp: porcentaje de la poblacin que es de origen hispano (numrico - decimal)
- agePct12t21: porcentaje de la poblacin que est en edad de 12 a 21 (numrico -
decimal)
- agePct12t29: porcentaje de la poblacin que est en edad de 12 a 29 (numrico -
decimal)
- agePct16t24: porcentaje de la poblacin que est en edad de 16 a 24 (numrico -
decimal)
- agePct65up: porcentaje de la poblacin que es de 65 aos y ms de edad (numrico -
decimal)
- numbUrban: nmero de personas que viven en reas clasificadas como urbanas
(numrico - decimal)
- pctUrban: porcentaje de personas que viven en zonas clasificadas como urbanas
(numrico - decimal)
- medIncome: ingreso medio por hogar (numrico - decimales)
- pctWWage: porcentaje de hogares con sueldos o salarios ingresos en 1989 (numrico -
decimal)
- pctWFarmSelf: porcentaje de hogares con granja o ingresos por cuenta propia en 1989
(numrico - decimal)
- pctWInvInc: porcentaje de hogares con una inversin / alquiler de ingresos en 1989
(numrico - decimal)
- pctWSocSec : porcentaje de hogares con ingresos de la seguridad social en 1989
(numrico - decimal)
- pctWPubAsst: porcentaje de hogares con ingresos de asistencia pblica en 1989
(numrico - decimal)
- pctWRetire: porcentaje de hogares con ingresos de jubilacin en 1989 (numrico -
decimal)
- medFamInc: ingreso familiar medio (se diferencia de los ingresos familiares de los
hogares no familiares) (numrico - decimal)
- perCapInc: el ingreso per cpita (numrico - decimal)
- whitePerCap: el ingreso per cpita de los caucsicos (numrico - decimal)
- - blackPerCap: el ingreso per cpita de los afroamericanos (numrico - decimal)
- indianPerCap: el ingreso per cpita de los nativos americanos (numrico - decimal)
- AsianPerCap: el ingreso per cpita para personas de origen asitico (numrico -
decimal)
- OtherPerCap: el ingreso per cpita de las personas con "otro" patrimonio (numrico -
decimal)
- HispPerCap: el ingreso per cpita de las personas con herencia hispana (numrico -
decimal)
- NumUnderPov: nmero de personas bajo el nivel de pobreza (numrico - decimal)
- PctPopUnderPov: porcentaje de personas bajo el nivel de pobreza (numrico - decimal)
- PctLess9thGrade: porcentaje de personas de 25 y ms aos con una educacin inferior a
noveno grado (numeric - decimal)
- PctNotHSGrad: porcentaje de personas de 25 y otra vez que no son altos graduados de
la escuela (numrico - decimales)
- PctBSorMore: porcentaje de personas de 25 y ms aos con una licenciatura o estudios
superiores (numrico - decimal)
- PctUnemployed: porcentaje de personas de 16 y ms, en la fuerza de trabajo, y los
desempleados (numrico - decimal)
- PctEmploy: porcentaje de personas de 16 y ms aos que se emplean (numrico -
decimal)
- PctEmplManu: porcentaje de personas de 16 y ms que son empleados en la industria
manufacturera (numrico - decimal)
- PctEmplProfServ: porcentaje de personas de 16 y ms que estn empleados en los
servicios profesionales (numrico - decimal)
- PctOccupManu: porcentaje de personas de 16 o ms aos que se emplean en la
fabricacin (numrico - decimal) # # # # # # # #
- PctOccupMgmtProf: porcentaje de personas de 16 y ms aos que se emplean en la
gestin o profesionales ocupaciones (numrico - decimales)
- MalePctDivorce: Porcentaje de hombres que estn divorciados (numrico - decimal)
- MalePctNevMarr: porcentaje de hombres que nunca se han casado (numrico - decimal)
- FemalePctDiv: porcentaje de mujeres que estn divorciados (numrico - decimal)
- TotalPctDiv: porcentaje de la poblacin que estn divorciados (numrico - decimal)
- PersPerFam: nmero de personas por familia media (numrico - decimal)
- PctFam2Par: porcentaje de familias (con nios) que estn encabezados por dos padres
(numricos - decimales)
- PctKids2Par: porcentaje de nios en la vivienda familiar con dos padres (numrico -
decimales)
- PctYoungKids2Par: Porcentaje de nios de 4 aos en dos hogares monoparentales
(numrico - decimal)
- PctTeen2Par : por ciento de los nios de 12-17 aos en dos hogares monoparentales
(numrico - decimales)
- PctWorkMomYoungKids: Porcentaje de madres de nios de 6 aos en la fuerza laboral
(numrico - decimal)
- PctWorkMom: porcentaje de madres de nios menores de 18 aos en el trabajo fuerza
(numrico - decimal)
- NumIlleg: nmero de nios nacidos de que nunca se casaron (numrico - decimal)
- PctIlleg: porcentaje de nios nacidos de que nunca se casaron (numrico - decimal)
- NumImmig: nmero total de personas que se sabe que son extranjeros nacido (numrico
- decimal)
- PctImmigRecent: porcentaje de _immigrants_ que immigated dentro de los 3 ltimos
aos (numrico - decimal)
- PctImmigRec5: porcentaje de _immigrants_ que immigated en los ltimos 5 aos
(numrico - decimal)
- PctImmigRec8: porcentaje de _immigrants_ que immigated dentro de los ltimos 8 aos
(numrico - decimal)
- PctImmigRec10: porcentaje de _immigrants_ que immigated dentro de los ltimos 10
aos (numrico - decimal)
- PctRecentImmig: ciento de _population_ que han inmigrado en los ltimos 3 aos
(numrico - decimal)
- PctRecImmig5: ciento de _population_ que han inmigrado en los ltimos 5 aos
(numrico - decimal)
- PctRecImmig8: ciento de _population_ que han inmigrado en los ltimos 8 aos
(numrico - decimal)
- PctRecImmig10: ciento de _population_ que han inmigrado en el ltimos 10 aos
(numrico - decimal)
- PctSpeakEnglOnly: ciento de las personas que slo hablan Ingls (numrico - decimal)
- PctNotSpeakEnglWell: ciento de las personas que no hablan Ingls bien (numrico -
decimal)
- PctLargHouseFam: por ciento de los hogares de la familia que son grandes (6 o ms)
(numrico - decimal)
- PctLargHouseOccup: por ciento de todas las casas ocupadas que son grandes (6 o ms
personas) (numrico - decimales)
- PersPerOccupHous: personas promedio por hogar (numrico - decimal)
- - PersPerOwnOccHous: personas promedio por hogar ocupadas por sus propietarios
(numrico - decimal)
- PersPerRentOccHous: personas promedio por hogar de alquiler (numrico - decimal)
- PctPersOwnOccup: Porcentaje de personas en propietario hogares ocupados (numrico
- decimales)
- PctPersDenseHous: Porcentaje de las personas en condiciones de densa (ms de 1
persona por habitacin) (numrico - decimal)
- PctHousLess3BR: porcentaje de viviendas con menos de 3 dormitorios (numrico -
decimales)
- MedNumBR: nmero medio de habitaciones (numrico - decimal)
- HousVacant: nmero de hogares vacantes (numrico - decimales)
- PctHousOccup: por ciento de las viviendas ocupadas (numrico - decimal)
- PctHousOwnOcc: porcentaje de hogares ocupadas por sus propietarios (numrico -
decimal)
- PctVacantBoarded: porcentaje de viviendas desocupadas que est tapiada (numrico -
decimales)
- PctVacMore6Mos: Porcentaje de viviendas desocupadas que ha estado vacante ms de
6 meses (numrico - decimales)
- MedYrHousBuilt: unidades de vivienda construidas aos mediana (numrico - decimal)
- PctHousNoPhone: por ciento de unidades de vivienda ocupadas sin telfono (en 1990,
esto era raro!) (numrico - decimal)
- PctWOFullPlumb: porcentaje de viviendas sin instalaciones sanitarias completas
(numrico - decimales)
- OwnOccLowQuart: vivienda en propiedad - valor cuartil inferior (numrico - decimal)
- OwnOccMedVal : vivienda en propiedad - valor medio (numrico - decimal)
- OwnOccHiQuart: vivienda en propiedad - valor cuartil superior (numrico - decimal)
- RentLowQ: alquiler de viviendas - una renta menor cuartil (numrico - decimal)
- RentMedian: alquiler de viviendas - renta mediana (Censo H32B variable a partir de
archivos STF1A) (numrico - decimal)
- RentHighQ: vivienda de alquiler - alquiler cuartil superior (numrico - decimal)
- MedRent: renta bruta media (Censo H43A variables de archivo STF3A - incluye servicios
pblicos) (numrico - decimal)
- MedRentPctHousInc: renta bruta promedio como porcentaje del ingreso de los hogares
(numrico - decimal)
- MedOwnCostPctInc: propietarios de la mediana de costos como porcentaje de los
ingresos del hogar - para los propietarios con una hipoteca (numrico - decimal)
- MedOwnCostPctIncNoMtg: mediana propietarios de costos como porcentaje de los
ingresos del hogar - para los propietarios sin una hipoteca (numrico - decimal)
- NumInShelters: nmero de personas en refugios para desamparados (numrico -
decimal)
- NumStreet: nmero de personas sin hogar, contados en la calle (numrico - decimales )
- PctForeignBorn: ciento de las personas nacidas en el extranjero (numrico - decimal)
- PctBornSameState: por ciento de las personas nacidas en el mismo estado en el que
viven actualmente (numrico - decimal)
- PctSameHouse85: Porcentaje de personas que viven en la misma casa que en 1985 (5
aos antes) (numrico - decimal)
- PctSameCity85: porcentaje de personas que viven en la misma ciudad que en 1985 (5
aos antes) (numrico - decimal)
- PctSameState85: porcentaje de personas que viven en el mismo estado que en 1985 (5
aos antes) (numrico - decimal)
- LemasSwornFT: nmero de oficiales jurados de tiempo completo de la polica (numrico
- decimales)
- LemasSwFTPerPop: oficiales jurados tiempo completo policiales por 100K poblacin
(numrico - decimales)
- LemasSwFTFieldOps: nmero de jurado los agentes de polica a tiempo completo en las
operaciones de campo (en la calle en lugar de etc administrativa) (numrico - decimal)
- LemasSwFTFieldPerPop: jurada agentes de polica a tiempo completo en las
operaciones de campo (en la calle en lugar de etc administrativa) por 100 mil habitantes
(numrico - decimal)
- LemasTotalReq: total de solicitudes para la polica (numrico - decimal)
- LemasTotReqPerPop: Total de solicitudes para la polica por 100K popuation (numrico -
decimal)
- PolicReqPerOffic: total de solicitudes para la polica por oficial de polica (numrico -
decimales)
- PolicPerPop : policas por 100K poblacin (numrico - decimales)
- RacialMatchCommPol: una medida del partido racial entre la comunidad y la polica. Los
valores altos indican las proporciones en la comunidad y la polica son similares (numrico
- decimal)
- PctPolicWhite: por ciento de la polica que son caucsicos (numrico - decimal)
- PctPolicBlack: por ciento de la polica que son afroamericanos (numrico - decimal)
- PctPolicHisp : por ciento de la polica que son hispanos (numrico - decimal)
- PctPolicAsian: por ciento de la polica que son asitico (numrico - decimal)
- PctPolicMinor: por ciento de la polica que son minora de cualquier tipo (numrico -
decimal)
- OfficAssgnDrugUnits: nmero de los oficiales asignados a las unidades especiales de la
droga (numrico - decimales)
- NumKindsDrugsSeiz: nmero de diferentes tipos de drogas incautadas (numrico -
decimal)
- PolicAveOTWorked: polica promedio de horas extras trabajadas (numrico - decimal)
- LandArea: rea de tierra en millas cuadradas (numrico - decimales)
- PopDens: la densidad de poblacin de personas por milla cuadrada (numrico - decimal)
- PctUsePubTrans: porcentaje de personas que utilizan el transporte pblico para ir al
trabajo (numrico - decimal)
- PolicCars: nmero de coches de polica (numrico - decimales )
- PolicOperBudg: presupuesto operativo de la polica (numrico - decimal)
- LemasPctPolicOnPatr: por ciento de los oficiales juramentados a tiempo completo de la
polica en patrulla (numrico - decimales)
- LemasGangUnitDeploy: unidad de pandillas desplegado (numrico - decimal - pero
realmente ordinal - 0 significa NO , 1 medio YES, 0.5 significa Part Time)
- LemasPctOfficDrugUn: ciento de los oficiales asignados a las unidades de la droga
(numrico - decimales)
- PolicBudgPerPop: el presupuesto operativo de la polica por la poblacin (numrico -
decimal)
- ViolentCrimesPerPop: nmero total de delitos violentos por cada 100K popuation -
atributo (numrico decimal) GOAL (a predecir) Resumen Estadsticas: Min Max Promedio
DE Correl Mediana Moda Missing poblacin 0 1 0.06 0.13 0.37 0.02 0.01 0 householdsize
0 1 0.46 0.16 -0.03 0.44 0.41 0 racepctblack 0 1 0.18 0.25 0.63 0,06 0,01 0 racePctWhite 0
1 0.75 0.24 -0.68 0.85 0.98 0 racePctAsian 0 1 0.15 0.21 0.04 0.07 0.02 0 racePctHisp 0 1
0.14 0.23 0.29 0.04 0.01 0 agePct12t21 0 1 0,42 0,16 0,06 0,4 0,38 0 agePct12t29 0 1
0.49 0.14 0.15 0.48 0.49 0 agePct16t24 0 1 0.34 0.17 0.10 0.29 0.29 0 agePct65up 0 1
0.42 0.18 0.07 0.42 0.47 0 numbUrban 0 1 0,06 0,13 0,36 0,03 0 0 0 1 pctUrban 0.70 0.44
0.08 1 1 0 0 1 medIncome 0.36 0.21 -0.42 0.32 0.23 0 0 pctWWage 1 0,56 0,18 -0,31 0,56
0,58 0 pctWFarmSelf 0 1 0.29 0.20 -0.15 0.23 0.16 0 pctWInvInc 0 1 0.50 0.18 -0.58 0.48
0.41 0 pctWSocSec 0 1 0.47 0.17 0.12 0.475 0.56 0 pctWPubAsst 0 1 0.32 0.22 0.57 0.26
0.1 0 pctWRetire 0 1 0.48 0.17 -0.10 0,47 0,44 0 medFamInc 0 1 0.38 0.20 -0.44 0.33 0.25
0 perCapInc 0 1 0.35 0.19 -0.35 0.3 0.23 0 whitePerCap 0 1 0.37 0.19 -0.21 0.32 0.3
0 blackPerCap 0 1 0.29 0.17 -0.28 0.25 0.18 0 0 1 indianPerCap 0.20 0.16 -0.09 0,17 0 0 0
1 AsianPerCap 0.32 0.20 -0.16 0.28 0.18 0 OtherPerCap 0 1 0.28 0.19 -0.13 0.25 0 1 0 1
HispPerCap 0,39 0,18 -0,24 0,345 0.3 0 NumUnderPov 0 1 0.06 0.13 0.45 0.02 0.01
0 PctPopUnderPov 0 1 0,30 0,23 0,52 0,25 0,08 0 PctLess9thGrade 0 1 0.32 0.21 0.41
0.27 0.19 0 PctNotHSGrad 0 1 0.38 0.20 0.48 0.36 0.39 0 PctBSorMore 0 1 0.36 0.21 -
0.31 0.31 0.18 0 PctUnemployed 0 1 0.36 0.20 0.50 0.32 0.24 0 PctEmploy 0 1 0.50 0.17 -
0.33 0.51 0.56 0 0 PctEmplManu 1 0.40 0.20 -0.04 0.37 0.26 0 PctEmplProfServ 0 1 0.44
0.18 -0.07 0.41 0.36 0 PctOccupManu 0 1 0,39 0,20 0,30 0,37 0,32 0 0 1
PctOccupMgmtProf 0.44 0.19 -0.34 0.4 0.36 0 MalePctDivorce 0 1 0,46 0,18 0,53 0,47
0,56 0 0 1 0,43 MalePctNevMarr 0,18 0,30 0,4 0,38 0 FemalePctDiv 0 1 0,49 0,18 0,56 0,5
0,54 0 TotalPctDiv 0 1 0,49 0,18 0,55 0,5 0,57 0 PersPerFam 0 1 0.49 0.15 0.14 0.47 0.44
0 PctFam2Par 0 1 0.61 0.20 -0.71 0.63 0.7 0 PctKids2Par 0 1 0.62 0.21 -0.74 0.64 0.72
0 PctYoungKids2Par 0 1 0.66 0.22 -0.67 0.7 0.91 0 PctTeen2Par 0 1 0.58 0.19 -0.66 0.61
0.6 0 PctWorkMomYoungKids 0 1 0.50 0.17 -0.02 0.51 0.51 0 PctWorkMom 0 1 0.53 0.18 -
0.15 0.54 0.57 0 NumIlleg 0 1 0.04 0.11 0.47 0.01 0 0 PctIlleg 0 1 0.25 0.23 0.74 0.17 0.09
0 NumImmig 0 1 0,03 0,09 0,29 0,01 0 0 0 1 PctImmigRecent 0,32 0,22 0,17 0,29 0 0 0 1
PctImmigRec5 0,36 0,21 0,22 0,34 0 0 0 1 PctImmigRec8 0,40 0,20 0,25 0,39 0,26 0 0 1
0,43 PctImmigRec10 0,19 0,29 0,43 0,43 0 0 1 PctRecentImmig 0.18 0.24 0.23 0.09 0.01
0 PctRecImmig5 0 1 0.18 0.24 0.25 0.08 0.02 0 PctRecImmig8 0 1 0.18 0.24 0.25 0.09
0.02 0PctRecImmig10 0 1 0.18 0.23 0.26 0.09 0.02 0 PctSpeakEnglOnly 0 1 0.79 0.23 -
0.24 0.87 0.96 0 PctNotSpeakEnglWell 0 1 0.15 0.22 0.30 0.06 0.03 0PctLargHouseFam 0
1 0,27 0,20 0,38 0,2 0,17 0 PctLargHouseOccup 0 1 0.25 0.19 0.29 0.19 0.19
0 PersPerOccupHous 0 1 0.46 0.17 -0.04 0.44 0.37 0PersPerOwnOccHous 0 1 0.49 0.16 -
0.12 0.48 0.45 0 0 PersPerRentOccHous 1 0.40 0.19 0.25 0.36 0.32 0 PctPersOwnOccup
0 1 0.56 0.20 -0.53 0.56 0.54 0PctPersDenseHous 0 1 0.19 0.21 0.45 0.11 0.06
0 PctHousLess3BR 0 1 0,50 0,17 0,47 0,51 0,53 0 0 MedNumBR 1 0,31 0,26 -0,36 0,5 0,5
0 0 1 HousVacant 0,08 0,15 0,42 0,03 0,01 0 0 1 PctHousOccup 0.72 0.19 -0.32 0.77 0.88
0 PctHousOwnOcc 0 1 0.55 0.19 -0.47 0.54 0.52 0 PctVacantBoarded 0 1 0,20 0,22 0,48
0,13 0 0 0 1 PctVacMore6Mos 0.43 0.19 0.02 0.42 0.44 0 MedYrHousBuilt 0 1 0.49 0.23 -
0.11 0.52 0 0 PctHousNoPhone 0 1 0.26 0.24 0.49 0.185 0.01 0 PctWOFullPlumb 0 1 0,24
0,21 0,36 0,19 0 0 0 1 OwnOccLowQuart 0.26 0.22 -0.21 0.18 0.09 0 OwnOccMedVal 0 1
0.26 0.23 -0.19 0.17 0.08 0 OwnOccHiQuart 0 1 0.27 0.24 -0.17 0.18 0.08 0RentLowQ 0 1
0,35 0,22 -0,25 0,31 0,13 0 RentMedian 0 1 0,37 0,21 -0,24 0,33 0,19 0 RentHighQ 0 1
0,42 0,25 -0,23 0,37 1 0 MedRent 0 1 0,38 0,21 -0,24 0,34 0,17 0MedRentPctHousInc 0 1
0,49 0,17 0,33 0,48 0,4 0 MedOwnCostPctInc 0 1 0.45 0.19 0.06 0.45 0.41
0 MedOwnCostPctIncNoMtg 0 1 0.40 0.19 0.05 0.37 0.24 0NumInShelters 0 1 0.03 0.10
0.38 0 0 0 0 1 NumStreet 0.02 0.10 0.34 0 0 0 0 1 PctForeignBorn 0.22 0.23 0.19 0.13 0.03
0 0 1 PctBornSameState 0,61 0,20 - 0,08 0,63 0,78 0 0 1 PctSameHouse85 0.54 0.18 -
0.16 0.54 0.59 0 PctSameCity85 0 1 0,63 0,20 0,08 0,67 0,74 0 0 1 PctSameState85 0.65
0.20 -0.02 0.7 0.79 0 LemasSwornFT 0 1 0,07 0,14 0,34 0,02 0,02
1,675 LemasSwFTPerPop 0 1 0.22 0.16 0.15 0.18 0.2 1675 LemasSwFTFieldOps 0 1 0,92
0,13 -0,33 0,97 0,98 1675 LemasSwFTFieldPerPop 0 1 0,25 0,16 0,16 0,21 0,19
1,675 LemasTotalReq 0 1 0,10 0,16 0,35 0,04 0,02 1,675 LemasTotReqPerPop 0 1 0,22
0,16 0,27 0,17 0,14 1,675 PolicReqPerOffic 0 1 0,34 0,20 0,17 0,29 0,23
1,675 PolicPerPop 0 1 0,22 0,16 0,15 0,18 0,2 1,675 RacialMatchCommPol 0 1 0,69 0,23 -
0,46 0,74 0,78 1675 PctPolicWhite 0 1 0,73 0,22 -0,44 0,78 0,72 1675 PctPolicBlack 0 1
0.22 0.24 0.54 0.12 0 1675 PctPolicHisp 0 1 0.13 0.20 0.12 0.06 0 1675 PctPolicAsian 0 1
0,11 0,23 0,10 0 0 1675 PctPolicMinor 0 1 0,26 0,23 0,49 0,2 0,07
1,675 OfficAssgnDrugUnits 0 1 0,08 0,12 0,34 0,04 0,03 1,675 NumKindsDrugsSeiz 0 1
0,56 0,20 0,13 0,57 0,57 1,675 PolicAveOTWorked 0 1 0,31 0,23 0,03 0,26 0,19
1,675 LandArea 0 1 0,07 0,11 0,20 0,04 0,01 0 0 PopDens 1 0.23 0.20 0.28 0.17 0.09
0 PctUsePubTrans 0 1 0.16 0.23 0.15 0.07 0.01 0 PolicCars 0 1 0,16 0,21 0,38 0,08 0,02
1,675 PolicOperBudg 0 1 0,08 0,14 0,34 0,03 0,02 1,675 LemasPctPolicOnPatr 0 1 0,70
0,21 -0,08 0,75 0,74 1675 LemasGangUnitDeploy 0 1 0,44 0,41 0,12 0.5 0
1675 LemasPctOfficDrugUn 0 1 0.09 0.24 0.35 0 0 0 0 1 PolicBudgPerPop 0,20 0,16 0,10
0,15 0,12 1,675 ViolentCrimesPerPop 0 1 0.24 0.23 1.00 0.15 0.03 0 Distribucin de la
variable objetivo (delitos violentos por Poblacin): Rango de frecuencia 0,000 hasta 0,067
484 0,067- 0,133 420 284 0,133 a 0,200 0,200 hasta 0,267 177 142 0,267-,333 ,333-,400
113 0,400 hasta 0,467 59 76 0,467-0,533 0,533-0,600 57 38 0,600-0,667 0,667-0,733
37 0,733 hasta 0,800 20 0,800 a 0,867 2314 0,867 hasta 0,933 0,933-1,000 50
Documentos pertinentes:
No hay resultados publicados que utilizan esta base de datos especfica. relacionados
conjunto de datos utilizado en Redmond y Baveja 'Una herramienta de software basada en
datos para permitir el intercambio de cooperacin entre los departamentos de polica de la
informacin "en el European Journal of Operational Research 141 (2002) 660-678; Ese
artculo incluye una descripcin de la integracin de las tres fuentes de datos, sin
embargo, estos datos se normaliza de manera diferente y ms / diferentes atributos estn
incluidos.
Cita de pedidos:
Por favor, cite la UCI Machine Learning Repository, mis fuentes y mi artculo
relacionado: Departamento de Comercio, Oficina del Censo de EE.UU., Censo de
Poblacin y Vivienda 1990 Estados Unidos: Compendio de Datos Cinta 1a y 3a (Archivos
de computadora), Departamento de Comercio de EE.UU., Oficina del productor del Censo,
Washington, DC y el Consorcio Interuniversitario para la Investigacin Poltica y Social
Ann Arbor, Michigan. (1992) Departamento de Justicia de EE.UU., Oficina de Estadsticas
de Justicia, Administracin de Aplicacin de la Ley y las estadsticas administrativas
(Archivo de computadora) del Departamento de Comercio, Oficina del Censo de EE.UU.
Productor, Washington, DC y el Consorcio Interuniversitario para la Investigacin Poltica y
Social Ann Arbor, Michigan. (1992) Departamento de Justicia de EE.UU., Oficina Federal
de Investigaciones, Crimen en los Estados Unidos (Archivo de computadora)
(1995) Redmond, MA y A. Baveja: una herramienta de software basado en los Datos de
Activacin Cooperativa intercambio de informacin entre los Departamentos de
Polica. European Journal of Operational Research 141 (2002) 660-678.
Comunidades y el Delito 2014-02-12
unnormalized Data Set
Resumen : Las comunidades en los EE.UU.. Los datos combina los datos socio-
econmicos de los aos 90 del Censo, los datos policiales de la aplicacin de la ley 1990
de gestin y administracin de las estadsticas de la encuesta, y los datos de
criminalidad del 1995 FBI UCR
Conjunto de datos Nmero de
Multivariante 2215 rea: Social
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Regresin S Web 33511
perdidos?
Accesos:
Fuente:
- Creador: Michael Redmond (Redmond 'at' lasalle.edu); Ciencias de la Computacin, de
la Universidad La Salle, Philadelphia, PA, 19141, EE.UU.
- entresacado de 1990 del Censo de EE.UU., 1995 EE.UU. FBI Uniform Crime Report,
1990 Gestin EE.UU. aplicacin de la ley y Administrativo de Estadstica Encuesta,
disponible en ICPSR en la U de Michigan.
- Donante: Michael Redmond (Redmond 'at' lasalle.edu); Ciencias de la Computacin, de
la Universidad La Salle, Philadelphia, PA, 19141, EE.UU.
Atributo de la informacin:
(125 predictivo, 4 no predictiva, 18 gol potencial)
- communityName: Nombre de la comunidad - no predictiva - slo para informacin
(cadena)
- Estado: estado de los EE.UU. (por 2 letras de la abreviatura postal) (nominal)
- countyCode: numrico Cdigo para el condado - no predictiva, y muchos valores
perdidos (numrico)
- communityCode: cdigo numrico para la comunidad - no predictivos y muchos valores
perdidos (numricos)
- aspectos: nmero de validacin no aleatoria 10 cruz doblez plegar, potencialmente til
para depuracin, pruebas pareadas - no predictiva (numrico - entero) - Poblacin: La
poblacin de la comunidad: (numrico - espera que sea entero) - householdsize: personas
promedio por hogar (numrico - decimal) - racepctblack: porcentaje de la poblacin que es
afroamericano (numrico - decimal) - racePctWhite: porcentaje de la poblacin que es
caucsico (numrico - decimal) - racePctAsian: porcentaje de la poblacin que es de
origen asitico (numrico - decimal) - racePctHisp: porcentaje de la poblacin que es de
hispanos patrimonio (numrico - decimal) - agePct12t21: porcentaje de la poblacin que
est en edad de 12 a 21 (numrico - decimal) - agePct12t29: porcentaje de la poblacin
que est en edad de 12 a 29 (numrico - decimal) - agePct16t24: porcentaje de poblacin
que est en edad de 16 a 24 (numrico - decimal) - agePct65up: porcentaje de la
poblacin que es de 65 aos y ms de edad (numrico - decimal) - numbUrban: nmero
de personas que viven en zonas clasificadas como urbanas (numrico - se espera que ser
entero) - pctUrban: porcentaje de personas que viven en zonas clasificadas como urbanas
(numrico - decimal) - medIncome: renta de casa mediana (numrico - puede ser un
nmero entero) - pctWWage: porcentaje de hogares con sueldos o ingresos salariales en
1989 ( numrico - decimal) - pctWFarmSelf: porcentaje de hogares con granja o ingresos
de trabajo por cuenta propia en 1989 (numrico - decimal) - pctWInvInc: porcentaje de
hogares con una inversin / alquiler de ingresos en 1989 (numrico - decimal) -
pctWSocSec: porcentaje de hogares con ingresos de la seguridad social en 1989
(numrico - decimal) - pctWPubAsst: porcentaje de hogares con ingresos de asistencia
pblica en 1989 (numrico - decimal) - pctWRetire: porcentaje de hogares con ingresos de
jubilacin en 1989 (numrico - decimal) - medFamInc: ingreso familiar medio (se diferencia
de los ingresos familiares de los hogares no familiares) (numrico - puede ser un nmero
entero) - perCapInc: el ingreso per cpita (numrico - decimal) - whitePerCap: el ingreso
per cpita de los caucsicos (numrico - decimal) - blackPerCap : el ingreso per cpita de
los afroamericanos (numrico - decimal) el ingreso per cpita para nativos americanos
(numrico - decimales): indianPerCap - - AsianPerCap: el ingreso per cpita de las
personas con herencia asitica (numrico - decimal) - OtherPerCap: per cpita ingresos
para las personas con "otro" patrimonio (numrico - decimal) - HispPerCap: el ingreso per
cpita de las personas con herencia hispana (numrico - decimal) - NumUnderPov:
nmero de personas bajo el nivel de pobreza (numrico - espera que sea entero) - -
PctPopUnderPov: porcentaje de personas bajo el nivel de pobreza (numrico - decimal) -
PctLess9thGrade: porcentaje de personas de 25 y ms aos con una educacin inferior a
9 grado (numrico - decimal) - PctNotHSGrad: porcentaje de personas de 25 y ms que
no lo son los graduados de secundaria (numrico - decimales) - PctBSorMore: porcentaje
de personas de 25 y ms aos con una licenciatura o de educacin superior (numrico -
decimal) - PctUnemployed: Porcentaje de personas de 16 y ms, en la fuerza de trabajo, y
los desempleados (numrico - decimal) - PctEmploy: porcentaje de personas de 16 y ms
aos que se emplean (numrico - decimal) - PctEmplManu: porcentaje de personas de 16
aos en que estn empleados en la industria manufacturera (numrico - decimal) -
PctEmplProfServ: porcentaje de personas de 16 y sobre quin estn empleados en los
servicios profesionales (numrico - decimales) - PctOccupManu: porcentaje de personas
de 16 y ms aos que se emplean en la fabricacin (numrico - decimal) # # # # Ya no
seguro de la diferencia de PctEmplManu - pueden incluir los trabajadores manufactureros
en paro # # # # - PctOccupMgmtProf: porcentaje de personas de 16 o ms aos que se
emplean en la gestin o de las profesiones liberales (numrico - decimales) -
MalePctDivorce: porcentaje de hombres que estn divorciados (numrico - decimal) -
MalePctNevMarr: porcentaje de varones que tienen nunca se cas (numrico - decimal) -
FemalePctDiv: porcentaje de mujeres que se han divorciado (numrico - decimal) -
TotalPctDiv: porcentaje de la poblacin que estn divorciados (numrico - decimal) -
PersPerFam: nmero de personas por familia media (numrico - decimal) - PctFam2Par:
porcentaje de familias (con nios) que se dirigi por dos padres (numrico - decimales) -
PctKids2Par: porcentaje de nios en la vivienda familiar con dos padres (numrico -
decimales) - PctYoungKids2Par: por ciento de los nios 4 y bajo en dos hogares
monoparentales (numrico - decimal) - PctTeen2Par: por ciento de los nios de 12-17
aos en dos hogares monoparentales (numrico - decimales) - PctWorkMomYoungKids:
Porcentaje de madres de nios de 6 aos en la fuerza laboral (numrico - decimales ) -
PctWorkMom: porcentaje de madres de nios menores de 18 aos en la fuerza laboral
(numrico - decimal) - NumKidsBornNeverMar: nmero de nios nacidos de que nunca se
casaron (numrico - espera que sea entero) - PctKidsBornNeverMar: porcentaje de nios
nacidos de nunca casado (numrico - decimal) - NumImmig: nmero total de personas que
se sabe que son nacidos en el extranjero (numrico - espera que sea entero) -
PctImmigRecent: porcentaje de _immigrants_ que immigated dentro de los 3 ltimos aos
(numrico - decimal) - PctImmigRec5: porcentaje de _immigrants_ que immigated en los
ltimos 5 aos (numrico - decimal) - PctImmigRec8: porcentaje de _immigrants_ que
immigated dentro de los ltimos 8 aos (numrico - decimal) - PctImmigRec10: porcentaje
de _immigrants_ que immigated dentro de los ltimos 10 aos (numrico - decimal) -
PctRecentImmig: ciento de _population_ que han inmigrado en los ltimos 3 aos
(numrico - decimal) - PctRecImmig5: ciento de _population_ que han inmigrado en los
ltimos 5 aos (numrico - decimal) - PctRecImmig8: ciento de _population_ que han
inmigrado en el ltimos 8 aos (numrico - decimal) - PctRecImmig10: ciento de
_population_ que han inmigrado en los ltimos 10 aos (numrico - decimal) -
PctSpeakEnglOnly: ciento de las personas que slo hablan Ingls (numrico - decimal) -
PctNotSpeakEnglWell: por ciento de las personas que no hablan Ingls bien (numrico -
decimal) - PctLargHouseFam: por ciento de los hogares de la familia que son grandes (6 o
ms) (numrico - decimal) - PctLargHouseOccup: por ciento de todas las casas ocupadas
que son grandes (6 o ms personas ) (numrico - decimal) - PersPerOccupHous:
personas promedio por hogar (numrico - decimal) - PersPerOwnOccHous: personas
promedio por hogar ocupadas por sus propietarios (numrico - decimal) -
PersPerRentOccHous: personas promedio por hogar de alquiler (numrico - decimal) -
PctPersOwnOccup: ciento de las personas ocupadas por sus propietarios en los hogares
(numrico - decimales) - PctPersDenseHous: por ciento de las personas en condiciones
de densa (ms de 1 persona por habitacin) (numrico - decimal) - PctHousLess3BR:
porcentaje de viviendas con menos de 3 dormitorios (numrico - decimal) - MedNumBR:
mediana del nmero de dormitorios (numrico - decimal) - HousVacant: nmero de
hogares vacantes (numrico - espera que sea entero) - PctHousOccup: porcentaje de
viviendas ocupadas (numrico - decimal) - PctHousOwnOcc : porcentaje de hogares
ocupadas por sus propietarios (numrico - decimal) - PctVacantBoarded: porcentaje de
viviendas desocupadas que est tapiada (numrico - decimal) - PctVacMore6Mos:
porcentaje de viviendas desocupadas que ha estado vacante ms de 6 meses (numrico -
decimales) - - MedYrHousBuilt: unidades de vivienda construidas aos mediana (numrico
- puede ser un nmero entero) - PctHousNoPhone: por ciento de unidades de vivienda
ocupadas sin telfono (en 1990, esto era raro!) (numrico - decimal) - PctWOFullPlumb:
porcentaje de viviendas sin agua corriente completa instalaciones (numrico - decimales) -
OwnOccLowQuart: vivienda en propiedad - valor cuartil inferior (numrico - decimal) -
OwnOccMedVal: vivienda en propiedad - valor medio (numrico - decimal) -
OwnOccHiQuart: vivienda en propiedad - valor cuartil superior (numrico - decimal) -
OwnOccQrange: vivienda en propiedad - diferencia entre el cuartil superior y los valores
ms bajos cuartil (numrico - decimales) - RentLowQ: alquiler de viviendas - una renta
menor cuartil (numrico - decimal) - RentMedian: alquiler de vivienda - renta mediana
(Censo H32B variables de archivo STF1A) (numrico - decimal) - RentHighQ: vivienda de
alquiler - alquiler cuartil superior (numrico - decimal) - RentQrange: alquiler de vivienda -
diferencia entre el cuartil superior e inferior alquiler cuartil (numrico - decimal) - MedRent:
renta bruta media (Censo H43A variables de archivo STF3A - incluye los servicios
pblicos) (numrico - decimales) - MedRentPctHousInc: renta bruta promedio como
porcentaje del ingreso de los hogares (numrico - decimal) - MedOwnCostPctInc:
propietarios de la mediana de costos como porcentaje de los ingresos familiares - para los
propietarios con una hipoteca (numrico - decimales) - MedOwnCostPctIncNoMtg:
propietarios de la mediana de costos como porcentaje de los ingresos del hogar - para los
dueos sin hipoteca (numrico - decimal) - NumInShelters: nmero de personas en
refugios para desamparados (numrico - se espera que como entero) - NumStreet:
nmero de personas sin hogar, contados en la calle (numrico - espera que sea entero) -
PctForeignBorn: ciento de las personas nacidas en el extranjero (numrico - decimales) -
PctBornSameState: por ciento de las personas nacidas en el mismo estado que
Actualmente vive (numrico - decimal) - PctSameHouse85: porcentaje de personas que
viven en la misma casa que en 1985 (5 aos antes) (numrico - decimal) - PctSameCity85:
porcentaje de personas que viven en la misma ciudad que en 1985 (5 aos antes)
(numrico - decimal) - PctSameState85: porcentaje de personas que viven en el mismo
estado que en 1985 (5 aos antes) (numrico - decimal) - LemasSwornFT: nmero de
oficiales jurados tiempo completo de la polica (numrico - que se espera estn entero ) -
LemasSwFTPerPop: oficiales jurados tiempo completo policiales por 100K poblacin
(numrico - decimales) - LemasSwFTFieldOps: nmero de oficiales de polica a tiempo
completo juradas en las operaciones de campo (en la calle en lugar de etc administrativa)
(numrico - que se espera estn entero) - LemasSwFTFieldPerPop: oficiales juramentados
a tiempo completo de la polica en las operaciones de campo (en la calle en lugar de etc
administrativa) por 100 mil habitantes (numrico - decimal) - LemasTotalReq: Total de
solicitudes para la polica (numrico - se espera que estn enteros) -
LemasTotReqPerPop: total de solicitudes para la polica por 100K popuation (numrico -
decimal) - PolicReqPerOffic: total de solicitudes para la polica por oficial de polica
(numrico - decimales) - PolicPerPop: oficiales de polica por 100K poblacin (numrico -
decimales) - RacialMatchCommPol: una medida de la partido racial entre la comunidad y
la polica. Los valores altos indican las proporciones en la comunidad y la polica son
similares (numrico - decimal) - PctPolicWhite: por ciento de la polica que son caucsicos
(numrico - decimal)- PctPolicBlack: por ciento de la polica que son afroamericanos
(numrico - decimal) - PctPolicHisp : por ciento de la polica que son hispanos (numrico -
decimal) - PctPolicAsian: por ciento de la polica que son asitico (numrico - decimal) -
PctPolicMinor: por ciento de la polica que son minora de cualquier tipo (numrico -
decimal) - OfficAssgnDrugUnits: nmero de los oficiales asignados a las unidades
especiales de la droga (numrico - espera que sea entero) - NumKindsDrugsSeiz: nmero
de diferentes tipos de drogas incautadas (numrico - espera que sea entero) -
PolicAveOTWorked: polica promedio de horas extras trabajadas (numrico - decimal) -
LandArea : rea de la tierra en millas cuadradas (numrico - decimal) - PopDens:
densidad de poblacin en las personas por la milla cuadrada (numrico - decimal) -
PctUsePubTrans: porcentaje de personas que utilizan el transporte pblico para ir al
trabajo (numrico - decimal) - PolicCars: nmero de coches de polica (numrico - se
espera que estn enteros) - PolicOperBudg: presupuesto operativo de la polica (numrico
- puede ser un nmero entero) - LemasPctPolicOnPatr: por ciento de los oficiales
juramentados a tiempo completo de la polica en patrulla (numrico - decimales) -
LemasGangUnitDeploy: unidad de pandillas desplegado ( numrico - entero - pero
realmente nominal - 0 significa NO, 10 medios s, 5 significa Part Time) -
LemasPctOfficDrugUn: ciento de los oficiales asignados a las unidades de la droga
(numrico - decimales) - PolicBudgPerPop: el presupuesto operativo de la polica por la
poblacin (numrico - decimales ) - asesinatos: nmero de asesinatos en 1995 (numrico -
se espera que estn enteros) atributo META potencial (que se predijo) - murdPerPop:
nmero de homicidios por cada 100 mil habitantes (numrico - decimal) atributo META
potencial (que se predijo) - - violaciones: nmero de violaciones en 1995 (numrico -
espera que sea entero) atributo META potencial (que se predijo) - rapesPerPop: nmero
de violaciones por 100K poblacin (numrico - decimal) atributo META potencial (que se
predijo) - robos : nmero de robos en 1995 (numrico - espera que sea entero) atributo
META potencial (que se predijo) - robbbPerPop: nmero de atracos por 100K poblacin
(numrico - decimal) atributo META potencial (que se predijo) - asaltos: nmero de las
agresiones en 1995 (numrico - espera que sea entero) atributo potencial GOAL (a ser
predicho) - assaultPerPop: nmero de agresiones por cada 100 mil habitantes (numrico -
decimal) atributo META potencial (que se predijo) - robos: nmero de robos en 1995
(numrico - espera que sea entero) atributo META potencial (que se predijo) -
burglPerPop: nmero de robos por cada 100 mil habitantes (numrico - decimal) atributo
META potencial (que se predijo) - hurtos: nmero de hurtos en 1995 (numrico - espera
que sea entero) atributo META potencial (que se predijo) - larcPerPop: nmero de hurtos
por 100K poblacin (numrico - decimal) atributo META potencial (que se predijo) -
autoTheft: nmero de robos de automviles en 1995 ( numrico - espera que sea entero)
atributo META potencial (que se predijo) - autoTheftPerPop: nmero de robos de
automviles por cada 100 mil habitantes (numrico - decimal) atributo META potencial
(que se predijo) - incendios provocados: nmero de incendios provocados en 1995
(numricos - espera que sea entero) atributo META potencial (que se predijo) -
arsonsPerPop: nmero de incendios provocados por 100K poblacin (numrico - decimal)
atributo META potencial (que se predijo) - ViolentCrimesPerPop: nmero total de delitos
violentos por 100K popuation ( numrico - atributo decimal) GOAL (a predecir) -
nonViolPerPop: nmero total de delitos no violentos por 100K popuation (numrico -
decimal) atributo META potencial (que se predijo) Resumen de estadsticas: variables,
mnimo, mximo, media, Standard Desviacin, Correlacin w / de Estado nominaldel
Objetivo principal Variable (delitos violentos por Poblacin): Rango de frecuencia (en el
lmite va en el compartimiento inferior, por ejemplo, exactamente 200 va enencabezado
por Weka: @ relacin crimeunnormalized @ atributo string communityName @ atribuir
Estado countyCode numrico @ atributo communityCode numricoatributo @ pliegue
numrico
Documentos pertinentes:
Pasado Uso
1. [Redmond y Highley 2009] Redmond, M., y Highley, T., Anlisis Emprico de Case-
Edicin de Enfoques para la Prediccin Numrica. En Conferencia Conjunta Internacional
sobre Informtica, Informacin y Sistemas Ciencias e Ingeniera (Cisse) subconferencia
Conferencia Internacional sobre Sistemas, Ciencias de la Computacin e Ingeniera de
Software (SCSS). Universidad de Bridgeport, CT, diciembre de 2009.
- Todos los datos numricos se normaliz (0-1), ViolentCrimesPerPop se predijo (todos los
dems atributos del crimen fueron eliminados)
- Mejor error absoluto medio obtenido fue de 0.096 (en datos normalizados)
2. [Buczak y Gifford 2010] Buczak, AL y Gifford, CM, Fuzzy Regla Asociacin Minera de
Patrn Comunidad Crimen Discovery. En el Taller de Inteligencia y Seguridad Informtica
de la 16 Conferencia de Descubrimiento de Conocimiento y Minera de Datos (ISI-KDD-
2010). Washington DC. Julio de 2010.
- Los datos se procesaron ms
Cita de pedidos:
Por favor, cite la UCI Machine Learning repositorio y mis fuentes: Departamento de
Comercio de EE.UU., Oficina del Censo, Censo de Poblacin y Vivienda 1990 Estados
Unidos: Compendio de Datos Cinta 1a y 3a (Archivos de computadora), Departamento de
Comercio de EE.UU., Oficina del Censo Productor, Washington, DC y el Consorcio
Interuniversitario para la Investigacin Poltica y Social Ann Arbor,
Michigan. (1992) Departamento de Justicia de EE.UU., Oficina de Estadsticas de Justicia,
Administracin de Aplicacin de la Ley y las estadsticas administrativas (Archivo de
computadora) del Departamento de Comercio, Oficina del Censo de EE.UU. Productor,
Washington, DC y el Consorcio Interuniversitario para la Investigacin Poltica y Social
Ann Arbor, Michigan. (1992) Departamento de Justicia de EE.UU., Oficina Federal de
Investigaciones, Crimen en los Estados Unidos (Archivo de computadora) (1995)
Computer Hardware Data Set 2014-
02-12
Resumen : Los datos relativos rendimiento de la CPU, que se describen en
trminos de su tiempo de ciclo, tamao de la memoria, etc
Conjunto de
Nmero de
datos Multivariante 209 rea: Ordenador
instancias:
Caractersticas:
Nmero
Tareas Valores
Regresin No de Web 72020
asociadas: perdidos?
Accesos:
Fuente:
Creador: Phillip Ein-Dor y Jacob Feldmesser Ein-Dor: Facultad de Administracin
de la Universidad de Tel Aviv, Ramat-Aviv, Tel Aviv, 69978, Israel Donante: David
W. Aha ( aha '@' ics.uci.edu ) (714) 856-8779
Atributo de la informacin:
1. Nombre del proveedor: 30
(consejero, Amdahl, apolo, BASF, bti, burroughs, crd, cambex, cdc, diciembre,
dg, formacin, de cuatro fases, gould, honeywell, HP, IBM, ipl, Magnuson,
microdatos, nas, ncr , nixdorf, Perkin-Elmer, prima, siemens, Sperry,
sratus, wang)
2. Nombre del modelo: muchos smbolos nicos
3. MYCT: tiempo de ciclo de la mquina en nanosegundos (entero)
4. MMIN: memoria principal mnimo en kilobytes (entero)
5. MMAX: memoria principal mxima en kilobytes (entero)
6. CACH: memoria cach en kilobytes (entero)
7. CHMIN: canales mnimos en unidades (entero)
8. CHMAX: canales mximos en unidades (entero)
9. PRP: desempeo relativo publicada (nmero entero)
10. ERP: El rendimiento relativo estimado del artculo original (entero)
Documentos pertinentes:
Ein-Dor y Feldmesser (MCCA 4/87, pp 308-317) Kibler, D. Y Aha,
D. (1988). Prediccin basada en instancia de atributos-valor real. En Actas de la
Conferencia CSCSI (Canadian AI). [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la
citacin
Hormign Resistencia a la 2014-02-12
Compresin Set Data
Resumen : El hormign es el material ms importante en la ingeniera civil. La resistencia
a la compresin de hormign es una funcin altamente no lineal de la edad y los
ingredientes.
Nmero de
Valores
Tareas asociadas: Regresin N / A Web 48104
perdidos?
Accesos:
Fuente:
Propietario original y donante
Prof. I-Cheng Yeh
Departamento de Gestin de la Informacin
de la Universidad Chung-Hua,
Hsin Chu, Taiwn 30067, ROC
e-mail: Icyeh '@' chu.edu.tw
TEL :886-3-5186511 Fecha donado: 03 de agosto 2007
Atributo de la informacin:
Teniendo en cuenta son el nombre de variable, tipo de variable, la unidad de medida y una
breve descripcin. La resistencia a la compresin de hormign es el problema de
regresin. El orden de esta lista se corresponde con el orden de los nmeros a lo largo de
las filas de la base de datos. Nombre - Tipo de datos - Medicin - Descripcin del Cemento
(componente 1) - cuantitativa - kg en una mezcla m3 - Entrada de la variable de alto horno
Escoria (componente 2) - cuantitativas - kg en una mezcla m3 - Entrada de la
variable cenizas volantes (componente 3) - cuantitativa - kg en una mezcla m3 - Variable
de entrada de agua (componente 4) - cuantitativa - kg en una mezcla m3 - Entrada
Variable Superplasticizer (componente 5) - cuantitativas - kg en una mezcla m3 - Entrada
de la variable Agregado Grueso (componente 6) - cuantitativas - kg en una mezcla m3 -
Entrada de la variable Agregado Fino ( Componente 7) - cuantitativas - kg en una mezcla
m3 - Entrada de la variable de la edad - cuantitativa - Da (1 ~ 365) - Variable de
entrada de resistencia a la compresin de hormign - cuantitativos - MPa - Variable de
salida
Documentos pertinentes:
Principal
1. I-Cheng Ye, "Modelado de la resistencia del hormign de alto rendimiento utilizando
redes neuronales artificiales", Cemento y Concrete Research, vol. 28, N 12, pp 1797-
1808 (1998). Otros 2. I-Cheng Ye, "Modelado de Resistencia media del hormign con
Augment-Neurona Networks," J. de Materiales en Ingeniera Civil, ASCE, vol.10, N 4, pp
263-268 (1998). 3. I-Cheng Ye, "Diseo de Alto Rendimiento de mezcla de concreto con
Redes Neuronales," J. de la Computacin en Ingeniera Civil, ASCE, vol. 13, N 1, pp 36-
42 (1999). 4. I-Cheng Ye, "Prediccin de la Fuerza de las cenizas volantes y escorias de
hormign mediante el uso de redes neuronales artificiales", Revista del Instituto Chino de
Ingeniera Civil y hidrulica, vol. 15, N 4, pp 659-663 (2003). 5. I-Cheng Ye, "Una
Metodologa Dosificacin mezcla de cenizas volantes y escorias de hormign utilizando
redes neuronales," Chung Hua Journal of Science and Engineering, vol. 1, N 1, pp 77-84
(2003). 6. Yeh, I-Cheng, "Anlisis de la resistencia del hormign mediante diseo de
experimentos y redes neuronales," Diario de Materiales en Ingeniera Civil, ASCE, Vol.18,
No.4, pp.597-604 (2006).
Cita de pedidos:
NOTA: La reutilizacin de esta base de datos es ilimitado con la retencin de la
notificacin de derechos de autor por el Prof. I-Cheng Yeh y el siguiente artculo
publicado: I-Cheng Ye, "Modelado de la resistencia del hormign de alto rendimiento
utilizando redes neuronales artificiales", Cemento y Hormign de Investigacin, Vol..28, N
12, pp 1797-1808 (1998).
Slump Concrete Test Set Data 2014-
02-12
Resumen : El hormign es un material de gran complejidad. El flujo de
asentamiento del hormign no slo es determinada por el contenido de agua,
pero que tambin est influenciada por otros ingredientes concretos.
Conjunto de
Nmero de
datos Multivariante 103 rea: Ordenador
instancias:
Caractersticas:
Nmero
Tareas Valores N/
Regresin de Web 31206
asociadas: perdidos? A
Accesos:
Fuente:
Donante: I-Cheng Yeh
Email: Icyeh '@' chu.edu.tw
Institucin: Departamento de Gestin de la Informacin de la Universidad Chung-
Hua (Repblica de China)
Otros datos de contacto: Departamento de Gestin de la Informacin de la
Universidad Chung-Hua, Hsin Chu, Taiwn 30067, ROC
Atributo de la informacin:
Las variables de entrada (7) (kg de componente en un M ^ 3 de hormign):
Cemento
de escoria
Fly ash
Agua
SP
. Gruesa Glob
. Fine Glob Variables de salida (3): DEPRESIN (cm) FLOW (cm) 28 das
Resistencia a la compresin (Mpa)
Documentos pertinentes:
1. Yeh, I-Cheng, "Modelado de asentamiento de hormign con cenizas volantes y
superplastificante," Ordenadores y concreto, Vol.5, N 6, 559-572,. 2.008 2. Yeh,
I-Cheng, "Simulacin de asentamiento del concreto usando redes neuronales,"
Materiales de Construccin, Vol.162, N 1, 11-18, 2009. 3. Yeh, I-Cheng,
"Prediccin de la trabajabilidad del hormign mediante diseo de experimentos
para las mezclas, los" ordenadores y concreto, Vol.5, N 1, 1-20, 2008. 4. Yeh, I-
Cheng, "Modelado de flujo bache de hormign utilizando regresiones de segundo
orden y las redes neuronales artificiales," Cemento y Concreto Composites,
Vol.29, N 6, 474-480, 2007. 5. Yeh, I-Cheng, "Explorando modelo asentamiento
del concreto usando redes neuronales artificiales", J. de la Computacin en
Ingeniera Civil, ASCE, Vol.20, N 3, 217-221, 2006.
Cita de pedidos:
Yeh, I-Cheng, "Modelado de flujo bache de hormign utilizando regresiones de
segundo orden y las redes neuronales artificiales," Cemento y Concreto
Composites, Vol.29, N 6, 474-480, 2007.
Congreso Votacin 2014-02-12
Registros Data Set
Resumen : 1,984 unido indicado en el Congreso de voto Records; Clasificar como
republicano o demcrata
Conjunto de datos Nmero de
Multivariante 435 rea: Social
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 57369
perdidos?
Accesos:
Fuente:
Origen: Congressional Quarterly Almanac, Congreso 98o, segunda sesin de 1984,
Volumen XL:. Congressional Quarterly Inc. Washington, DC, 1985 Donante: Jeff
Schlimmer ( Jeffrey.Schlimmer '@' a.gp.cs.cmu.edu )
Atributo de la informacin:
1. Nombre de clase: 2 (demcrata, republicano)
2. discapacitados-bebs: 2 (a, n)
3. -proyecto de agua de costo compartido: 2 (y, n)
4. adopcin-de-la-presupuesto-resolucin: 2 (y, n)
5. mdico-fee-congelante: 2 (y, n)
6. el-salvador-ayuda: 2 (y, n)
7. grupos religiosos-en-escuelas: 2 (a, n)
8. -prueba anti-satlite-ban: 2 (y, n)
9. ayuda a nicaragua-contras: 2 (y, n)
10. mx-misiles: 2 (y, n)
11. inmigracin: 2 (y, n)
12. combustibles sintticos-corporation-reduccin: 2 (y, n)
13. educacin-gasto: 2 (y, n)
14. -superfund-derecho a demandar: 2 (y, n)
15. delito: 2 (y, n)
16. libres de impuestos-exportaciones: 2 (a, n)
17. La administracin de las exportaciones-acto-south-africa: 2 (y, n)
Documentos pertinentes:
Schlimmer, JC (1987). La adquisicin de conceptos a travs del ajuste de
representacin. Tesis doctoral, Departamento de Informacin y Ciencias de la
Computacin de la Universidad de California, Irvine, CA. [Web Link]
Documentos que citan este conjunto de datos 1 :
Aristides Gionis y Heikki Mannila y Panayiotis Tsaparas. Clustering
agregacin . ICDE. 2005. [ Ver Contexto ]. Daniel J. Lizotte y Omid Madani y Russell
Greiner.Presupuestado Aprendizaje de Naive-Bayes clasificadores . UAI. 2003. [ Ver
Contexto ]. Julie Greensmith. Nuevas fronteras para un sistema inmune artificial . Digital
Media Laboratorio de Sistemas HP Laboratorios Bristol. 2003. [ Ver Contexto ]. Jonathan
Eckstein y Peter L. Hammer y Ying Liu y Mikhail Nediak y Bruno Simeone. The Box
Problema mxima y su aplicacin al anlisis de datos . RUTCOR Rutgers Centro de
Investigacin Operativa de la Universidad de Rutgers. 2002. [ Ver Contexto .] . Daniel
Barbar y Yi Li y Julia Couto COOLCAT: un algoritmo basado en la entropa para la
agrupacin categrica . CIKM. 2002. [ Ver Contexto ]. Federico Divina y Elena
Marchiori. Evolutiva Concepto de Aprendizaje . GECCO. 2002. [ Ver Contexto ]. Robert M
francesa y Nick Chater. Uso de ruido para Calcular superficies de error en conexionistas
Redes: un nuevo medio de Reduccin catastrfica olvido . Neural
Computation. 2002. [ Ver Contexto .] . Gary M. Weiss y Haym Hirsh un estudio cuantitativo
de Pequeos disyunciones: Experimentos y Resultados . Departamento de Ciencias de la
Universidad de Rutgers Computer. 2000. [ Ver Contexto ]. Chun-Nan Hsu y Hilmar
Schuschel y Ya-Ting Yang. Enfoque ANNIGMA-Envoltura con Redes Neuronales funcin
de seleccin de Descubrimiento de Conocimiento y Minera de Datos . Instituto de
Ciencias de la Informacin. 1999. [ Ver Contexto ]. Huan Liu y Rudy Setiono. Incremental
Seleccin de caractersticas . Appl. Intell, 9. 1998. [ Ver Contexto ]. Blai Bonet y Hctor
Geffner. Learning Clasificacin y rboles de decisin con POMDPs . ICML. 1998. [ Ver
Contexto ]. Eui-Hong Han y George Karypis y Vipin Kumar y Bamshad
Mobasher. Clustering Basado En Asociacin Regla hypergraphs . DMKD. 1997. [ Ver
Contexto ]. Igor Kononenko y Edvard Simec y Marko Robnik-Sikonja. Superacin de la
miopa de los algoritmos de aprendizaje inductivo con RELIEFF . Appl. Intell, 7. 1997. [ Ver
Contexto ]. Erin J. Bredensteiner y Kristin P. Bennett. Caracterstica Minimizacin en
rboles de decisin . Fundacin Nacional de Ciencia. 1996. [ Ver Contexto ]. Kohavi Ron y
George H. John y Richard Long y David Manley y Karl Pfleger. MLC + +: Una Biblioteca
Aprendizaje Automtico en C ICTAI.. 1994. [ Ver Contexto ]. Rudy Setiono y Huan
Liu. Selector de funciones neuronales de la red . Departamento de Sistemas Informticos y
la Universidad Nacional de Ciencias de la Computacin de Singapur. [ Ver Contexto ]. Igor
Kononenko y Edvard Simec. Induccin de rboles de decisin utilizando
RELIEFF . Universidad de Ljubljana, Facultad de Ingeniera e Informtica Ingeniera
Elctrica. [ Ver Contexto ].Daniel J. Lizotte. Biblioteca Formulario de Autorizacin Nombre
del Autor . Presupuestado Aprendizaje de Naive Bayes clasificadores. [ Ver
Contexto ]. Daniel J. Lizotte y Omid Madani y Russell Greiner. Presupuestado Aprendizaje,
Parte II: La AN # ve-Bayes Case . Departamento de Informtica de la Universidad de
Ciencias de Alberta. [Ver Contexto ]. Chotirat Ann y Dimitrios Gunopulos. Ampliacin de la
Ingenuo clasificador bayesiano: Utilizacin de rboles de decisin para la seleccin de
caractersticas . Departamento de Ciencias de la Computacin de la Universidad de
California. [ Ver Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Connect-4 Conjunto de 2014-02-12
Datos
Resumen : Contiene Connect-4 posiciones
Conjunto de datos Multivariado, Nmero de
67557 rea: Juego
Caractersticas: espacial instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 57714
perdidos?
Accesos:
Fuente:
Los propietarios originales de base de datos: John Tromp
( tromp '@' cwi.nl ) Donante: John Tromp ( tromp '@' cwi.nl )
Atributo de la informacin:
Atributo Informacin: (x = x jugador ha tomado, o = player o ha tomado, b = blanco) La
junta est numerada
como: 6. . . . . . . 5. . . . . . . 4. . . . . . . 3. . . . . . . 2. . . . . . .1. . . . . . . abcdefg 1. a1: {x, o,
b} 2. a2: {x, o, b} 3. a3: {x, o, b} 4. a4: {x, o, b} 5. a5: {x, o, b} 6. a6: {x, o, b} 7. b1: {x, o,
b} 8. b2: {x, o, b} 9. b3: {x, o, b} 10. b4: {x, o, b}11. b5: {x, o, b} 12. b6: {x, o, b} 13. c1: {x, o,
b} 14. c2: {x, o, b} 15. c3: {x, o, b} 16. c4: {x, o, b} 17. c5: {x, o, b} 18. c6: {x, o, b} 19. d1: {x,
o, b} 20. d2: {x, o, b} 21. d3: {x, o, b} 22. d4: {x, o, b} 23. d5: {x, o, b} 24. d6: {x, o, b} 25. e1:
{x, o, b} 26. e2: {x, o, b} 27. e3: {x, o, b} 28. e4: {x, o, b} 29. e5: {x, o, b} 30. e6: {x, o,
b} 31. f1: {x, o, b}32. f2: {x, o, b} 33. f3: {x, o, b} 34. f4: {x, o, b} 35. f5: {x, o, b} 36. f6: {x, o,
b} 37. g1: {x, o, b} 38. g2: {x, o, b} 39. g3: {x, o, b} 40. g4: {x, o, b} 41. g5: {x, o, b} 42. g6:
{x, o, b} 43. Clase: {triunfo, prdida, sorteo}
Documentos pertinentes:
N/A
Documentos que citan este conjunto de datos 1 :
Alan Burton y Paul HJ Kelly. Prediccin de rendimiento de las cargas de trabajo de
paginacin Uso ligero Tracing . PDPI. 2003. [ Ver Contexto ]. Shi Zhong y Weiyu Tang y
Taghi M. Khoshgoftaar. Impulsado filtros de ruido para identificar Mislabeled
datos . Departamento de Ciencias de la Computacin e Ingeniera de la Universidad
Atlntica de la Florida. [ Ver Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Bench conexionista 2014-02-12
(Nettalk Corpus) Conjunto
de datos
Resumen : El archivo "nettalk.data" contiene una lista de 20 008 palabras en ingls,
junto con una transcripcin fontica de cada palabra. La tarea es entrenar una red para
producir los fonemas adecuados
Conjunto de datos Nmero de
Multivariante 20008 rea: N/A
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: N/A N/A Web 17064
perdidos?
Accesos:
Fuente:
El conjunto de datos es una contribucin a la coleccin de referencia en Terry Sejnowski,
ahora en el Instituto Salk y la Universidad de California en San Deigo. El conjunto de datos
fue desarrollada en colaboracin con Charles Rosenberg de Princeton. Aproximadamente
250 horas-persona entr en la creacin y prueba de esta base de datos.
Atributo de la informacin:
El diccionario de pronunciacin se cre para estudiar el proceso de traduccin entre el
Ingls escrito, usando grafemas o letras como unidades, y se habla Ingls, utilizando
fonemas como unidades. El diccionario incluye 20.008 carta alineados y representaciones
fonticas con las tensiones. El diccionario contiene cuatro campos separados de la ficha
de informacin para cada palabra. Los campos son: 1) una representacin carta 2) una
representacin fonolgica 3) el estrs y la estructura silbica4) un entero que indica
palabras extranjeras e irregulares Consulte el archivo readme original para ms
informacin.
Documentos pertinentes:
Sejnowski, TJ, y Rosenberg, CR (1987). "Las redes paralelas que aprenden a pronunciar
el texto Ingls" en Sistemas Complejos, 1, 145-168. [Web Enlace]
Cita de pedidos:
Copyright (C) 1988 por Terrence J. Sejnowski. Por la presente se da al utilizar los datos
incluidos para fines de investigacin no comerciales. Pngase en contacto con la
Universidad Johns Hopkins, Cognitive Science Center, Baltimore MD, EE.UU. para
obtener informacin sobre el uso comercial.
Bench conexionista (Sonar, 2014-02-12
Minas vs Rocks) Conjunto
de datos
Resumen : La tarea es formar una red para discriminar entre las seales de sonar rebot
en un cilindro de metal y los que rebot en una roca ms o menos cilndrica.
Conjunto de datos Nmero de
Multivariante 208 rea: Fsico
Caractersticas: instancias:
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 39017
perdidos? A
Accesos:
Fuente:
El conjunto de datos es una contribucin a la coleccin de referencia en Terry Sejnowski,
ahora en el Instituto Salk y la Universidad de California en San Deigo. El conjunto de datos
fue desarrollada en colaboracin con R. Paul Gorman del Centro de Tecnologa de Allied-
Signal Aerospace.
Atributo de la informacin:
N/A
Documentos pertinentes:
1. Gorman, RP, y Sejnowski, TJ (1988). "Anlisis de Hidden unidades en una red por
capas Entrenados para Objetivos Clasificar Sonar" en Redes Neuronales, vol. 1, pp 75-
89. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Bench conexionista 2014-02-12
(Reconocimiento vocal -
Deterding Datos) Conjunto de
datos
Resumen : altavoz independiente de reconocimiento de los once vocales de estado estacionario
de Ingls britnico utilizando un conjunto de entrenamiento especfico de relaciones de rea de
registro lpc derivada.
Atributo de la informacin:
N/A
Documentos pertinentes:
[Deterding89] DH Deterding, 1989, Universidad de Cambridge, "Normalizacin Portavoz de
reconocimiento automtico de voz", presentado para su doctorado. [Web Link][NiranjanFallside88]
M. Niranjan y F. Fallside, 1988, Universidad de Cambridge Departamento de Ingeniera, "Redes
Neuronales y funciones de base radial en la clasificacin de los patrones del habla estticas ",
CUED/F- [Web Link] . [Web Link] [RenalsRohwer89-ijcnn] Steve Renals y Richard Rohwer,
"Experimentos de clasificacin de fonemas utilizando funciones de base radial", Conferencia
Internacional Conjunta sobre Neural Redes, Washington, 1989. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Mtodo Anticonceptivo 2014-02-12
Conjunto de datos Eleccin
Resumen : Recurso de datos es un subconjunto de la Nacional Indonesia anticonceptivos
Encuesta de Prevalencia del 1987.
Valores Nmero de
Tareas asociadas: Clasificacin No 51715
perdidos? Web Accesos:
Fuente:
Origen: Este conjunto de datos es un subconjunto del 1987 Indonesia Encuesta Nacional de
Prevalencia de Anticonceptivos Creador: Tjen-Sien Lim ( limt '@'stat.wisc.edu ) Donante: Tjen-Sien
Lim ( limt '@' stat.wisc.edu )
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Corel imagen Caractersticas 2014-02-12
del conjunto de datos
Resumen : Este conjunto de datos contiene caractersticas de la imagen extrada de una coleccin
de imgenes de Corel. Cuatro conjuntos de caractersticas estn disponibles en base al
histograma de color, diseo histograma de color, momentos de color, y la co-ocurrencia
Valores Nmero de
Tareas asociadas: N/A N/A 29536
perdidos? Web Accesos:
Fuente:
Propietario original: Michael Ortega-Binderberger Informacin y Ciencias de la Computacin de la
Universidad de California en Irvine Irvine, CA 92697-
3425 EE.UU. miki '@'ics.uci.edu Donante: Kriengkrai Porkaew y Sharad Mehrotra Informacin y
Ciencias de la Computacin de la Universidad de California en Irvine Irvine, CA 92697-
3425EE.UU. nid '@' ics.uci.edu , sharad '@' ics.uci.edu
Atributo de la informacin:
De cada imagen se extrajeron cuatro conjuntos de caractersticas: - Color Histograma - Color
Histograma Layout - Momentos de color - Co-ocurrencia de la textura del color de histograma: 32
dimensiones (8 x 4 = H x S) - espacio de color HSV se divide en 32 sub-espacios (32 colores:. 8
rangos de H y 4 rangos de S) . - el valor de cada dimensin en una ColorHistogram de una imagen
es la densidad de cada color en toda la imagen - Histograma de interseccin (rea de superposicin
entre ColorHistograms de dos imgenes) pueden ser utilizado para medir la similitud entre dos
imgenes. Color de histograma de colocacin: 32 dimensiones (4 x 2 x 4 = H x S x sub-imgenes) -
cada imagen se divide en 4 sub-imgenes (una divisin horizontal y una divisin vertical). - 4x2
color de histograma para cada sub-imagen se calcula.- Histograma Interseccin se puede utilizar
para medir la similitud entre dos imgenes. Momentos Color: 9 dimensiones (3 x 3) - los valores 9
son: (una para cada uno de H, S , y V en el espacio de color HSV) - media, - desviacin estndar, y -
la asimetra. - la distancia eucldea entre los momentos de color de dos imgenes puede ser usado
para representar la pantalla similitud (distancia) entre dos imgenes. co-ocurrencia Textura: 16
dimensiones (4 x 4) - Las imgenes se convierten a 16 imgenes en escala de grises. - co-ocurrencia
en 4 direcciones se computa (horizontal, vertical, y dos direcciones diagonales). 16 los valores son
los siguientes:. (uno para cada sentido) - Momento Angular En segundo lugar, - Contraste, I -
Momento Diferencia nverse, y - Entropa. euclidiana distancia entre ColorMoments de dos
imgenes se puede utilizar para medir la dis- similitud (distancia) entre dos imgenes.
Documentos pertinentes:
Michael Ortega, Yong Rui, Kaushik Chakrabarti, Kriengkrai Porkaew, Sharad Mehrotra, y Thomas S.
Huang, apoyando Clasificado booleanas similitud consultas en MARS, IEEE transacciones en
conocimiento e informacin tcnica, vol. 10, No. 6, pginas 905-925, diciembre de 1998. [Web
Link] Kaushik Chakrabarti y Sharad Mehrotra, El rbol hbrido: una estructura de ndice de alto
dimensional Espacios Estelar, 1999 IEEE Conferencia Internacional sobre Datos de Ingeniera
(ICDE), Pginas 440-447, febrero de 1999. [Web Link] Kriengkrai Porkaew, Kaushik Chakrabarti y
Sharad Mehrotra, Refinamiento de consultas para la recuperacin Multimedia y sus Tcnicas de
Evaluacin en MARS, 1999 ACM Conferencia Multimedia International, Orlando, Florida, octubre
30-noviembre 04, de 1999. [Web Link] Kaushik Chakrabarti, Kriengkrai Porkaew y Sharad Mehrotra,
Refinamiento de consultas Eficiente en bases de datos multimedia, ICDE, 2000 [Web Link]
Cita de pedidos:
Estos datos pueden usarse para fines no comerciales.
Covertype Data Set 2014-02-12
Valores Nmero de
Tareas asociadas: Clasificacin No 56636
perdidos? Web Accesos:
Fuente:
Los propietarios originales de base de datos: Teledeteccin y SIG del programa del Departamento
de Ciencias Forestales Facultad de Recursos Naturales de la Universidad Estatal de Colorado en
Fort Collins, CO 80523 (contacto Jock A. Blackard, jblackard '@' fs.fed.us o el Dr. Denis J.
Dean, denis.dean '@' utdallas.edu ) Los donantes de base de datos: 1. Jock A. Blackard
( jblackard '@' fs.fed.us ) Coordinador de GIS USFS - Inventario Forestal y Anlisis Estacin de
Investigacin de las Montaas Rocosas 507 25th Street Ogden, UT 84401 2. Dr. Denis J. Dean
( denis.dean '@' utdallas.edu ) Profesor del Programa de Geografa y Ciencias
GeoespacialesFacultad de Econmicas, Ciencias Polticas y Poltica 800 West Campbell
Rd Richardson, TX 75080-3021 3. Dr. Charles W. Anderson
( Anderson '@' cs.colostate.edu )Profesor Asociado del Departamento de Ciencias de la
Computacin de la Universidad Estatal de Colorado en Fort Collins, CO 80523 EE.UU.
Atributo de la informacin:
Teniendo en cuenta es el nombre del atributo, el tipo, la unidad de medida y una breve descripcin
de atributos. El tipo de cobertura forestal es el problema de clasificacin. El orden de esta lista se
corresponde con el orden de los nmeros a lo largo de las filas de la base de datos. Nombre / Tipo
Data / Medicin / DescripcinElevacin / cuantitativa / metros / Altitud en metros Aspecto /
cuantitativa / acimut / Aspect en grados de azimut de pendiente / cuantitativos / grados /
Pendiente en grados Horizontal_Distance_To_Hydrology / cuantitativos / metros / Horz Dist al
agua superficial cercana cuenta con Vertical_Distance_To_Hydrology / cuantitativa / metros / Vert
Dist. a entidades ms cercanas aguas superficiales Horizontal_Distance_To_Roadways /
cuantitativos / metros / Horz Dist. a la carretera ms cercanaHillshade_9am / cuantitativa / 0 a 255
index / ndice de sombreado a las 9 am, solsticio de verano Hillshade_Noon / cuantitativa / 0 al
ndice 255 ndice / Sombreado al medioda, solsticio de verano Hillshade_3pm / cuantitativa / 0 al
ndice 255 ndice / Sombreado en 15:00, solsticio de verano Horizontal_Distance_To_Fire_Points /
cuantitativa / metros / Horz Dist. a la ms cercana de incendios forestales puntos de
ignicin Wilderness_Area (4 columnas binarias) / cualitativa / 0 (ausencia) o 1 (presencia) / rea
Wilderness designacin Soil_Type (40 columnas binarias) / cualitativa / 0 (ausencia) o 1 (presencia)
/ Tipo de suelo designacin Cover_Type (7 tipos ) / entero / 1 a 7 / Bosques Tipo Cubierta
designacin
Documentos pertinentes:
Blackard, Jock A. y Denis J. Dean. 2000. "Precisiones comparativos de Redes Neuronales Artificiales
y anlisis discriminante en la prediccin de tipos de cubierta forestal de variables
cartogrficas." Informtica y electrnica en la Agricultura 24 (3) :131-151. [Web Link] Blackard, Jock
A. y Denis J. Dean. 1998. "Precisiones comparativos de Redes Neuronales y Anlisis discriminante
en la prediccin de tipos de cubierta forestal de variables cartogrficas." Segunda Conferencia SIG
Forestal del Sur. Universidad de Georgia. Athens, GA. Pginas 189-199. Blackard, Jock A.
1998. "Comparacin de las redes neuronales y anlisis discriminante en la prediccin de tipos de
cubierta forestal." Ph.D. disertacin. Departamento de Ciencias Forestales. Universidad del Estado
de Colorado. Fort Collins, Colorado. 165 pginas.
Cita de pedidos:
La reutilizacin de esta base de datos es ilimitado con la retencin de la notificacin de derechos
de autor para Jock A. Blackard y la Universidad Estatal de Colorado.
Aprobacin de Crdito Conjunto 2014-02-12
de Datos
Resumen : Esta aplicacin preocupaciones de datos de tarjetas de crdito; buena mezcla de
atributos
Valores Nmero de
Tareas asociadas: Clasificacin S 89181
perdidos? Web Accesos:
Fuente:
(Fuente confidencial) Enviado por quinlan '@' cs.su.oz.au
Datos Conjunto de Informacin:
Este archivo se refiere a las solicitudes de tarjetas de crdito. . Todos los nombres de atributo y los
valores han sido cambiados para smbolos sin sentido para proteger la confidencialidad de los
datos de este conjunto de datos es interesante porque hay una buena mezcla de atributos -
continua nominal con un pequeo nmero de valores y nominal con un nmero mayor de
valores. Tambin hay unos pocos valores perdidos.
Atributo de la informacin:
A1: b, a.
A2:. continua
A3: continuo.
A4:. u, y, l, t
A5:. g, p, gg
A6: c, d, cc, i, j, k, m, r, . q, w, x, e, aa, ff
A7:. v, h, bb, j, n, z, dd, ff, o
A8: continuo.
A9: t, f.
A10: t, f.
A11: . continua
. A12: t, f
. A13: g, p, s
A14: continuo.
A15: continuo.
A16: +, - (atributo de clase)
Documentos pertinentes:
Quinlan. "La simplificacin de los rboles de decisin", Estudios Int J Man-Machine 27, diciembre
1987, pp 221-234. [Web Link] Quinlan. "C4.5: Programas de Aprendizaje Automtico", Morgan
Kaufmann, octubre 1992 [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Bandas Cilindro Conjunto de 2014-02-12
Datos
Resumen : Se utiliza en la toma del rbol de induccin para la mitigacin de los retrasos del
proceso conocido como "bandas de cilindro" en la impresin en huecograbado
Valores Nmero de
Tareas asociadas: Clasificacin S 23324
perdidos? Web Accesos:
Fuente:
Creador: Bob Evans RR Donnelley & Sons Co. Divisin Gallatin Plant 801 Steam Rd Gallatin,
Tennessee 37066-3396 (615) 452 a 5170 Donante: misma
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Diario y Deportes de conjunto 2014-02-12
de datos
Resumen : El conjunto de datos consta de los datos del sensor de movimiento de 19 diarios y
actividades deportivas cada uno realizado por 8 sujetos en su propio estilo durante 5
minutos. Cinco unidades Xsens MTx se usan en el torso, los brazos y las piernas.
Nmero de
Clasificacin, Valores N/
Tareas asociadas: Web 31669
Clustering perdidos? A
Accesos:
Fuente:
Billur Barshan,
Departamento de Ingeniera Elctrica y Electrnica de la Universidad de Bilkent, TR-06800 Bilkent,
Ankara, Turqua
tel: (90-312) 290-2161 Fax: (90-312) 266-4192 e-mail: billur `@ 'ee . bilkent.edu.tr
url: www.ee.bilkent.edu.tr/ ~ billur Kerem
Altun, kerem.altun '@' kemerburgaz.edu.tr , kerem.altun '@' gmail.com
Atributo de la informacin:
Por favor, vea la descripcin detallada anteriormente.
Documentos pertinentes:
Los documentos enumerados en `Las solicitudes de citas 'utilizan este conjunto de datos.
Cita de pedidos:
K. Altun, B. Barshan y O. Tunel,
`` Estudio comparativo sobre la clasificacin de las actividades humanas con sensores inerciales y
magnticos decorativos,''
Pattern Recognition, 43 (10) :3605-3620, octubre de 2010. Barshan, billur y Murat Cihan
Yksek. "Reconociendo diario y actividades deportivas en la Segunda Open Source Machine
Learning Environments Utilizacin de unidades de sensor usado en el cuerpo." The Computer
Journal (2013) K. Altun y B. Barshan, `` reconocimiento actividad humana usando unidades de
sensores inerciales / magnticos,'' Memorias Primer Taller Internacional sobre la comprensin del
comportamiento humano (en conjuncin con el 20 Int.. Conf. sobre Reconocimiento de Patrones),
22 de agosto de 2010, Estambul, Turqua , AA Salah, T. Gevers, N. Sebe, A. Vinciarelli (editores),
HBU 2010, LNCS 6219, pp.38-51, Springer: Berln, Heidelberg, 2010.
Daphnet bloqueo de la marcha 2014-02-12
del conjunto de datos
Resumen : Este conjunto de datos contiene las lecturas comentadas de 3 sensores de aceleracin
en la cadera y la pierna de los pacientes con enfermedad de Parkinson que la experiencia de
congelacin de la marcha (neblina) durante las tareas de a pie.
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 10434
perdidos? A
Accesos:
Fuente:
0Daniel Roggen, Universidad de Newcastle Upon Tyne, Reino Unido, daniel.roggen '@' ieee.org
Meir Plotnik, Sheba Medical Center, IL, meir.plotnikPeleg '@' sheba.health.gov.il
Jeff Hausdorff, Tel Aviv Sourasky Medical Center , jhausdor '@' tlvmc.gov.il
Este conjunto de datos se recogieron como parte de la Daphnet proyecto del 6PM de la UE,
concede nmero 018474-2.
esfuerzo adicional para publicar este conjunto de datos fue financiada en parte por el proyecto del
7PM de la UE Cupido, el nmero de concesin 288516.
Atributo de la informacin:
Cada archivo comprende los datos en un formato de matriz, con una lnea por muestra, y una
columna por canal. Los canales son los siguientes:
Tiempo de la muestra en milisegundos
tobillo (pierna) Aceleracin - Aceleracin de avance horizontal [mg]
tobillo (pierna) de aceleracin - [mg] vertical de
tobillo (pierna) de aceleracin - lateral [mg] horizontal
pierna superior (muslo) aceleracin - La aceleracin horizontal delantera [mg]
pierna superior (muslo) aceleracin - [mg] verticales
pierna superior (muslo) aceleracin - lateral [mg] horizontal
aceleracin Trunk - aceleracin horizontal delantera [mg]
aceleracin Trunk - verticales [mg]
aceleracin Trunk - horizontal lateral [mg]
Anotacin [0, 1 2] El significado de las anotaciones son las siguientes: 0: no forma parte del
experimento. Por ejemplo, los sensores estn instalados en el usuario o el usuario est realizando
actividades no relacionadas con el protocolo experimental, como debriefing 1: experimento, sin
congelar (puede ser cualquiera de stand, caminar, girar) 2: congelacin
Documentos pertinentes:
[1] chlin Marc B , Meir Plotnik, Daniel Roggen, Nir Giladi, Jeffrey M Hausdorff y Gerhard Tr
ster, un sistema usable para Asistir a pie por la enfermedad de Parkinson Patients.Methods de
Informacin en Medicina, 49:1 (88-95 ), 2010
[2] Meir Plotnik, Marc B chlin, Inbal Maidan, Daniel Roggen, Gerhard Tr ster, Nir Giladi y
Jeffrey M Hausdorff, asistencia biofeedback Automatizado de bloqueo de la marcha en pacientes
con enfermedad de Parkinson. Actas de la Sociedad Internacional para la postura y la marcha de
Investigacin (ISPGR), Bologna, Italia, 2009
[3] Meir Plotnik, Marc B chlin, Daniel Roggen, Noit Inbar, Inbal Maidan, Talia Herman, Marina
Brozgol, Eliya Shaviv, Gerhard Tr ster y Jeffrey M de Hausdorff, tratamiento automatizado de
bloqueo de la marcha en la enfermedad de Parkinson utilizando un dispositivo porttil que detecta
automticamente la congelacin. Reunin anual de la Sociedad Neurolgica de Israel, Israel,
pginas 63, 2009
[4] Marc B chlin, Daniel Roggen, Meir Plotnik, Jeffrey M Hausdorff, Nir Giladi y Gerhard Tr
ster, Deteccin en lnea de bloqueo de la marcha en pacientes con enfermedad de Parkinson : Una
caracterizacin del rendimiento. Actas de la 4 Conferencia Internacional sobre Body Area
Networks, 2009
[5] Marc B chlin, Meir Plotnik, Daniel Roggen, Noit Inbar, Nir Giladi, Jeffrey M Hausdorff y
Gerhard Tr ster. Perspectiva de Parkinson los pacientes 'del contexto tecnologa porttil
conscientes de ayuda auditiva. Actas de la 3 Conferencia Internacional sobre Tecnologas de
Pervasive Computing de Salud, 2009
[6] chlin Marc B , Daniel Roggen, Meir Plotnik, Noit Inbar, Inbal Maidan, Talia Herman, Marina
Brozgol, Eliya Shaviv, Nir Giladi, Jeffrey M Hausdorff y Gerhard Tr ster,
Potenciales de una mayor sensibilidad al contexto en asistentes porttiles para los pacientes con
enfermedad de Parkinson s con la congelacin del sndrome de la marcha. Actas del Simposio
Internacional sobre la 13 Wearable Computers (ISCA), pginas 123-130, 2009
[7] Sinziana Mazilu, Michael Hardegger, Zack Zhu, Daniel Roggen, Gerhard Tr ster, Meir Plotnik,
Jeff Hausdorff. Deteccin en lnea de bloqueo de la marcha con Smartphones y Tcnicas de
Aprendizaje Automtico. Sexto Proc Int. Conf. sobre Tecnologas Pervasive Computing de Salud,
2012
Cita de pedidos:
El uso de este conjunto de datos en las publicaciones debe ser reconocido por referencia a la
siguiente publicacin: chlin Marc B , Meir Plotnik, Daniel Roggen, Inbal Maidan, Jeffrey M.
Hausdorff, Nir Giladi, y Gerhard Tr ster, Asistente usable para los pacientes con enfermedad de
Parkinson con el bloqueo de la marcha de los sntomas. IEEE Transactions on Information
Technology en Biomedicina, 14 (2), marzo 2010, pginas 436-446 En este trabajo se describe el
conjunto de datos en los detalles. Se explica el protocolo de adquisicin de datos, el tipo de sensor
utilizado y su colocacin, y la naturaleza de los datos adquiridos. Tambin proporciona resultados
de referencia para la deteccin automtica de bloqueo de la marcha, contra la que los nuevos
mtodos se pueden benchmarking. En particular, se describe la sensibilidad de deteccin /
especificidad para 3 posiciones de sensor y 4 tipos de seales de los sensores se derivan, se analiza
la latencia de deteccin, y proporciona la primera visin especfica vs desempeo independiente
user user. Tambin agradeceramos que nos (informar daniel.roggen '@ ' ieee.org ) de cualquier
publicacin que utiliza este conjunto de datos con fines de referencias cruzadas.
Conjunto de datos para el 2014-02-12
Reconocimiento ADL con
desgastado mueca
Acelermetro Data Set
Resumen : Los registros de 16 voluntarios que realizan 14 Actividades de la Vida Diaria (ADL) en
el ejercicio de un solo acelermetro triaxial de pulsera.
N
Conjunto de datos Multivariado, Nmero de
/ rea: Ordenador
Caractersticas: Time-Series instancias:
A
N
Clasificacin, Valores Nmero de
Tareas asociadas: / 179
Clustering perdidos? Web Accesos:
A
Fuente:
Barbara Bruno, Fulvio Mastrogiovanni, Antonio Sgorbissa
Laboratorium - Laboratorio de Inteligencia Ambiental y Robtica Mvil
DIBRIS, Universidad de Genova,
a travs de Opera Pia 13, 16145, Genova, Italia (IT)
Atributo de la informacin:
Cada archivo en el conjunto de datos sigue la siguiente convencin de nomenclatura:
Acelermetro-[START_TIME] - [ADL] - [VOLUNTARIO]
donde:
- [START_TIME]: fecha y hora del momento de inicio de la grabacin en el formato [AAAA-MM-DD-
HH -MM-SS]
- [HMP]: nombre de la ADL realizado en el ensayo registrado
- [VOLUNTARIO]: cdigo de identificacin del voluntario que realiza el movimiento grabada en el
formato [GN] donde:
- 'g' indica el sexo del voluntario (m -> hombre, f -> hembra)
- 'N' indica el nmero progresivo asociado al voluntario Cada registro de un archivo de informes: -
aceleracin a lo largo del eje x del acelermetro - aceleracin a lo largo del eje y del acelermetro -
aceleracin a lo largo del eje z del acelermetro
Documentos pertinentes:
Una descripcin del sistema de monitoreo de ADL que hemos diseado para trabajar con el
conjunto de datos suministrado se puede encontrar en:
- Bruno, B., Mastrogiovanni, F., Sgorbissa, A., Vernazza, T., Zaccaria, R.:
Anlisis de . algoritmos de reconocimiento de la conducta humana sobre la base de los datos de
aceleracin
en: IEEE Int. Conf. de Robtica y Automatizacin (ICRA),
pp 1602 - 1607 (2013) - Bruno, B., Mastrogiovanni, F., Sgorbissa, A., Vernazza, T., Zaccaria, R.: .
modelizacin de movimiento humano y reconocimiento: Un enfoque computacional En: IEEE Int.
Conf. on Automation Ciencia e Ingeniera (CASE), pp 156-161 (2012)
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
DBWorld correos electrnicos 2014-02-12
Conjunto de datos
Resumen : Contiene 64 e-mails que he recogido de forma manual desde la lista de correo
DBWorld. Se clasifican en: 'anuncia las conferencias "y" todo lo dems ".
Valores N/ Nmero de
Tareas asociadas: Clasificacin 10055
perdidos? A Web Accesos:
Fuente:
Michele Filannino, PhD
de la Universidad de Manchester
Centro de Formacin Doctoral
Email: filannim_AT_cs.man.ac.uk
Atributo de la informacin:
Cada atributo se corresponde con una palabra precisa o madre en todo el vocabulario conjunto de
datos (yo us representacin bolsa-de-palabras).
Documentos pertinentes:
Michele Filannino, 'DBWorld clasificacin de correo electrnico mediante un pequeo corpus',
proyecto de curso de aprendizaje de la mquina, de la Universidad de Manchester, 2011. [ enlace
web ]
Cita de pedidos:
Gracias a ACM-SIGMOD para su servicio de utilidad! :)
Demospongiae Data Set 2014-02-12
Resumen : Las esponjas marinas del dominio de clase clasificacin Demospongiae.
Valores Nmero de
Tareas asociadas: Clasificacin S 20732
perdidos? Web Accesos:
Fuente:
Creador: Eva Armengol, Enric Plaza, Marta Domingo y Iosune Uriz Donante: Santiago Ontan
( santi "@" iiia.csic.es )
Atributo de la informacin:
Cada esponja define 2 atributos:
- Descripcin: que de por s define hasta 6 atributos (caractersticas externas-, ecolgicos-
caractersticas, spikulate-esqueleto, esqueleto fibroso, tractos-esqueleto, y la anatoma). Cada uno
de estos atributos se ha definido atributos adicionales, y as sucesivamente, formando una
estructura de rbol. Las hojas del rbol contienen tanto categorial, as como caractersticas
numricas. Por otra parte, algunas caractersticas son multi-valoradas (es decir, una funcin puede
contener ms de un valor)
- Solucin: Este atributo tiene 4 atributos adicionales definidos (orden, familia, gnero y especie),
que son los atributos de destino. . Como se explic anteriormente, por lo general el "orden" se
utiliza como la clase de destino, ya que no hay suficientes ejemplos para predecir familia, gnero y
especie con precisin los rboles que representan las esponjas varan de tamao: su profundidad
vara formulario 5-8, y su nmero de hojas de 17 a 51. Una representacin grfica de una esponja
se muestra en el archivo de esponja-220.pdf como un ejemplo.
Documentos pertinentes:
Santiago Ontan y Enric Plaza (2009) sobre las medidas de similitud basadas en un refinamiento
de celosa. en ICCBR 2009, LNAI 5650, pp 240-255. Eva Armengol, Enric Plaza: Lazy Induccin de
Descripciones de Aprendizaje Basado en Casos Relacional. ECML 2001: 13-24 Eva Armengol, Enric
Plaza: Evaluacin Similitud de Relational CBR. ICCBR 2001: 44-58
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Dermatologa Data Set 2014-02-12
Resumen : Objetivo para este conjunto de datos es determinar el tipo de enfermedad
Eryhemato-escamosas.
Conjunto de datos Nmero de
Multivariante 366 rea: Vida
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 46383
perdidos?
Accesos:
Fuente:
Los propietarios originales: 1. Nilsel Ilter, MD, Ph.D., de la Universidad de Gazi, Facultad
de Medicina 06510 Ankara, Turqua Telfono: +90 (312) 214 1080 2. H. Altay Gvenir,
PhD,. Bilkent University, Departamento de Ingeniera Informtica y Ciencias de la
Informacin, 06533 Ankara, Turqua Telfono: +90 (312) 266 4133 Email: Gvenir '@'
cs.bilkent.edu.tr Donante: H. Altay Gvenir, Universidad de Bilkent, Departamento de
Ingeniera Informtica y Ciencias de la Informacin, 06533 Ankara, Turqua Telfono: +90
(312) 266 4133 Email: Gvenir '@' cs.bilkent.edu.tr
Atributo de la informacin:
Atributos clnicos: (tomar valores 0, 1, 2, 3, a menos que se indique lo contrario)
1: eritema
2: expansin
3: fronteras definitivas
4: picazn
5: Fenmeno de Koebner
6: ppulas poligonales
7: ppulas foliculares
8: afectacin de la mucosa oral,
9: la rodilla y el codo participacin
10: Participacin del cuero cabelludo
11: antecedentes familiares, (0 o 1)
34: La edad (lineal) histopatolgico Atributos: (toma valores 0, 1, 2, 3) 12: incontinencia de
melanina 13: eosinfilos en el infiltrado 14: PNL se infiltran 15: fibrosis de la dermis papilar
16: exocitosis 17: acantosis 18: hiperqueratosis 19: paraqueratosis 20: Parranda de las
crestas epiteliales 21: elongacin de las crestas epiteliales 22: adelgazamiento de la
epidermis suprapapilar 23: pstula espongiforme 24: microabcess munro 25:
hipergranulosis focal 26: desaparicin de la capa granular 27: vacuolizacin y el dao de la
capa basal 28: espongiosis 29: aparicin de dientes de sierra de retes 30: tapn folicular
cuerno 31: paraqueratosis perifolicular 32: inflamatoria monoluclear inflitrate 33: infiltrado
en banda
Documentos pertinentes:
G. Demiroz, HA Govenir y N. Ilter, "Aprendizaje Diagnstico diferencial de las
enfermedades Eryhemato-escamosas utilizando la funcin de votacin Intervalos",
Inteligencia Aritificial en Medicina [Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 37480
perdidos?
Accesos:
Fuente:
una. Propietarios originales
El conjunto original de datos hemos utilizado es un subconjunto de la conocida Reuters
texto referente categorizacin. Los datos fueron recogidos y etiquetados por Carnegie
Group, Inc. y Reuters, Ltd. en el curso del desarrollo del sistema de categorizacin de
textos interpretan originalmente. Es recibido por el repositorio UCI KDD:
http://kdd.ics.uci.edu/databases/reuters21578/reuters21578.html . David D. Lewis est
organizando recursos valiosos acerca de estos datos (ver
http://www.daviddlewis.com/resources/testcollections/reuters21578/ ). Utilizamos la
"adquisicin corporativa" clase clasificacin de texto pre-procesado por Thorsten Joachims
< thorsten '@' joachims.org >. Los datos son uno de los ejemplos del paquete de software
SVM-Luz., Ver http://svmlight.joachims.org/ . El ejemplo se puede descargar desde
ftp://ftp-ai.cs.uni-dortmund.de/pub/Users/thorsten/svm_light/examples/example1.tar.gz . b.
Donante de base de datos Esta versin de la base de datos estaba preparado para la
variable y la funcin de seleccin de referencia NIPS 2003 por Isabelle Guyon, 955
Creston Road, Berkeley, CA 94708, EE.UU. ( isabelle '@' clopinet.com ).
Atributo de la informacin:
No proporcionamos informacin de la caracterstica para evitar sesgar la seleccin de
caractersticas.
Documentos pertinentes:
Los mejores participantes desafo escribieron artculos recogidos en el libro:
Isabelle Guyon, Steve Gunn, Masoud Nikravesh, Lofti Zadeh (Eds.), extraccin de
caractersticas, fundamentos y aplicaciones. Los estudios en Tolerancia y Soft Computing.
. Physica-Verlag, Springer [Web Link]
Ver tambin:
Isabelle Guyon, et al, 2007. Mtodos de referencia competitivos establecen nuevas
normas para la seleccin de caractersticas de referencia NIPS 2003. Pattern Recognition
Letters 28 (2007) 1438-1444.
y el informe tcnico correspondiente:
Isabelle Guyon, et al. 2006. La seleccin de caractersticas con el paquete CLOP. Informe
Tcnico. [Web Link] .
Cita de pedidos:
Isabelle Guyon, Steve R. Gunn, Asa Ben-Hur, Gideon Dror, 2004. Anlisis de los resultados del
desafo de seleccin de caractersticas NIPS 2003. En:. NIPS [Web Link] .
DGP2 - El Programa de 2014-02-12
Segunda Generacin de
datos Conjunto de datos
Resumen : Genera los dominios de aplicacin sobre la base de parmetros especficos,
la cantidad de caractersticas, y la proporcin de positivos a negativos ejemplos
N
Conjunto de datos Datos- Nmero de
/ rea: N/A
Caractersticas: Generador instancias:
A
N
Caractersticas del Nmero de
Real / Fecha Donado N/A
atributo: atributos:
A
N
Valores Nmero de
Tareas asociadas: N/A / 9932
perdidos? Web Accesos:
A
Fuente:
Powell Benedicto
Universidad de Illinois en Urbana
inductivo Learning Group
Beckman Institute
Urbana, IL 61801
tel: (217) 244-1620
E-mail: Benedict '@' cs.uiuc.edu
Atributo de la informacin:
N/A
Documentos pertinentes:
Benedict, PA, el uso de datos sinttico en Dinmica sesgo de seleccin, Proc. De las
aplicaciones aeroespaciales sexto de Artificial Intelligence Conference, Dayton, Ohio,
octubre de 1990. Ehrenfeucht, A., Haussler, D., Kearns, M, Valiant, L. Un general cota
inferior del nmero de ejemplos necesarios para el aprendizaje. Proc. Teora
Computacional de Aprendizaje, 1988, 139-154. [Web Link] Kononenko, I., Bratko, I.,
Roskar, E., Los experimentos en aprendizaje automtico de las Reglas de Diagnstico
Mdico (Ljubljana, Yugoslavia: Jozef Stefan Institute, 1984). [ Web Link] Michalski, RS,
Mozetic, I., Hong, J., Lavrac, N., El Multiusos Incremental Learning System AQ15 y su
aplicacin de pruebas a Tres Dominios Mdico, Proc. De la V Conferencia Nacional sobre
Inteligencia Artificial, Pp. 1041-1045, Morgan Kaufman, Los Altos, Ca, 1986. [Web Link]
Mitchell, TM La necesidad de sesgos en las generalizaciones de aprendizaje. Informe
Tcnico CBM-TR-117, mayo de 1980. [Web Link] Rendell, LA, una nueva base para los
sistemas de aprendizaje Espacio de Estado y una implementacin exitosa, Inteligencia
Artificial 20 (1983): 369-392. [Web Link] Rendell, LA , Cho, HH El efecto del carcter de
datos sobre el aprendizaje de conceptos empricos en Proc. Quinta Conferencia
Internacional sobre Aplicaciones de la Inteligencia Artificial, de marzo de 1989. [Web Link]
Rendell, LA, Benedict, PA, Cho, HH, Seshu, Mejorar el diseo de los sistemas de reglas
de aprendizaje, Actas de la Sptima Conferencia Internacional sobre Sistemas Expertos y
su Aplicaciones, junio de 1988. Rendell, L., Seshu, R., Aprender conceptos difciles
mediante la induccin constructiva:. marco y razn de ser, la Inteligencia Computacional,
1990 [Web Link] Rendell, LA, Seshu, RM, Tcheng, DK Capas aprendizaje de conceptos y
la gestin de sesgo dinmicamente variable. . Actas de la Dcima Conferencia
Internacional Conjunta sobre Inteligencia Artificial, 1987 [Web Link] Russell, S., Grosof, B.
sesgo declarativa: Una visin general, en P. Benjamin (Ed.), La transformacin de la
representacin y la inductiva Bias. Kluwer Academic Press, 1990. [Web Link] Utgoff, PE
Shift de sesgo para el aprendizaje de conceptos inductivo. Aprendizaje Automtico:. Un
enfoque de Inteligencia Artificial, 1986, III [Web Link] Utgoff, PE, Mitchell, TM, Adquisicin
de sesgo apropiado para el aprendizaje de conceptos inductivo, Proc. Conferencia
Nacional de Inteligencia Artificial, 1982. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Diabetes Data Set 2014-02-12
Resumen : Este conjunto de datos de la diabetes es de AIM '94
Conjunto de datos Multivariado, Nmero de N/
rea: Vida
Caractersticas: Time-Series instancias: A
Nmero de
Valores N/
Tareas asociadas: N/A Web 76913
perdidos? A
Accesos:
Fuente:
Michael Kahn, MD, PhD, de la Universidad de Washington, St. Louis, MO
Atributo de la informacin:
Archivos diabetes consisten en cuatro campos por registro. . Cada campo est separado
por un tabulador y cada registro est separado por un salto de lnea Los nombres y
formato de archivo: (1) Fecha en formato DD-MM-AAAA (2) Tiempo en XX: YY formato (3)
Cdigo (4) Valor
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Documentar comprension 2014-02-12
Data Set
Resumen : Cinco conceptos, expresados como predicados, que se pueden aprender
Conjunto de datos N/ Nmero de N/
rea: N/A
Caractersticas: A instancias: A
Fuente:
Propietario: Donato Malerba Dipartimento di Informatica de la Universidad de Bari a travs
de Orabona 4 70126 Bari - Italia : +39 - 80-5443269 Fax: +39 - 80-5443196 malerbad '@'
vm.csata.it Donante: Donato Malerba
Atributo de la informacin:
N/A
Documentos pertinentes:
Malerba D. Comprensin del documento: un enfoque de aprendizaje de la mquina.
Informe Tcnico, Proyecto Esprit 5203 INTREPID, 4 de marzo de 1993. [Web Link] F.
Esposito, Malerba D., Semeraro G., y Pazzani M. A Machine Learning Approach to
Document Entendimiento. Proc. Segundo Int.. Taller sobre Multiestrategia Learning,
Harpers Ferry, Virginia Occidental, pp 276-292, mayo de 1993. [Web Link] F. Esposito,
Malerba D., y Semeraro G. Aprendizaje reglas contextuales en Lgica de Primer Orden.
Proc. 4 Taller Italiano sobre Aprendizaje Automtico (GAA93), Milan, Italia, pp 111-127,
junio de 1993. Esposito F., Malerba D., y Semeraro G. Automatizado Adquisicin de
Reglas para la comprensin del documento. Proc. de la segunda Int.. Conf. el anlisis de
documentos y reconocimiento, Tsukuba Science City, Japn, pp 650-654, octubre de
1993. [Web Link] Semeraro G., F. Esposito, y Malerba D. Aprendizaje reglas contextuales
para la comprensin del documento. Proc. 10a IEEE Conf. en Inteligencia Artificial para
aplicaciones. San Antonio, Texas, pp 108-115, marzo de 1994. [Web Link] F. Esposito,
Malerba D., y Semeraro G. Multiestrategia Aprendizaje para el reconocimiento de
documentos. Inteligencia Artificial Aplicada, 8, pp 33-84, 1994 [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Dodgers Loop Sensor Data 2014-02-12
Set
Resumen : los datos del sensor de bucle se recogi para el Glendale en la rampa para la
101 Norte Autopista de Los ngeles
Conjunto de datos Multivariado, Nmero de
50400 rea: N/A
Caractersticas: Time-Series instancias:
Nmero de
Valores
Tareas asociadas: N/A S Web 24937
perdidos?
Accesos:
Fuente:
Creador y Mantenedor:
Jon Hutchins
UCI johutchi '@' uci.edu donantes: Pems
Atributo de la informacin:
1. Fecha: MM / DD / AA
2. Tiempo: (H) H: MM (hora militar)
3. Cuenta: Nmero de coches medidos para los ltimos cinco minutos
filas: Cada rebanada de tiempo de cinco minuto se representa mediante una fila Para
archivo de eventos:. 1. Fecha: MM / DD / AA 2. Comience hora del evento: HH: MM: SS
(militar) 3. Hora del evento de finalizacin: HH: MM: SS (militar) 4. Atencin del juego 5.
Equipo visitante 6. W / L puntuacin
Documentos pertinentes:
"La deteccin de eventos de adaptacin a los procesos de Poisson variables en el tiempo"
A. Ihler, J. Hutchins, y P. Smyth
Actas de la 12 Conferencia ACM SIGKDD (KDD-06), agosto de 2006.
Cita de pedidos:
Estas mediciones del sensor de bucle se obtuvieron del Sistema de Medicin del Desempeo
Autopista (PEMS), " [Web Link] "Escriba esta cita si tiene previsto utilizar esta base de datos.
Dorothea Data Set 2014-02-12
Resumen : DOROTHEA es un conjunto de datos de descubrimiento de frmacos. Los
compuestos qumicos representados por las caractersticas moleculares estructurales
deben clasificarse como activo (unin a trombina) o inactivo. Este es uno de los
conjuntos de datos 5 del desafo de seleccin de caractersticas NIPS 2003.
Conjunto de datos Nmero de
Multivariante 1950 rea: Vida
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 34721
perdidos?
Accesos:
Fuente:
Propietarios originales
del conjunto de datos con la que se cre DOROTHEA es una de las KDD (Knowledge
Discovery en Minera de datos) de la Copa de 2001. El conjunto de datos y documentos de
los ganadores del concurso original, estn disponibles en: http://www.cs.wisc.edu/ ~
dpage/kddcup2001 / . DuPont Farmacuticos, nos ayud este conjunto de datos para la
competicin KDD Cup 2001. Todas las publicaciones que se refieren a anlisis de este
conjunto de datos deben reconocer DuPont Pharmaceuticals Research Laboratories y
KDD Cup 2001. b. Donante de base de datos Esta versin de la base de datos estaba
preparado para la variable y la funcin de seleccin de referencia NIPS 2003 por Isabelle
Guyon, 955 Creston Road, Berkeley, CA 94708, EE.UU. ( isabelle '@' clopinet.com ).
Atributo de la informacin:
No proporcionamos informacin de atributos para evitar sesgar la seleccin de
caractersticas.
Documentos pertinentes:
Los mejores participantes desafo escribieron artculos recogidos en el libro:
Isabelle Guyon, Steve Gunn, Masoud Nikravesh, Lofti Zadeh (Eds.), extraccin de
caractersticas, fundamentos y aplicaciones. Los estudios en Tolerancia y Soft Computing.
. Physica-Verlag, Springer [Web Link]
Ver tambin:
Isabelle Guyon, et al, 2007. Mtodos de referencia competitivos establecen nuevas
normas para la seleccin de caractersticas de referencia NIPS 2003. Pattern Recognition
Letters 28 (2007) 1438-1444.
y el informe tcnico correspondiente:
Isabelle Guyon, et al. 2006. La seleccin de caractersticas con el paquete CLOP. Informe
Tcnico. [Web Link] .
Cita de pedidos:
Isabelle Guyon, Steve R. Gunn, Asa Ben-Hur, Gideon Dror, 2004. Anlisis de los resultados del
desafo de seleccin de caractersticas NIPS 2003. En:. NIPS [Web Link] .
Dresses_Attribute_Sales 2014-02-12
Data Set
Resumen : Este conjunto de datos Atributos de vestidos y sus recomendaciones
contienen de acuerdo a sus sales.Sales estn monitorear en base a das alternos.
Conjunto de datos Nmero de
Texto 501 rea: Ordenador
Caractersticas: instancias:
Nmero de
Clasificacin, Valores
Tareas asociadas: S Web 373
Clustering perdidos?
Accesos:
Fuente:
Muhammad Usman y Adeel Ahmed, usman.madspot '@' gmail.com adeel.ahmed92 '@'
gmail.com , la Universidad del Aire, estudiantes de la Universidad del Aire.
Atributo de la informacin:
Estilo: etc FabricType: shafoon, dobby, popline, satn, de punto, jersey, franela, pana, etc
Decoracin: apliques, abalorios, arco, botn, en cascada, cristal, cubierto, embroridary,
plumas, flores, etc Tipo de Patrn: slido, animal, punto, leapard etc Recomendacin: 0,1
Documentos pertinentes:
Nulo
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en blanco.
Los genes de E. coli 2014-02-12
conjunto de datos
Resumen : Los datos que da caractersticas de cada uno (gen potencial) ORF en el
genoma de E. coli. Secuencia, se proporcionan homologa (similitud con otros genes) y la
informacin estructural y la funcin (si se conoce).
Conjunto de datos Nmero de N/
Relacional rea: Vida
Caractersticas: instancias: A
Valores Nmero de
Tareas asociadas: N/A S 16890
perdidos? Web Accesos:
Fuente:
Propietario original y los donantes: Ross D. King Departamento de Ciencias de la
Computacin, Universidad de Gales, Aberystwyth, SY23 3DB, Gales rdk '@' aber.ac.uk
http://users.aber.ac.uk/rdk
Documentos pertinentes:
Rey, R. y Karwath, A. y Clare, A. y Dehaspe, L. (2001). La utilidad de diferentes
representaciones de secuencia de protenas para predecir la clase funcional,
bioinformtica, 17 (5), pginas 445 -. 454 [Web Link]
Cita de pedidos:
Restricciones de uso:
Derechos de Autor 2000 por RD King, A. Karwath, A. Clare, L. Dehaspe No hay restricciones de
uso de datos. Estos datos se proporcionan "tal cual" y sin ninguna garanta expresa o implcita,
incluyendo, pero sin limitarse a, las garantas implcitas de comerciabilidad y adecuacin para un
propsito en particular. Las solicitudes de citas: Por favor, cite King et al. (2000). Agradecimientos:
Este trabajo fue apoyado por las siguientes subvenciones: G78/6609, BIF08765, GR/L62849 y por
PharmaDM, Ambachtenlaan, 54 / D, B-3001 Leuven, Blgica
Teoras EBL Data Domain 2014-02-12
Set
Resumen : Las teoras de dominio pequea escala surtidos
Conjunto de datos N/ Nmero de N/
rea: Ordenador
Caractersticas: A instancias: A
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Ecoli Data Set 2014-02-12
Resumen : Esta informacin contiene sitios de localizacin de protenas
Conjunto de datos Nmero de
Multivariante 336 rea: Vida
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 69048
perdidos?
Accesos:
Fuente:
Creador y Mantenedor: Kenta Nakai Institue de Biologa Molecular y Celular de Osaka,
Universidad 1-3 Yamada-oka, Suita 565 Japn nakai '@' imcb.osaka-u.ac.jp
http://www.imcb.osaka-u. ac.jp / nakai / psort.html \ Donante: Paul Horton ( PaulH '@'
cs.berkeley.edu ) Ver tambin: base de datos de la levadura
Atributo de la informacin:
1. Nombre de secuencia: nmero de acceso de la base de datos SWISS-PROT
2. mcg: mtodo de McGeoch de reconocimiento secuencia seal.
3. gvh: mtodo de Von Heijne de reconocimiento secuencia seal.
4. labio: peptidasa seal II score secuencia consenso de von Heijne. Atributo binario.
5. var: Presencia de carga en N-terminal de las lipoprotenas predichos. Atributo binario.
6. aac: Puntuacin de anlisis discriminante del contenido de aminocidos de las protenas
de membrana externa y periplsmicos.
7. alm1: Puntuacin de la membrana que abarca el programa de prediccin regin ALOM.
8. alm2: Puntuacin de programa ALOM despus de excluir las regiones de seal
escindibles putativo de la secuencia.
Documentos pertinentes:
Paul Horton y Kenta Nakai. "Un Sistema de Clasificacin probabilstico para predecir los
Sitios Celular localizacin de las protenas". Sistemas Inteligentes de Biologa Molecular,
109-115. St. Louis, EE.UU. 1996. [Web Link]
Documentos que citan este conjunto de datos 1 :
Vassilis Athitsos y Stan Sclaroff. Impulsar Clasificadores vecino ms cercano para el
Reconocimiento multiclase . Universidad de Boston Computer Tech Ciencia. Informe n,
2004-006. 2004. [ Ver Contexto ]. Charles X. Ling y Qiang Yang y Jianning Wang y Zhang
Shichao. Los rboles de decisin con un coste mnimo . ICML. 2004. [ Ver Contexto ].
Xiaoyong Chai y Li Deng y Qiang Yang y Charles X. Ling. Prueba sensibles al coste
Clasificacin Naive Bayes . ICDM. 2004. [ Ver Contexto ]. Aik Choon Tan y David Gilbert.
An Empirical Comparacin de las tcnicas de aprendizaje automtico supervisado en
Bioinformtica . APBC. 2003. [ Ver Contexto ]. Mukund Deshpande y George Karypis.
Evaluacin de Tcnicas para la clasificacin de secuencias biolgicas . PAKDD. 2002. [
Ver Contexto ]. Huajie Zhang y Charles X. Ling. un algoritmo mejorado de aprendizaje
para Nave Bayes aumentado . PAKDD. 2001. [ Ver Contexto ]. Mark A. Hall.
Departamento de Ciencias de la Computacin Hamilton, Nueva Zelandia basada en
correlacin Seleccin de caractersticas para el Aprendizaje de la mquina . Doctor en
Filosofa en la Universidad de Waikato. 1999. [ Ver Contexto ]. Paul Horton y Kenta Nakai.
mejor prediccin de la protena celular Sitios de localizacin con el que k vecinos ms
cercanos clasificador . ISMB. 1997. [ Ver Contexto ]. . Seleccin Prototipo para
compuestos Clasificadores vecino ms cercano . Departamento de Informtica
Universidad de Massachusetts. 1997. [ Ver Contexto ]. Chotirat Ann y Dimitrios Gunopulos.
Ampliacin de la Ingenuo clasificador bayesiano: Utilizacin de rboles de decisin para la
seleccin de caractersticas . Departamento de Ciencias de la Computacin de la
Universidad de California. [ Ver Contexto ]. Lois C. Boggess Andrew Watkins y Jon Timmis
y. Sistema Inmune Artificial Reconocimiento (AIRS): Un ImmuneInspired supervisadas
algoritmo de aprendizaje . (Abw5, jt6@kent.ac.uk) Laboratorio de Computacin de la
Universidad de Kent. [ Ver Contexto ]. Gaurav Marwah y Lois C. Boggess. Artificiales
sistemas inmunolgicos para la clasificacin: algunas cuestiones . Departamento de
Ciencias de la Universidad Estatal de Mississippi ordenador. [ Ver Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Sanciones economicas Data 2014-02-12
Set
Resumen : La teora del dominio de las Sanciones Econmicas; Indocumentados
N
Conjunto de datos Domain- Nmero de
/ rea: Financiero
Caractersticas: Theory instancias:
A
N
Caractersticas del Nmero de Fecha
N/A / N/A
atributo: atributos: Donado
A
N Nmero de
Valores
Tareas asociadas: N/A / Web 19862
perdidos?
A Accesos:
Fuente:
Michael Pazzani Pazzani '@' ICS.UCI.EDU
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Base de datos de EEG Data 2014-02-12
Set
Resumen : Esta informacin surge de un gran estudio para examinar las correlaciones
EEG de predisposicin gentica al alcoholismo. Contiene medidas de 64 electrodos
colocados en el cuero cabelludo muestreada a 256 Hz
Conjunto de datos Multivariado, Nmero de
122 rea: Vida
Caractersticas: Time-Series instancias:
Nmero de
Valores
Tareas asociadas: N/A S Web 46744
perdidos?
Accesos:
Fuente:
Propietario original: Henri Begleiter Neurodinmico Laboratory, Universidad Estatal de
Nueva York Centro de Salud de Brooklyn, Nueva York Donante: Lester Ingber POB 06440
Torre Sears de Chicago, IL 60606 Ingber '@' ingber.com http://www.ingber.com/
Atributo de la informacin:
Cada ensayo se almacena en su propio archivo y aparecer en el siguiente formato. #
co2a0000364.rd # 120 ensayos, 64 Chans, 416 muestras de 368 muestras post_stim #
3.906000 msecs uV # S1 obj, ensayo 0 # FP1 chan 0 0 0 FP1 - 8.921 0 FP1 1 -8.433 -
2.574 0 FP1 2 0 FP1 3 5,239 0 FP1 4 11.587 0 14.028 FP1 5 ... Las primeras cuatro lneas
son informacin de encabezado. La lnea 1 contiene el identificador de objeto e indica si el
sujeto era un alcholic (a) o control (c) sin perjuicio de la cuarta carta. La lnea 4 se
identifican las condiciones que coinciden:. Un solo objeto mostrado (S1 obj), objeto 2 se
muestra en una condicin de coincidencia (match S2), y el objeto 2 se muestra en una
condicin de coincidencia no (S2 nomatch) Lnea 5 identifica el inicio de los datos FP1 de
sensor. Las cuatro columnas de datos son: el nmero de prueba, la posicin del sensor,
nmero de muestra (0-255), y el valor del sensor (en micro voltios).
Documentos pertinentes:
XL Zhang, H. Begleiter, B. Porjesz, W. Wang, y A. Litke. (1995). "potenciales evocados
cognitivos durante las tareas de reconocimiento de objetos." Cerebro Research Bulletin.
Volumen 38. Nmero 6. Pginas 531-538. [Web Link] L. Ingber. (1997). Mecnica
estadstica de las interacciones neocortical: indicadores Momenta cannicas de
electroencefalografa. Physical Review E. Volumen 55. Nmero 4. Pginas 4578-4593.
[Web Link] L. Ingber. (1998). Mecnica estadstica de las interacciones neocortical:
entrenamiento y prueba los indicadores Momenta cannicas de EEG. Matemtica
Computer Modelling. Volumen 27. Nmero 3. Pginas 33-64. [Web Link] JG Snodgrss y M.
Vanderwart. (1980). "Un conjunto estandarizado de 260 fotografas: normas para el
acuerdo de nombramiento, la familiaridad y la complejidad visual." Revista de Psicologa
Experimental: Aprendizaje Humano y Memoria. Volumen 6. Pginas 174-215. [Web Link]
Documentos que citan este conjunto de datos 1 :
Peter Sykacek y Stephen J. Roberts. Clasificacin de adaptacin por Variational Kalman
filtrado . PNI. 2002. [ Ver Contexto ]. Stephen D. Bay y Dennis F. Kibler y Michael J.
Pazzani y Padhraic Smyth. KDD El Archivo de los grandes conjuntos de datos para la
investigacin de minera de datos y Experimentacin UCI . SIGKDD Exploraciones, 2.
2000. [ Ver Contexto ].
Cita de pedidos:
No existen restricciones de uso sobre los datos. Reconocimientos para estos datos deben hecha a
Henri Begleiter en el Laboratorio Neurodinmico en la Universidad Estatal del Centro de Salud de
Nueva York en Brooklyn. Parcelas son cortesa de Roger Gabriel.
EEG estado de ojos Data 2014-02-12
Set
Resumen : El conjunto de datos consta de 14 valores de EEG y un valor que indica el
estado de los ojos.
Multivariante,
Conjunto de datos Nmero de
Secuencial, 14980 rea: Vida
Caractersticas: instancias:
Time-Series
Nmero
Valores
Tareas asociadas: Clasificacin N/A de Web 5704
perdidos?
Accesos:
Fuente:
Oliver Roesler, it12148 '@' lehre.dhbw-stuttgart.de , Baden-Wuerttemberg Universidad
Estatal Cooperativo (DHBW), Stuttgart, Alemania
Atributo de la informacin:
Proporcionar informacin acerca de cada atributo del conjunto de datos.
Documentos pertinentes:
Proporcionar referencias a los documentos que han citado este conjunto de datos en el
pasado (si los hay).
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en blanco.
Fuente:
Propietario original: Pacific Marine Environmental Laboratory Administracin Nacional
Ocenica y Atmosfrica del Departamento de Comercio de EE.UU.
http://www.pmel.noaa.gov/ Donante: Dr. Di Cocine Departamento de Estadstica de la
Universidad Estatal de Iowa dicook '@' iastate.edu http:// www.public.iastate.edu/ ~ dicook
/
Atributo de la informacin:
Los datos consisten en las siguientes variables: fecha, latitud, longitud, vientos zonales
(oeste <0, Medio> 0), vientos meridionales (sur <0, norte> 0), humedad relativa,
temperatura del aire, la temperatura superficial del mar y temperaturas subsuperficiales
hasta una profundidad de 500 metros. Datos tomados de las boyas desde tan temprano
como 1980 para algunas ubicaciones. Otros datos que fueron tomadas en diversos
lugares son la precipitacin, la radiacin solar, los niveles actuales, y las temperaturas
subsuperficiales. La latitud y la longitud de los datos mostraron que las boyas se movan a
diferentes lugares. Los valores de latitud se mantuvieron dentro de un grado de la posicin
aproximada. Sin embargo, los valores de longitud eran a veces hasta cinco grados con
respecto a la ubicacin aproximada. Mirando los datos de viento, tanto de los vientos
zonales y meridionales fluctuaron entre -10 m / s y 10 m / s. La trama de las dos variables
de viento no mostr una relacin lineal. Adems, las parcelas de cada variable viento
contra los otros tres datos meteorolgical no mostraron relaciones lineales. Los valores de
humedad relativa en el Pacfico tropical eran por lo general entre el 70% y el 90%. Tanto la
temperatura del aire y la temperatura superficial del mar fluctuaron entre 20 y 30 grados
Celcius. La trama de las dos variables de temperaturas muestra una relacin lineal positiva
existente. Las dos temperaturas cuando cada uno en funcin del tiempo tambin tienen
diseos de parcelas similares. Los grficos de las otras variables meteorolgicas en contra
de las variables de temperatura no mostraron relacin lineal. Hay valores que faltan en los
datos. Como se mencion anteriormente, no todas las boyas son capaces de medir las
corrientes, las precipitaciones y la radiacin solar, por lo que estos valores estn
perdiendo depende de la boya individual. La cantidad de datos disponibles tambin
depende de la boya, como ciertas boyas se encargaron antes que otros. Todas las
lecturas se tomaron a la misma hora del da.
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
EMG conjunto de datos en 2014-02-12
la extremidad inferior del
conjunto de datos
Resumen : 3 ejercicios diferentes: sentados, de pie y caminar en los msculos: bceps
femoral, vasto medial, recto femoral y semitendinoso adicin a goniometra en los
ejercicios.
Conjunto de datos Multivariado, Nmero de
132 rea: Ordenador
Caractersticas: Time-Series instancias:
Nmero de
Valores N/
Tareas asociadas: N/A Web 2375
perdidos? A
Accesos:
Fuente:
Las muestras obtenidas con la ayuda de:
Batalln n de Sanidad (BASAN) Universidad Militar Nueva Granada "Bogot
(muestras de julio de 2012).
Carrera 7 No 52-48, Bogot.
TecnoParque SENA Nodo Manizales (muestras marzo-julio 2013).
Km 10 camino a Magdalena, Manizales. Ph.D Oscar Fernando Snchez Avils oscfer '@'
gmail.com Universidad Militar Nueva Granada Ph.D Jos Luis Rodrguez Sotelo jdw.siul
'@' gmail.com Mg. Marcelo Herrera Gonzales marhego '@' gmail.com Mg. Gustavo Adolfo
Martnez Hernndez gamhet2 '@' gmail.com Universidad Autnoma de Manizales
Atributo de la informacin:
Cada archivo de datos contiene 5 columnas, organizados de la siguiente manera.
Segmento Miembro Inferior
Canal CH1 CH2 CH3 CH4 Ch5
Muscle RF BF VM ST FX
Columna 0 1 2 3 4
Documentos pertinentes:
Proporcionar referencias a los documentos que han citado este conjunto de datos en el
pasado (si los hay).
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en blanco..
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 24196
perdidos?
Accesos:
Fuente:
Theo Theodoridis
Facultad de Ciencias de la Computacin e Ingeniera Electrnica
de la Universidad de Essex
Wivenhoe Park, Colchester, 3SQ CO4, Reino Unido ttheod '@' gmail.com
http://sites.google.com/site/ttheod/
Atributo de la informacin:
Cada archivo en el conjunto de datos contiene en total 8 columnas, y est organizado de
la siguiente manera: + --------- + --------------- + ------ --------- + --------------- + --------------- + |
Segmentos | R-Arm | L -Arm | R-Leg | L-Leg | + --------- + ------- + ------- + ------- + ---- --- + --
----- + ------- + ------- + ------- + | Canal | ch1 | CH2 | CH3 | CH4 | ch5 | ch6 | ch7 | ch8 | |
Muscle | R-Bic | R-Tri | L-Bic | L-Tri | R-Thi | R-Ham | L-Thi | L-Ham | | columna | 0 | 1 | 2 | 3
| 4 | 5 | 6 | 7 | + --------- + ------- + ------- + ------- + ------ - + ------- + ------- + ------- + ------- +
Segmento:. Un segmento se define un segmento del cuerpo o de las extremidades - Brazo
derecho (R -Arm) - Brazo izquierdo (L-Arm) - Barra derecha (R-Leg) - Barra izquierda (L-
Leg) Canal:. Un canal corresponde a un electrodo unido a un msculo muscular: Un par de
msculos que se corresponde con una segmento. - R-Bic: bceps derecho (C1) - R-Tri:
trceps derecho (C2) - L-Bic: bceps izquierdo (C3) - L-Tri: trceps izquierdo (C4) - R-Thi:
muslo derecho ( C5) - R-Ham: corva derecha (C6) - L-Thi: muslo izquierdo (C7) - L-Ham:
corva izquierda (C8)
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
La Nmero de
Valores N/
Tareas asociadas: clasificacin, Web 25474
perdidos? A
regresin Accesos:
Fuente:
El conjunto de datos fue creada por Angeliki Xifara ( angxifara '@' gmail.com , / Ingeniero
Civil Estructural) y fue procesado por Athanasios Tsanas ( tsanasthanasis '@' gmail.com ,
Centro de Oxford para la Matemtica Industrial y Aplicada de la Universidad de Oxford,
Reino Unido) .
Atributo de la informacin:
El conjunto de datos contiene ocho atributos (o caractersticas, denotados por X1 ... X8) y
dos respuestas (o resultados, indicados por Y1 e Y2). El objetivo es utilizar las ocho
caractersticas de predecir cada una de las dos respuestas. Especficamente: X1
compacidad relativa Area Superficie X2 X3 rea Muro Area X4 Roof X5 Altura total X6
Orientacin X7 Acristalamiento rea X8 Acristalamiento rea Distribucin y1 Calefaccin
Load Load y2 Refrigeracin
Documentos pertinentes:
A. Tsanas, A. Xifara: estimacin cuantitativa precisa de la eficiencia energtica de los
edificios de viviendas que utilizan estadsticos herramientas de aprendizaje automtico ', la
Energa y Construcciones, vol. 49, pginas 560-567, 2012
Cita de pedidos:
A. Tsanas, A. Xifara: estimacin cuantitativa precisa de la eficiencia energtica de los edificios de
viviendas que utilizan estadsticos herramientas de aprendizaje automtico ', la Energa y
Construcciones, vol. 49, pginas 560-567, 2012 (el documento puede accederse desde [Web Link] )
Para ms detalles sobre la metodologa de anlisis de los datos: A. Tsanas, 'telemonitorizacin
exacta de la enfermedad de gravedad de los sntomas de Parkinson s no lineal utilizando el
procesamiento de seal de voz y el aprendizaje automtico estadstico', D. Phil. tesis de la
Universidad de Oxford, 2012 (al que se accede desde [Web Link] )
Entree Recomendacin 2014-02-12
Chicago de datos Conjunto
de datos
Resumen : Esta informacin contiene un registro de las interacciones del usuario con el
sistema de recomendacin de restaurante Entree Chicago.
Conjunto de datos Transaccional, Nmero de
50672 rea: N/A
Caractersticas: Secuencial instancias:
Nmero de
Recommender- Valores
Tareas asociadas: S Web 24298
Systems perdidos?
Accesos:
Fuente:
Propietario original y los donantes: Robin Burke de la Universidad de California, Irvine
Departamento de Informacin y Ciencias de la Computacin Irvine, CA 92697 Ahora aqu:
http://josquin.cti.depaul.edu/ ~ rburke /
Atributo de la informacin:
N/A
Documentos pertinentes:
Burke, R. El Wasabi Personal Shopper: Un sistema de recomendacin basado en casos.
En Actas de la 11 Conferencia Nacional sobre aplicaciones innovadoras de la
Inteligencia Artificial, pginas 844-849. AAAI, 1999. [Web Link] Burke, R. Sistemas de
Recomendacin basados en el conocimiento. Para aparecer en la Enciclopedia de
Biblioteconoma y Documentacin.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Anuncios de granja Data 2014-02-12
Set
Resumen : Esta informacin se recopil a partir de los anuncios de texto que aparecen
en doce sitios web que se ocupan de diversos temas relacionados con los animales de
granja. Las etiquetas binarias se basan en si es o no el propietario del contenido apruebe
el anuncio.
Conjunto de datos Nmero de
Texto 4143 rea: Negocios
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 10745
perdidos?
Accesos:
Fuente:
Chris Mesterharm y Michael J. Pazzani
Rutgers, la Universidad Estatal de Nueva Jersey mesterha '@' cs.rutgers.edu
Atributo de la informacin:
Palabras de texto en la granja-ads archivo. SVMlight formatear vectores dispersos en el
archivo de la granja-ads-vect.
Documentos pertinentes:
Aprendizaje Activo usando Algoritmos on-line. Chris Mesterharm, Michael J. Pazzani. En
KDD 2011.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Fertilidad Data Set 2014-02-12
Resumen : 100 voluntarios ofrecen una muestra de semen analizada de acuerdo a los
criterios de la OMS 2010. La concentracin de espermatozoides estn relacionados con
datos socio-demogrficos, factores ambientales, el estado de salud y hbitos de vida
Conjunto de datos Nmero de
Multivariante 100 rea: Vida
Caractersticas: instancias:
La Nmero de
Valores N/
Tareas asociadas: clasificacin, Web 24472
perdidos? A
regresin Accesos:
Fuente:
David Gil, dgil "@" dtic.ua.es , Lucentia Grupo de Investigacin del Departamento de
Tecnologa de Computadores de la Universidad de Alicante Jos Luis Girela, Girela '@'
ua.es , Departamento de Biotecnologa de la Universidad de Alicante
Atributo de la informacin:
Temporada en la que se realiz el anlisis. 1) invierno, 2) la primavera, 3) Verano, 4)
caiga. (-1, -0.33, 0.33, 1) La edad en el momento del anlisis. 18-36 (0, 1) enfermedades
Childish (es decir, la varicela, el sarampin, las paperas, polio) 1) s, 2) no. (0, 1) Accidente
o grave trauma 1) s, 2) no. (0, 1) Intervencin quirrgica 1) s, 2) no. (0, 1) Fiebre alta en
el ltimo ao 1) hace menos de tres meses, 2) hace ms de tres meses, 3) no. (-1, 0, 1) de
frecuencia de consumo de alcohol 1) varias veces al da, 2) todos los das, 3) varias veces
a la semana, 4) una vez por semana, 5) Casi nunca o nunca (0, 1) el hbito de fumar 1)
Nunca, 2) 3 ocasional) diariamente. (-1, 0, 1) Nmero de horas dedicadas sentado por da
eno-16 (0, 1) de la salida: Diagnstico normal (N), alterado (O)
Documentos pertinentes:
David Gil, Jos Luis Girela, Joaqun De Juan, M. Jos Gmez-Torres, y
Magnus Johnsson. Prediccin de la calidad seminal con inteligencia artificial
mtodos. Expert Systems with Applications, 39 (16): 12.564 "12.573 de 2012
Cita de pedidos:
David Gil, Jos Luis Girela, Joaqun De Juan, M. Jos Gmez-Torres, y
Magnus Johnsson. Prediccin de la calidad seminal con inteligencia artificial
mtodos. Expert Systems with Applications, 39 (16): 12.564 "12.573 de 2012
Demostracion de teoremas 2014-02-12
de primer orden Data Set
Resumen : Dado un teorema, predecir cul de los cinco heurstica dar la prueba ms
rpida cuando se usa por un probador de primer orden. Una sexta prediccin se niega a
intentar una prueba, debera ser demasiado difcil teorema.
Conjunto de datos Nmero de
Multivariante 6118 rea: Ordenador
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 5142
perdidos?
Accesos:
Fuente:
James P Bridge, Sean B Holden y Lawrence C Paulson Universidad de Cambridge
Computer Laboratory Building William Gates 15 JJ Thomson avenida Cambridge CB3 0FD
Reino Unido +44 (0) 1223 763 500 nombre.apellido '@' cl.cam.ac.uk
Atributo de la informacin:
Los atributos son una mezcla de caractersticas estticas y dinmicas derivadas de los
teoremas que ser probadas. Ver el documento para ms detalles.
Documentos pertinentes:
El aprendizaje automtico de primer orden demostracin de teoremas: aprender a
seleccionar una buena heurstica
James P Bridge, Sean B Holden y Lawrence C Paulson
Presentado para su publicacin en el Diario de razonamiento automatizado, Springer
2012/13.
Cita de pedidos:
Por favor, citar el papel si se utiliza este conjunto de datos.
Banderas Data Set 2014-02-12
Resumen : Desde Gua Collins Gem de Banderas, 1986
Conjunto de datos Nmero de
Multivariante 194 rea: N/A
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 60914
perdidos?
Accesos:
Fuente:
Creadores: Collected principalmente de la "Gua de Collins Gem de Banderas":. Collins
Publishers (1986) Donante: Richard S. Forsyth 8 Grosvenor Avenida Mapperley Parque
Nottingham NG3 5DX desde 0.602 hasta 621.676
Atributo de la informacin:
1. Nombre: Nombre del pas en cuestin
2. masa de tierra: 1 = N. Amrica, 2 = S.America, 3 = Europa, 4 = frica, 4 = Asia,
Oceana 6 =
3. zona: cuadrante geogrfico, basado en Greenwich y el Ecuador; 1 = NE, 2 = SE, 3 =
SW, NW 4 =
4. rea: en miles de kilmetros cuadrados
5. poblacin: en millones redondas
6. idiomas: 1 = Ingls, 2 = espaoles, franceses, 3 = 4 = 5 = alemn, eslavo, 6 = Otros
indoeuropeas, 7 = 8 = chinos, rabes, 9 = japons / turco / finlandesa / magiares, 10 =
Otros
7. religin: 0 = catlica, 1 = Otro Cristiana, 2 = musulmn, 3 = budista, 4 = Hindu, 5 =
tnicas, 6 = marxista, 7 = Otros
8. barras: Nmero de barras verticales en el pabelln
9. rayas: Nmero de rayas horizontales en la bandera
10. colores: Numero de diferentes colores en la bandera
11. rojo: 0 si est ausente rojo, 1 si el rojo presente en el pabelln
12. verde: lo mismo para el verde
13. azul: lo mismo para el azul
14. oro: lo mismo para el oro (tambin de color amarillo)
15. blanco: lo mismo para el blanco
16. negro: lo mismo para el negro
17. naranja: la misma para la naranja (tambin de color marrn)
18. mainhue: color predominante en la bandera (tie-breaks decidieron tomando el tono
ms alto, si eso no funciona, entonces el tono ms cntrica, y si eso falla el matiz ms a la
izquierda)
19. crculos: El nmero de crculos en el pabelln
20. cruza: Nmero de (vertical) cruza
21. sotueres: Nmero de cruces en diagonal
22. cuartos: Nmero de secciones en cuartos
23. sunstars: Cantidad de sol o estrella smbolos
24. media luna: 1 si un smbolo luna creciente actualidad, si no 0
25. tringulo: 1 si los tringulos presentes, 0 en caso contrario
26. icono: 1 si una imagen inanimada presente (por ejemplo, un barco), de lo contrario 0
27. animar: 1 si una imagen animada (por ejemplo, un guila, un rbol, una mano humana)
presentes, 0 en caso contrario
28. texto: 1 si cualquier carta o escrito en la bandera (por ejemplo, un lema o eslogan), 0
en caso contrario
29. topLeft: color en la esquina superior izquierda (derecho a decidir tie-breaks en
movimiento)
30. botright: El color en la esquina inferior izquierda (moviendo hacia la izquierda para
decidir tie-breaks)
Documentos pertinentes:
Gua del PC / BEAGLE usuario de Forsyth.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Incendios forestales Data 2014-02-12
Set
Resumen : Se trata de una tarea difcil de regresin, donde el objetivo es predecir el
rea quemada de los incendios forestales, en la regin noreste de Portugal, mediante el
uso de datos meteorolgicos y otros (ver detalles en: [Web Link] ).
Conjunto de datos Nmero de
Multivariante 517 rea: Fsico
Caractersticas: instancias:
Nmero de
Valores N/
Tareas asociadas: Regresin Web 152418
perdidos? A
Accesos:
Fuente:
Paulo Cortez, pcortez '@' dsi.uminho.pt , Departamento de Sistemas de Informacin de la
Universidad de Minho, Portugal.
Anbal Morais, araimorais '@' gmail.com , Departamento de Sistemas de Informacin de
la Universidad de Minho, Portugal.
Atributo de la informacin:
Para obtener ms informacin, lea [Cortez y Morais, 2007].
1. X - x-eje espacial de coordenadas en el mapa del parque de Montesinho: 1 a 9
2. Y - eje y coordenada espacial dentro del mapa del parque de Montesinho: 2 a 9
3. mes - mes del ao: 'enero' hasta 'diciembre'
4. da - da de la semana: mon al 'sol'
5. ndice FFMC del sistema FWI - FFMC: 18,7 a 96,20
6. ndice DMC del sistema FWI - DMC: 1,1 a 291,3
7. ndice de CC del sistema FWI - DC: 7,9 a 860,6
8. ndice ISI del sistema FWI - ISI: 0,0 a 56,10
9. temp - la temperatura en grados Celsius: 2,2 a 33,30
10. RH - humedad relativa en%: 15,0 a 100
11. viento - Velocidad del viento en km / h: 0,40 a 9,40
12. lluvia - lluvia fuera en mm/m2: 0,0-6,4
13. rea - la zona quemada del bosque (en ha): 0,00-1.090,84
(esta variable de salida est muy sesgada hacia 0.0, por lo que puede hacer
sentido de modelar con el logaritmo transformar).
Documentos pertinentes:
[Cortez y Morais, 2007] P. Corts y A. Morais. Un enfoque de minera de datos para
predecir los incendios forestales utilizando datos meteorolgicos. En J. Neves, MF
Santos y J. Machado Eds, Nuevas tendencias en Inteligencia Artificial, Actas de la EPIA
13 de 2007 -. Conferencia portugus sobre Inteligencia Artificial, de diciembre de
Guimares, Portugal, pp 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9. Disponible
en: [Web Link]
Cita de pedidos:
Este conjunto de datos es pblica disponibles para la investigacin. . Los detalles se
describen en [Cortez y Morais, 2007]
Por favor, incluya esta cita si tiene previsto utilizar esta base de datos:
[Cortez y Morais, 2007] P. Corts y A. Morais. Un enfoque de minera de datos para
predecir los incendios forestales utilizando datos meteorolgicos. En J. Neves, MF
Santos y J. Machado Eds, Nuevas tendencias en Inteligencia Artificial, Actas de la EPIA
13 de 2007 -. Conferencia portugus sobre Inteligencia Artificial, de diciembre de
Guimares, Portugal, pp 512-523, 2007. APPIA, ISBN-13 978-989-95618-0-9. Disponible
en: [Web Link]
Funcion de investigacion 2014-02-12
Data Set
Resumen : Los casos recogidos en su mayora de las investigaciones en las ciencias
fsicas, la intencin es evaluar los algoritmos de funcin exploratorias
Conjunto de datos Nmero de
N/A 352 rea: Fsico
Caractersticas: instancias:
Nmero de
Funcin- Valores
Tareas asociadas: No Web 15508
Learning perdidos?
Accesos:
Fuente:
Donante: Cullen Schaffer Departamento de Ciencias de la Computacin de la Universidad
de Rutgers, New Brunswick, NJ 08903 schaffer '@' paul.rutgers.edu Fuente: . Cullen
Schaffer, Domain-Independiente de Investigacin Cientfica Funcin Tesis doctoral,
Departamento de Ciencias de la Computacin de la Universidad de Rutgers, 1990
(Technical Informe LCSR-TR-149).
Atributo de la informacin:
N/A
Documentos pertinentes:
Cullen Schaffer, "Un cientfico Funcin de Investigacin Algoritmo Dominio Independiente
probada", en AAAI-90. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Conjunto de sensores de
gas Drift Data Set
Resumen : Este archivo contiene 13.910 mediciones de 16 sensores qumicos utilizados
en las simulaciones para la compensacin de deriva en una tarea de discriminacin de
los 6 gases en varios niveles de concentraciones.
Conjunto de datos Nmero de
Multivariante 13910 rea: Ordenador
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 68511
perdidos?
Accesos:
Fuente:
Creadores: Alexander Vergara ( vergara '@' ucsd.edu )
BioCircutis Institute
de la Universidad de California en San Diego
San Diego, California, EE.UU.
Los donantes del conjunto de datos: Alexander Vergara ( vergara '@' ucsd.edu )
Ramn Huerta ( rhuerta '@' ucsd . edu )
Documentos pertinentes:
N/A
Cita de pedidos:
Para citar este artculo:
Alexander Vergara y Shankar Vembu y Tuba Ayhan y Margaret A. Ryan y Margie L.
Homero y Ramn Huerta, gas qumico sensor de compensacin de deriva utilizando
conjuntos de clasificadores, Sensors and Actuators B: Qumica (2012) doi: 10.1016/j.snb
.2012.01.074.
Conjunto de sensores de 23/10/2013
gas Drift Dataset a
diferentes concentraciones
Dataset
Resumen:
Este archivo contiene 13.910 mediciones de 16 sensores qumicos expuestos a 6 gases
diferentes a diferentes niveles de concentracin.
Caractersticas Multivariado,
Nmero de
del Conjunto de 13910 rea: ordenador
instancias:
datos: Time-Series
clasificacin,
Nmero de
Tareas regresin, Valores
N/A accesos 6720
asociadas: clustering, perdidos?
Web:
Causa
Fuente:
Creadores: Alexander Vergara (Vergara '@' ucsd.edu)
BioCircutis Instituto
Universidad de California en San Diego
San Diego, California, EE.UU.
Los donantes del conjunto de datos:
Alejandro Vergara (Vergara '@' ucsd.edu)
Jordi Fonollosa (Fonollosa '@' ucsd.edu)
Irene Rodrguez-Lujan (irrodriguezlujan '@' ucsd.edu)
Ramn Huerta (rhuerta '@' ucsd.edu)
El conjunto de datos se obtuvo durante el perodo de enero 2008 hasta 02 2011 (36
meses) en una instalacin de la plataforma de distribucin de gas situada en el Laboratorio
de seales qumicas en el Instituto BioCircuits de la Universidad de California San Diego.
La plataforma del sistema de medicin proporciona versatilidad para obtener las
concentraciones deseadas de las sustancias qumicas de inters con alta precisin y de
una manera altamente reproducible, minimizando as los errores comunes causados por la
intervencin humana y por lo que es posible concentrarse exclusivamente en los sensores
qumicos. Vase la referencia 1 para ms detalles sobre la configuracin experimental.
Atributo de la informacin:
y [k ] = ( 1 - Alfa ) y [k - 1 ] + Alfa ( R [ k ] - R [ k - 1 ] )
En particular , tres valores diferentes para Alfa = 0,1 , 0,01 , 0,001 se establecieron para
obtener tres valores de caractersticas diferentes a partir de la porcin ascendente de la
respuesta del sensor y tres caractersticas adicionales con los mismos valores Alfa para la
porcin de decaimiento de la respuesta del sensor , cubriendo as toda la dinmica de
respuesta del sensor .
Documentos pertinentes:
N/A
Cita de pedidos:
Alejandro Vergara y Shankar Vembu y Tuba Ayhan y Margaret A. Ryan y Margie L. Homer
y Ramn Huerta , gas qumico sensor de compensacin de deriva utilizando conjuntos de
clasificadores , Sensor and Actuators B: Qumica 166 ( 2012 ) 320-329 . doi :
10.1016/j.snb.2012.01.074 .
Irene Rodrguez - Lujn, Jordi Fonollosa, Alejandro Vergara, Margie Homer, Ramn
Huerta. En la calibracin de los conjuntos de sensores para el reconocimiento de patrones
usando el nmero mnimo de experimentos. Quimiometra y Sistemas Inteligentes de
laboratorio (2013) en la prensa.
Nmero de
Tareas Valores
Clasificacin, N/A accesos 7183
asociadas: perdidos?
Web:
Fuente:
Creadores:
Alejandro Vergara (vergara '@' ucsd.edu)
BioCircutis Instituto
Universidad de California en San Diego
San Diego, California, EE.UU.
Atributo de la informacin:
donde: Reading tiempo (ms) ? es el paso del tiempo para cada grabacin ( en
ms , a una frecuencia de muestreo de 100 Hz), fan_set_point ? y
fan_reading ? , es la puesta a punto y la lectura real del ventilador de escape,
respectivamente, mcf1_setpoint ? mcf3_setpoint ? son los valores de
consigna de grado de apertura dadas a los controladores de flujo de masa de 1-3 durante
el experimento , respectivamente , mcf1_read ? mcf1_read ? son el
grado de apertura medido de los controladores de flujo de masa 1 a 3, respectivamente ,
OETA ? ? y Oera ? son la temperatura y la humedad relativa ( en oC y % ,
respectivamente) durante todo el experimento , y board1 (A- 8 sensores qumicos )
? ? board9 (A- 8 sensores qumicos ) ? ? son la serie 72 veces recoge como una
funcin del tiempo a partir de los sensores de gas 8 (en Ki ) integrar los mdulos del 1 al
9 en cada lugar , respectivamente , cada uno separado por el nmero 1 ? que se
erige como etiqueta indicadora , formando as las 72 series de tiempo respuestas del
sensor qumico que es improbable que el clasificador para la formacin como se describe
en el estudio . Tenga en cuenta que hay un espacio en blanco entre y entre cada columna
en el conjunto de datos.
lnea 1 :
22250 0 0 100 100 100 103 103 105 22,22 63,43 1 476 555 803 497 775 885 873 843 1
346 545 635 616 571 552 773 745 1 397 509 660 638 755 744 745 657 1 420 510 525 531
504 650 719 715 1 2.201 449 652 1228 847 654 850 737 1 370 459 650 445 756 773 847
803 1 345 457 587 554 757 704 769 818 1 354 407 499 696 786 686 757 733 1 339 418
547 567 653 573 773 84
.Documentos pertinentes:
Proporcionar referencias a los documentos que han citado este conjunto de datos en el
pasado (si los hay).
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Casificacin N/A accesos 36305
perdidos?
Web:
Fuente :
a . propietarios originales
El conjunto de datos se construye a partir de los datos MNIST que se pone a disposicin
de Yann LeCun y Corinna Cortes en http://yann.lecun.com/exdb/mnist/ .
Los dgitos han sido de tamao normalizado y centrado una imagen de tamao fijo de
28x28 dimensin . Los datos originales fueron modificados para el propsito de la
seleccin de caractersticas desafo . En particular , los pxeles son muestras al azar en la
parte superior central de la entidad que contiene la informacin necesaria para eliminar la
ambigedad de 4 de las 9 y las funciones de orden superior fueron creados como
productos de estos pxeles para sumir el problema en un espacio mayor caracterstica
dimensional. Tambin hemos aadido una serie de caractersticas distractor llamado '
sondas ' que no tienen ningn poder predictivo . El orden de las caractersticas y los
patrones fueron aleatorizados .
Bienes : 2.500
Sondas : 2500
Total: 5000
Este conjunto de datos es uno de los cinco conjuntos de datos utilizados en el desafo de
seleccin de caractersticas NIPS 2003 . Nuestra pgina web [Web Link] est todava
abierto para la presentacin despus de la exposicin . Informacin acerca de otros
problemas conexos se encuentran en: [Web Link] . El paquete CLOP incluye cdigo de
ejemplo para procesar estos datos : [Web Link] .
Todos los detalles sobre la preparacin de los datos se encuentran en nuestro informe
tcnico : Diseo de experimentos para el punto de referencia la variable de seleccin NIPS
2003 , Isabelle Guyon , julio de 2003 , [Web Link] (tambin incluido en el archivo de
conjunto de datos) . Dicha informacin se pondr a disposicin slo despus de la final del
desafo .
Atributo de la informacin:
Documentos pertinentes:
Ver tambin :
Isabelle Guyon , et al, 2007 . Mtodos de referencia competitivos establece nuevas
normas para la seleccin de caractersticas de referencia NIPS 2003 . Pattern Recognition
Letters 28 (2007) 1438 ? 1444 .
y el informe tcnico correspondiente:
Isabelle Guyon , et al . 2006 . La seleccin de caractersticas con el paquete CLOP .
Informe Tcnico. [Web Link] .
Cita de pedidos:
Isabelle Guyon , Steve R. Gunn , Asa Ben- Hur , Gideon Dror , 2004 . Resultado anlisis
del desafo de seleccin de caractersticas NIPS 2003 . En : NIPS . [Web Link] .
Sistema de cristal de los 1987/09/01
datos de identificacin
Resumen:
Desde EE.UU. Servicio de Ciencias Forenses; 6 tipos de vidrio; definida en trminos de su
contenido de xido (es decir, Na, Fe, K, etc.).
Caractersticas del
Nmero de
Conjunto de Multivariado 214 rea: Fsico
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 99111
perdidos?
Web:
Fuente :
Creador:
B. alemn
Establecimiento Central de Investigacin
Servicio de Ciencias Forenses del Ministerio del Interior
Aldermaston , Reading, Berkshire RG7 4PN
Donante:
. 1 nmero Id : 1-214
. 2 RI : ndice de refraccin
3 Na: . Sdico ( unidad de medida : por ciento en peso de xido correspondiente , as
como los atributos 4-10)
. 4 Mg : Magnesio
. 5 Al : Aluminio
. 6 Si: Silicio
. 7 K : Potasio
. 8 Ca : Calcio
9 Ba: . Bario
10 Fe : . Hierro
. 11 Tipo de vidrio : ( atributo de clase )
- 1 building_windows_float_processed
- 2 building_windows_non_float_processed
- 3 vehicle_windows_float_processed
- 4 vehicle_windows_non_float_processed (ninguno en esta base de datos )
- 5 contenedores
- 6 artculos de mesa
- 7 faros
Documentos pertinentes:
Yuan Jiang y Zhi -Hua Zhou. Edicin de datos Formacin para kNN Clasificadores con
Red Neural Ensemble. ISNN ( 1 ) . 2004 . [Ver Contexto ] .
Petri Kontkanen y Petri Myllym y Tomi Silander y Henry Tirri y Peter Gr . En las
distribuciones predictivas y las redes bayesianas . Departamento de Ciencias de la
Computacin de la Universidad de Stanford. 2000 . [Ver Contexto ] .
Nir Friedman y Iftach Najman . Redes de procesos de Gauss. UAI . 2000 . [Ver Contexto ] .
Carlotta Domeniconi y Jing Peng y Dimitrios Gunopulos . Una mquina adaptativa Mtricas
de Clasificacin de patrones . PNI. 2000 . [Ver Contexto ] .
Kai Ming Ting y Ian H. Witten . Problemas en Stacked generalizacin. J. Artif . Intell . Res. .
( JAIR , 10 . 1999 . [Ver Contexto ] .
Eibe Frank y Ian H. Witten . Generando Regla Precisa Establece Sin Optimizacin Global.
ICML . De 1998. [Ver Contexto ] .
Jan C. Bioch y D. Meer y Rob Potharst . Bivariado rboles de decisin . PKDD . De 1997.
[Ver Contexto ] .
James J. Liu y James Estao y Yau Kwok . Un Algoritmo Gentico Induccin Regla
extendido . Departamento de Ciencias de la Universidad de Wuhan ordenador . [Ver
Contexto ] .
Ron Kohavi y Brian Frasca . Caracterstica til subconjuntos y Rough Set reductos . Tercer
Taller Internacional de Rough Sets y Soft Computing . [Ver Contexto ] .
Chih- Wei Hsu y Cheng -Ru Lin. Una Comparacin de Mtodos para Mquinas de
Vectores Soporte multi - clase. Departamento de Ciencias de la Computacin e Ingeniera
de la Informacin de la Universidad Nacional de Taiwn . [Ver Contexto ] .
C. Tito Brown y Harry W. Bullen y Sean P. Kelly y Robert K. Xiao y Steven G. Satterfield y
John G. Hagedorn y Judith E. Devaney . Visualizacin y Minera de Datos en un inmersivo
entorno 3D : Proyecto de Verano 2003 [Ver Contexto ] . .
Zhi -Hua Zhou y Xu Ying Liu. Formacin de coste razonable para Redes Neuronales con
Mtodos abordar el problema del desequilibrio de clases. [Ver Contexto ] .
Yin Zhang y W. Nick Street. Embolsado con los gastos de adaptacin . Departamento de
Ciencias de la Administracin de la Universidad de Iowa, Iowa City . [Ver Contexto ] .
Ping Zhong y Masao Fukushima. Segundo Cono Orden Programacin Formulaciones para
Robust Clasificacin de clase mltiple. [Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 56686
perdidos?
Web:
Fuente :
Donante:
El conjunto de datos contiene los casos de un estudio que se realiz entre 1958 y 1970 en
la Universidad del Hospital Billings de Chicago en la supervivencia de los pacientes que se
haban sometido a ciruga para el cncer de mama.
Atributo de la informacin:
Documentos pertinentes:
Yin Zhang y W. Nick Street. Embolsado con los gastos de adaptacin . Departamento de
Ciencias de la Administracin de la Universidad de Iowa, Iowa City . [Ver Contexto ] .
Denver Dash y Gregory F. Cooper. Averaging Modelo con Discrete Red bayesiana
clasificadores . Laboratorio de Sistemas de Decisin Inteligente Universidad Sistemas
Programa de Pittsburgh. [Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 33821
perdidos?
Web:
Fuente :
Creadores:
Donante:
He reemplazado los valores actuales de los atributos ( es decir , aficin tiene valores de
ajedrez , los deportes y los sellos ) con valores numricos . Creo que esta es la forma en
que los autores " hicieron esto al probar los modelos de categorizacin que se describen
en el documento . Me parece injusto. Mientras que los sujetos fueron capaces de llevar el
conocimiento de fondo para influir en los valores de los atributos y sus relaciones, los
algoritmos se proporcionan sin tal conocimiento. Estoy seguro de si los atributos distractor
2 (nombre y mana ) se presentan a los algoritmos de los autores durante la prueba. Sin
embargo, es claro que slo la edad , nivel de educacin , y los atributos de estado civil se
dan durante las pruebas de transferencia de los sujetos humanos .
Atributo de la informacin:
Documentos pertinentes:
Yuan Jiang y Zhi -Hua Zhou. Edicin de datos Formacin para kNN Clasificadores con
Red Neural Ensemble. ISNN ( 1 ) . 2004 . [Ver Contexto ] .
Bob Ricks y Dan Ventura . El entrenamiento de un red neuronal de Quantum . PNI. 2003 .
[Ver Contexto ] .
Jerome H. Friedman y Ron Kohavi y Youngkeol Yun. Para aparecer en AAAI - 96 rboles
de decisin de Lazy . Departamento de Estadstica y Stanford Linear Accelerator Center
de la Universidad de Stanford. [Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin Si accesos 145093
perdidos?
Web:
Fuente :
Creadores:
Donante:
Esta base de datos contiene 76 atributos, pero todos los experimentos publicados se
refieren al uso de un subconjunto de 14 de ellos . En particular , la base de datos de
Cleveland es el nico que se ha utilizado por investigadores para ML
esta fecha. El campo " objetivo " se refiere a la presencia de la enfermedad cardaca en el
paciente . Es valor entero de 0 (sin presencia ) a 4. Experimentos con la base de datos de
Cleveland se han concentrado en simplemente intentar distinguir la presencia (valores
1,2,3,4) de ausencia ( valor 0 ) .
Los nombres y nmeros de seguro social de los pacientes fueron retirados recientemente
de la base de datos, reemplazados con valores ficticios .
Un archivo se ha " procesado" , que uno que contiene la base de datos de Cleveland. Los
cuatro archivos no procesados tambin existen en este directorio.
Para ver los costos de prueba ( donados por Peter Turney ) , por favor consulte la carpeta
" Costes"
Atributo de la informacin:
Documentos pertinentes:
David W. Aha & Dennis Kibler . " Prediccin basada en instancia de la presencia de
enfermedades cardiacas con la base de datos de Cleveland. "
[Web Link]
Zhi -Hua Zhou y Jiang Yuan . NeC4.5 : Neural Ensemble Based C4.5 . IEEE Trans .
Conocimiento . Datos Eng, 16 . 2004 . [Ver Contexto ] .
Kaizhu Huang y Yang Haiqin e Irwin Rey y Michael R. Lyu y Laiwan Chan. Sesgo Machine
Probabilidad Minimax para el diagnstico mdico . AMAI . 2004 . [Ver Contexto ] .
David Page y Soumya Ray. Sesgo : una alternativa eficaz a Lookahead de rbol de
decisin de induccin . IJCAI . 2003 . [Ver Contexto ] .
Jinyan Li y Limsoon Wong. Uso de reglas para el Anlisis de Datos Bio- mdica : una
comparacin entre C4.5 y PCL . Waim . 2003 . [Ver Contexto ] .
Yuan Jiang Zhi y Hua Zhou y Zhaoqian Chen. Regla de aprendizaje basado en red
neuronal Ensemble. Actas de la Conferencia Conjunta Internacional sobre Redes
Neuronales . 2002 . [Ver Contexto ] .
. Thomas Melluish y Craig Saunders y Ilia Nouretdinov y Volodia Vovk y Carol S. Saunders
y yo Nouretdinov V. El marco tipicidad : una comparacin con el enfoque bayesiano .
Departamento de Ciencias de la Computacin . De 2001. [Ver Contexto ] .
Robert Burbidge y Matthew Trotter y Bernard F. Buxton y Sean B. Holden. STAR - Sparsity
travs Rechazo automatizado . IWANN ( 1 ) . De 2001. [Ver Contexto ] .
Rudy Setiono y Wee Kheng Leow . Fernn : Un Algoritmo para la extraccin rpida de las
Reglas de las redes neuronales . Appl . Intell , 12 . 2000 . [Ver Contexto ] .
Endre Boros y Peter Hammer y Toshihide Ibaraki y Alexander Kogan y Eddy Mayoraz e
Ilya B. Muchnik . Una Aplicacin del anlisis lgico de datos . IEEE Trans . Conocimiento .
Datos Eng, 12 . 2000 . [Ver Contexto ] .
Petri Kontkanen y Petri Myllym y Tomi Silander y Henry Tirri y Peter Gr . En las
distribuciones predictivas y las redes bayesianas . Departamento de Ciencias de la
Computacin de la Universidad de Stanford. 2000 . [Ver Contexto ] .
Iaki Inza y Pedro Larraaga y Basilio Sierra y Ramn Etxeberria y Jos Antonio Lozano y
Jos Manuel Pea. En representacin del comportamiento de los algoritmos de
aprendizaje de clasificacin supervisada por redes bayesianas . Pattern Recognition
Letters , 20 . 1999 . [Ver Contexto ] .
Yoav Freund y Lorne Mason. La Decisin alterna Algoritmo Learning Tree . ICML . De
1999. [Ver Contexto ] .
Chun -Nan Hsu y Hilmar Schuschel y Ya- Ting Yang. El Enfoque ANNIGMA - Envoltura
con Redes Neuronales funcin de seleccin de Descubrimiento de Conocimiento y Minera
de Datos . Instituto de Ciencias de la Informacin . De 1999. [Ver Contexto ] .
Kai Ming Ting y Ian H. Witten . Problemas en Stacked generalizacin. J. Artif . Intell . Res. .
( JAIR , 10 . 1999 . [Ver Contexto ] .
Rudy Setiono y Huan Liu. NeuroLinear : De redes neuronales para las reglas de decisin
oblicuos. Neurocomputing , 17 . 1997 . [Ver Contexto ] .
Jan C. Bioch y D. Meer y Rob Potharst . Bivariado rboles de decisin . PKDD . De 1997.
[Ver Contexto ] .
Kamal Ali y Michael J. Pazzani . Reduccin de errores a travs del aprendizaje mltiples
descripciones. Aprendizaje Automtico , 24 . 1996 . [Ver Contexto ] .
Ron Kohavi . El poder de las tablas de decisin . ECML . De 1995. [Ver Contexto ] .
Rudy Setiono y Wee Kheng Leow . Generacin de reglas de red entrenada utilizando
podas rpido. Escuela de la Universidad Nacional de Computacin de Singapur. [Ver
Contexto ] .
Krista Lagus y Esa Alhoniemi y Jeremias Seppa y Antti Honkela y Arno Wagner. ANLISIS
INDEPENDIENTE GRUPO VARIABLE EN APRENDIZAJE REPRESENTACIN
COMPACTOS PARA DATOS . Centro de Investigacin de Redes Neuronales de la
Universidad Tecnolgica de Helsinki. [Ver Contexto ] .
John G. Cleary y Leonard E. Trigg . Las experiencias con el OB 1 , una decisin ptima
Bayes Tree alumno. Departamento de Informtica Universidad de Waikato . [Ver Contexto
].
Zhi -Hua Zhou y Xu Ying Liu. Formacin de coste razonable para Redes Neuronales con
Mtodos abordar el problema del desequilibrio de clases. [Ver Contexto ] .
Cita de pedidos:
Los autores de las bases de datos han solicitado que todas las publicaciones que resulten
del uso de los datos son los nombres del investigador principal responsable de la
recopilacin de datos en cada institucin . Ellos seran:
1 . Instituto Hngaro de Cardiologa. Budapest: Andras Janosi , M. D.
. 2 Hospital Universitario de Zurich , Suiza: William Steinbrunn , MD
. 3 Hospital Universitario de Basilea , Suiza: Matthias Pfisterer , MD
4 . V.A. Medical Center, Long Beach y Cleveland Clinic Foundation : Robert Detrano , MD ,
Ph.D....
Hepatitis Conjunto de datos 1988/11/01
Resumen:
Desde G.Gong: CMU; Sobre todo booleano o numrico valorado tipos de atributos; Incluye
datos sobre los costos (donado por Peter Turney).
Caractersticas
Nmero de
del Conjunto de Multivariante 155 rea: Vida
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin Si accesos 67662
perdidos?
Web:
Fuente:
Creador:
desconocido
Donante:
Por favor, pregunte Gail Gong para ms informacin sobre esta base de datos.
Atributo de la informacin:
Documentos pertinentes:
Amaury Habrard y Marc Bernard y Marc Sebban. IOS Press Deteccin Subtrees
irrelevantes para mejorar Probabilstico Aprendiendo de datos con estructura de rbol.
Fundamenta Informaticae. 2004. [Ver Contexto].
Jinyan Li y Limsoon Wong. Uso de reglas para el Anlisis de Datos Bio-mdica: una
comparacin entre C4.5 y PCL. Waim. 2003. [Ver Contexto].
Zhi-Hua Zhou y Jiang Yuan y Shifu Chen. La extraccin de reglas simblicas de conjuntos
de redes neuronales entrenadas. AI Commun, 16. 2003. [Ver Contexto].
Xiaoli Z. Helecho y Carla Brodley. Impulsar rboles de decisin de Lazy. ICML. 2003. [Ver
Contexto].
Petri Kontkanen y Petri Myllym y Tomi Silander y Henry Tirri y Peter Gr. En las
distribuciones predictivas y las redes bayesianas. Departamento de Ciencias de la
Computacin de la Universidad de Stanford. 2000. [Ver Contexto].
Ron Kohavi. El poder de las tablas de decisin. ECML. De 1995. [Ver Contexto].
Zhi-Hua Zhou y Xu Ying Liu. Formacin de coste razonable para Redes Neuronales con
Mtodos abordar el problema del desequilibrio de clases. [Ver Contexto].
Rafael S. Parpinelli y Heitor S. Lopes y Alex Alves Freitas. Un sistema basado en Colonia
de Hormigas para minera de datos: Aplicaciones a los datos mdicos. CEFET-PR, CPGEI
Av. Sete de Setembro, 3165. [Ver Contexto].
Takao Mohri y Hidehiko Tanaka. Una de indexacin ptima Ponderacin Criterio de caso
tanto numrico y atributos simblicos. Informacin Ingeniera Curso de la Facultad de
Ingeniera de la Universidad de Tokio. [Ver Contexto].
Wl / odzisl / aw Duch y Rafal / Adamczak Email: duchraad @ fs. uni. Torun. pl. Mtodos
estadsticos para la construccin de las redes neuronales. Departamento de Mtodos
Computacionales, Universidad Nicols Coprnico. [Ver Contexto].
Cita de pedidos:
Nmero
Tareas Valores de
Clasificacin N/A 6260
asociadas: perdidos? accesos
Web:
Fuente :
Daniel Whiteson daniel '@' uci.edu , Profesor Asistente , Fsica y Astronoma , Universidad
. de California Irvine
Los datos se han producido utilizando simulaciones de Monte Carlo . Los primeros 21
elementos (columnas 2-22 ) son propiedades cinemticas medidos por los detectores de
partculas en el acelerador . Los ltimos siete caractersticas son funciones de las primeras
21 funciones ; estas son las caractersticas de alto nivel procedentes de los fsicos para
ayudar a discriminar entre las dos clases . Hay un inters en el uso de mtodos de
aprendizaje profundas para evitar la necesidad de los fsicos para desarrollar
manualmente dichas caractersticas. Resultados de referencia que utilizan rboles de
decisin bayesiana a partir de un paquete de fsica estndar y las redes neuronales de 5
capas se presentan en el documento original . Los ltimos 500.000 ejemplos se utilizan
como una prueba de conjunto .
Atributo de la informacin:
Documentos pertinentes:
Baldi, Sadowski y Whiteson , Bsquedas mejoradas para partculas exticas con tcnicas
de aprendizaje profundo , ( en la presentacin ) .
Cita de pedidos:
Baldi, Sadowski y Whiteson , Bsquedas mejoradas para partculas exticas con tcnicas
de aprendizaje profundo , ( en la presentacin ) .
Hill-Valley Data Set 2008/03/20
Resumen:
Cada registro representa 100 puntos en un grfico bidimensional. Cuando se trazan en
orden (de 1 a 100) como la coordenada Y, los puntos van a crear ya sea un Hill (una
"protuberancia" en el terreno) o un valle (un "inmersin" en el terreno).
Caractersticas del
Nmero de
Conjunto de Secuencial 606 rea: N/A
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 33045
perdidos?
Web:
Fuente:
(A) Hill_Valley_without_noise_Training.data
(B) Hill_Valley_without_noise_Testing.data
Estos dos primeros conjuntos de datos (sin ruido) son un par conjunto de entrenamiento /
prueba donde las colinas o valles tienen una transicin sin problemas.
(C) Hill_Valley_with_noise_Training.data
(D) Hill_Valley_with_noise_Testing.data
Estos prximos dos conjuntos de datos (con ruido) son un par conjunto de entrenamiento /
prueba donde el terreno es desigual, y la colina o valle no es tan evidente cuando se ve de
cerca.
(E) Hill_Valley_sample_arff.text
(F) Hill_Valley_visual_examples.jpg
Este archivo grfico muestra dos casos de ejemplo de los datos.
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin Si accesos 36247
perdidos?
Web:
Fuente :
Creadores:
Donante:
2 archivos de datos :
- Caballos colic.data : 300 casos de formacin
- Caballos colic.test : 68 casos de prueba
Atributo de la informacin:
1 : la ciruga?
1 = S, se someti a una ciruga
2 = Se fue tratado sin ciruga
2 : Edad
1 = caballo adulto
2 = joven ( < 6 meses)
Temperatura rectal : 4
- lineal
- En grados celsius .
- Una temperatura elevada puede ocurrir debido a la infeccin .
- La temperatura se puede reducir cuando el animal est en estado de shock tarde
- La temperatura normal es de 37,8
- Este parmetro suele cambiar a medida que el problema avanza, por ejemplo . que
puede comenzar normal, entonces se elevan debido a la lesin , pasar de nuevo a travs
del rango normal como el caballo entra en shock
5 : pulso
- lineal
- La frecuencia cardiaca en pulsaciones por minuto
- Es un reflejo de la condicin del corazn : 30 -40 es normal para los adultos
- Raro tener un tipo inferior al de la normalidad , aunque los caballos deportivos pueden
tener una tasa de 20 a 25
- Los animales con lesiones dolorosas o que sufren de shock circulatorio pueden tener un
ritmo cardaco elevado
6 : la frecuencia respiratoria
- lineal
- Tarifa normal es de 8 a 10
- Utilidad es dudosa debido a las grandes fluctuaciones
9 : membranas mucosas
- Una medicin subjetiva del color
- Los valores posibles son :
1 = rosa normales
2 = rosa brillante
3 = rosa plido
4 = plido ciantica
5 = rojo brillante / inyectado
6 = ciantica oscura
- 1 y 2 probablemente indican una circulacin normal o levemente aumentada
- 03 de mayo producirse una descarga temprana
- 4 y 6 son indicativos de grave compromiso circulatorio
- La figura 5 es ms indicativo de una septicemia
12 : peristaltismo
- Una indicacin de la actividad en el intestino del caballo. Como el intestino se vuelve ms
distendido o el caballo se vuelve ms txica , la actividad disminuye
- Valores posibles:
1 = hypermotile
2 = normal
3 = hipomotilidad
4 = ausente
13 : distensin abdominal
- Un parmetro importante .
- Los valores posibles
1 = ninguno
2 = leve
3 = moderado
4 = grave
- Un animal con distensin abdominal es probable que sea doloroso y han reducido la
motilidad intestinal .
- Un caballo con distensin abdominal severa es probable que requiera ciruga slo tio
aliviar la presin
14 : sonda nasogstrica
- Esto se refiere a cualquier gas que sale del tubo
- Valores posibles:
1 = ninguno
2 = leve
3 = significativo
- Una tapa de gas grande en el estmago es probable que d el malestar caballo
15 : reflujo nasogstrica
- Los valores posibles
1 = ninguno
2 = > 1 litro
3 = < 1 litro
- La mayor cantidad de reflujo , ms probabilidad de que hay una cierta serio obstculo
para el paso de fluido desde el resto del intestino
16 : nasogstrica PH reflujo
- lineal
- Escala es de 0 a 14 con 7 es neutro
- Valores normales estn en el rango de 3 a 4
18 : abdomen
- Los valores posibles
1 = normal
2 = otro
3 = heces firmes en el intestino grueso
4 = distiende el intestino delgado
5 = distiende el intestino grueso
- 3 es probablemente una obstruccin causada por una retencin mecnica y se trata
normalmente de vista mdico
- 4 y 5 indican una lesin quirrgica
19 : hematocrito
- lineal
- El # de clulas rojas en volumen en la sangre
- Rango normal es de 30 a 50 El nivel aumenta a medida que la circulacin se convierte en
peligro o cuando el animal se deshidrata. .
20 : protena total
- lineal
- Los valores normales se encuentran en el rango de 6 a 7,5 ( g / dL)
- Cuanto mayor sea el valor mayor es la deshidratacin
Apariencia abdominocentesis : 21
- Se introduce una aguja en el abdomen y el lquido del caballo se obtiene de
la cavidad abdominal
- Valores posibles:
1 = claro
2 = nublado
3 = serosanguinolento
- Normal de lquido es claro , mientras turbia o serosanguinolento indica un intestino
comprometido
23 : resultados
- Lo que finalmente sucedi con el caballo?
- Valores posibles:
1 = duracin
2 = murieron
3 = se practic la eutanasia
24 : lesin quirrgica?
- Retrospectivamente , era el problema (lesin) quirrgica?
- Todos los casos se operan ya sea sobre o realiz la autopsia a fin de que este valor y el
tipo de lesin son siempre conocidos
- Valores posibles:
1 = S
2=n
Documentos pertinentes:
N/A
Julie Greensmith . Nuevas fronteras para un sistema inmune artificial . Digital Media
Laboratorio de Sistemas HP Laboratorios Bristol. 2003 . [Ver Contexto ] .
Huan Liu y Hiroshi Motoda y Lei Yu. Seleccin de caractersticas con Muestreo Selectivo .
ICML . 2002 . [Ver Contexto ] .
Mukund Deshpande y George Karypis . El uso conjunto de los valores de los atributos
para la clasificacin. CIKM . 2002 . [Ver Contexto ] .
Kai Ming Ting y Ian H. Witten . Problemas en Stacked generalizacin. J. Artif . Intell . Res. .
( JAIR , 10 . 1999 . [Ver Contexto ] .
Eibe Frank y Ian H. Witten . Generando Regla Precisa Establece Sin Optimizacin Global.
ICML . De 1998. [Ver Contexto ] .
James J. Liu y James Estao y Yau Kwok . Un Algoritmo Gentico Induccin Regla
extendido . Departamento de Ciencias de la Universidad de Wuhan ordenador . [Ver
Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Regresin No accesos 97678
perdidos?
Web:
Fuente :
Origen :
Creador:
Harrison , D. y Rubinfeld , D. L.
' Precios hednicos y la demanda de aire limpio ', J. Environ . Economa y Gestin , vol.5,
81-102 , 1978 .
Documentos pertinentes:
Glenn Fung y M. Murat Dundar y Jinbo Bi y Bharat Rao. Un algoritmo rpido iterativo para
fisher discriminante utilizando ncleos heterogneos. ICML . 2004 . [Ver Contexto ] .
. Thomas Melluish y Craig Saunders y Ilia Nouretdinov y Volodia Vovk y Carol S. Saunders
y yo Nouretdinov V. El marco tipicidad : una comparacin con el enfoque bayesiano .
Departamento de Ciencias de la Computacin . De 2001. [Ver Contexto ] .
Martin H C Law y James T. Kwok . Aplicando el Marco Evidencia bayesiano para u- Apoyo
Vector de regresin . ECML . De 2001. [Ver Contexto ] .
Zhi -Hua Zhou y Wu Jianping y Weiyu Tang y Zen Chen. Combinando Regresin
Estimadores : Basado -GA selectiva red neuronal Ensemble. Revista Internacional de
Inteligencia Computacional y Aplicaciones, 1 . 2001 . [Ver Contexto ] .
Nir Friedman y Iftach Najman . Redes de procesos de Gauss. UAI . 2000 . [Ver Contexto ] .
Endre Boros y Peter Hammer y Toshihide Ibaraki y Alexander Kogan y Eddy Mayoraz e
Ilya B. Muchnik . Una Aplicacin del anlisis lgico de datos . IEEE Trans . Conocimiento .
Datos Eng, 12 . 2000 . [Ver Contexto ] .
Mauro Birattari y Gianluca Bontempi y Hugues Bersini . Lazy Learning Cumple los mnimos
cuadrados recursivos del algoritmo . PNI. De 1998. [Ver Contexto ] .
S. Sathiya Keerthi . Mejoras en SMO algoritmo SVM para regresin . Autor para la
correspondencia : Prof. [Ver Contexto ] .
Jianping Wu y Zhi -Hua Zhou y Chen Cheng- La . Ensemble de GA basa selectiva red
neuronal Conjuntos . Laboratorio Nacional de Novela Software Tecnologa de la
Universidad de Nanjing. [Ver Contexto ] .
C. Tito Brown y Harry W. Bullen y Sean P. Kelly y Robert K. Xiao y Steven G. Satterfield y
John G. Hagedorn y Judith E. Devaney . Visualizacin y Minera de Datos en un inmersivo
entorno 3D : Proyecto de Verano 2003 [Ver Contexto ] . .
David R. Musicant y Alexander Feinberg. Set Active Support Vector de regresin . [Ver
Contexto ] .
Nir Friedman y Daphne Koller ( Koller @ cs . Stanford . Edu. Un enfoque bayesiano para
Estructurar Discovery en redes bayesianas . Facultad de Ciencias de la Computacin y de
Ingeniera Universidad Hebrea . [Ver Contexto ] .
Humano Reconocimiento 2012/12/10
Actividad Usando
Smartphones Conjunto de
datos
Resumen:
Base de datos de reconocimiento de la actividad humana construido a partir de las
grabaciones de los 30 sujetos que realizan actividades de la vida diaria (AVD) en el
ejercicio de un smartphone montado en la cintura con sensores inerciales embebidos.
Caractersticas Multivariado,
Nmero de
del Conjunto de tiempo de 10299 rea: Ordenador
instancias:
datos: serie
Nmero de
Tareas Clasificacin, Valores
N/A accesos 72255
asociadas: clustering perdidos?
Web:
Fuente :
Los experimentos se han llevado a cabo con un grupo de 30 voluntarios dentro de una
franja de edad de 19-48 aos . Cada persona lleva a cabo seis actividades (caminar,
WALKING_UPSTAIRS , WALKING_DOWNSTAIRS , sentado, de pie , Acostado ) usando
un telfono inteligente (Samsung Galaxy S II ) en la cintura. Uso de su acelermetro y un
giroscopio integrado , hemos capturado aceleracin lineal 3 - axial y velocidad angular 3 -
axial a una velocidad constante de 50Hz . Los experimentos se han registrado -video para
etiquetar los datos de forma manual . El conjunto de datos obtenidos se ha dividido
aleatoriamente en dos grupos , en los que se seleccion el 70 % de los voluntarios para la
generacin de los datos de entrenamiento y 30% de los datos de prueba.
Las seales del sensor ( acelermetro y giroscopio ) fueron pre - procesados por la
aplicacin de filtros de ruido y luego muestreados en ancho fijo ventanas correderas de
2,56 seg y 50 % de superposicin ( 128 lecturas / ventana) . La seal de aceleracin del
sensor , que tiene componentes de movimiento gravitacionales y corporales , se separ
usando un filtro de paso bajo Butterworth en aceleracin cuerpo y la gravedad . La fuerza
de la gravedad se supone que tiene slo componentes de baja frecuencia, por lo tanto, un
filtro con 0,3 Hz frecuencia de corte se utiliz . Desde cada ventana , un vector de
caractersticas se obtuvo mediante el clculo de las variables de tiempo y el dominio de la
frecuencia .
Consulte el archivo readme.txt para obtener ms detalles sobre este conjunto de datos .
Atributo de la informacin:
Documentos pertinentes:
N/A
Cita de pedidos:
[ 1 ] Davide Anguita , Alessandro Ghio , Luca Oneto , Xavier Parra y Jorge L. Reyes- Ortiz.
Actividad Humana Reconocimiento en Smartphones utilizando una mquina Hardware -
Friendly Apoyo Vector multiclase . Taller Internacional de Ambient Assisted Living ( IWAAL
2012). Vitoria- Gasteiz, Espaa . diciembre 2012
Nmero de
Valores
Tareas asociadas: N/A No accesos 24999
perdidos?
Web:
Fuente:
AIM-94 conjunto de datos proporcionado por Isaac Kohane, MD, PhD, del Hospital de
Nios, en Boston, MA
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 19706
perdidos?
Web:
Fuente :
3.Prof . N. B. Venkateswarlu
venkat_ritch '@' yahoo.com
Departamento de Ciencias de la Computacin e Ingeniera ,
Aditya Instutute de Tecnologa y Gestin,
Tekkali - 532201 , Andhra Pradesh , India.
Datos Conjunto de Informacin :
Este conjunto de datos contiene 416 registros de pacientes hepticos y 167 pacientes
conjunto de datos records.The hgado no se recogi desde el norte al este de Andhra
Pradesh , India. Selector es una etiqueta de clase se utiliza para dividir en grupos (
pacientes heptico o no) . Este conjunto de datos contiene 441 registros de pacientes de
sexo masculino y 142 registros de pacientes de sexo femenino.
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 57883
perdidos?
Web:
Fuente:
Creadores:
Donante:
Los casos fueron seleccionados al azar a partir de una base de datos de 7 imgenes al
aire libre. Las imgenes fueron handsegmented para crear una clasificacin para cada
pxel.
Atributo Informacin:
Documentos pertinentes:
N/A
Anthony K H Tung y Xin Xu y Beng Chin Ooi. CURLER: encontrar y visualizar no lineal
correlacionada Clusters. Conferencia SIGMOD. 2005. [Ver Contexto].
Xiaoli Z. Helecho y Carla Brodley. Conjuntos de clster para alta Clustering Dimensional:
un estudio emprico. Diario de la mquina de aprendizaje de Investigacin n, a. 2004. [Ver
Contexto].
Dash Manoranjan y Huan Liu y Peter Scheuermann y Kian-Lee Tan. Agrupacin jerrquica
Fast y su validacin. Conocimiento de Datos. Eng, 44. 2003. [Ver Contexto].
C. Tito Brown y Harry W. Bullen y Sean P. Kelly y Robert K Xiao y Steven G. Satterfield y
John G. Hagedorn y Judith E. Devaney. Visualizacin y Minera de Datos en un inmersivo
entorno 3D: Proyecto de Verano de 2003. [Ver Context].
James Estao y Yau Kwok. Moderacin de las salidas de Apoyo Vector Machine
clasificadores. Departamento de Ciencias de la Computacin Hong Kong Baptist University
de Hong Kong. [Ver Context].
Cita Solicitud:
2012/08/30
Cada hogar consumo
elctrico Conjunto de Datos
Resumen:
Las mediciones de consumo de energa elctrica en un hogar con un minuto de intervalo
de muestreo durante un perodo de casi 4 aos. Diferentes magnitudes elctricas y
algunos sub-valores de medicin estn disponibles..
Caractersticas
Multivariado Nmero de
del Conjunto de 2015259 rea: Fsico
tiempo serie instancias:
datos:
Nmero de
Tareas Regresin, Valores
Si accesos 32382
asociadas: clustering perdidos?
Web:
Fuente :
Atributo de la informacin:
Documentos pertinentes:
N/A
Cita de pedidos:
Nmero de
Regresin, Valores
Tareas asociadas: No accesos 37734
descripcin perdidos?
Web:
Fuente :
El diccionario de datos ( [Web Link] ) describe las variables utilizadas y sus valores.
Nota: Todas las variables que comienzan con M son variables de cdigo postal. Ellos dan
informacin sobre la distribucin de esta variable , por ejemplo, Casa de alquiler , en el
rea de cdigo postal del cliente.
TICEVAL2000.txt : Conjunto de datos para las predicciones (4000 registros de los clientes
) . Tiene el mismo formato que TICDATA2000.txt , slo el destino no se encuentra. Los
participantes se supone que deben devolver la lista de slo los objetivos previstos. Todos
los conjuntos de datos estn en formato delimitado por tabulador . El significado de los
atributos y valores de atributos es la siguiente.
Atributo de la informacin:
N/A
Documentos pertinentes:
P. van der Putten y M. van Someren ( eds ) . CoIL Desafo 2000 : El caso de la Compaa
de Seguros . Publicado por Research Machine Sentient , Amsterdam . Tambin un
instituto Leiden del Informe Tcnico Ciencias de la Computacin Avanzada 2000-09 . 22
de junio 2000 .
[Web Link]
Stephen D. Bay y Dennis F. Kibler y Michael J. Pazzani y Padhraic Smyth. El KDD Archivo
de datos grandes UCI Establece para la Investigacin y Experimentacin para minera de
datos . SIGKDD Exploraciones , 2 . 2000 . [Ver Contexto ] .
Stefan R uping . Un mtodo simple para estimar las probabilidades condicionales para
SVMs . Departamento CS , AI Unidad de la universidad de Dortmund . [Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin Si accesos 137070
perdidos?
Web:
Fuente :
Atributo de la informacin:
Una o ms de los tres rasgos continuos faltan en 28 % de los casos ; los valores que faltan
se deben interpretar como "desconocido" .
Documentos pertinentes:
Sergio A. Alvarez y Takeshi Kawato y Carolina Ruiz . La minera sobre fuentes de datos
dbilmente acoplados utilizando expertos neuronales. Informtica Dpto. Boston College.
[Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: N/A No accesos 32896
perdidos?
Web:
Fuente :
Propietario original:
Donante:
Dr. Di Cocinar
Departamento de Estadstica
Universidad del Estado de Iowa
http://www.public.iastate.edu/ ~ dicook /
Estos datos proceden de una encuesta realizada por los grficos y Unidad de
Visualizacin de Georgia Tech 10 octubre a 16 noviembre, 1997 Los detalles completos de
la encuesta estn disponibles aqu: . [Web Link]
El estudio completo est disponible en el sitio web mencionado anteriormente , junto con
resmenes, tablas y grficos de sus anlisis. Adems, hay informacin sobre otras partes
de la encuesta , incluyendo datos demogrficos de tecnologa y comercio web.
Los datos se almacenan en un archivos ASCII con una observacin por lnea. Espacios
separan campos.
Atributo de la informacin:
N/A
Documentos pertinentes:
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 62080
perdidos?
Web:
Fuente:
Donante:
Fuente:
Estos datos de radar se recogi mediante un sistema en Goose Bay, Labrador. Este
sistema consiste en una red en fase de 16 antenas de alta frecuencia con una potencia
total de transmisin del orden de 6,4 kilovatios. Ver el documento para obtener ms
detalles. Los objetivos eran los electrones libres en la ionosfera. "Good" ecos de radar son
los que muestran evidencia de algn tipo de estructura en la ionosfera. devuelve "malos"
son los que no lo hacen; sus seales pasan a travs de la ionosfera.
Atributo de la informacin:
Documentos pertinentes:
Sigillito, VG, Wing, SP, Hutton, LV, \ & Baker, KB (1989). Clasificacin de radar regresa de
la ionosfera usando redes neuronales. Johns Hopkins APL Tcnica Digest, 10, 262-266.
[Web Link]
Zhi-Hua Zhou y Jiang Yuan. NeC4.5: Neural Ensemble Based C4.5. IEEE Trans.
Conocimiento. Datos Eng, 16. 2004. [Ver Contexto].
Glenn Fung y M. Murat Dundar y Jinbo Bi y Bharat Rao. Un algoritmo rpido iterativo para
fisher discriminante utilizando ncleos heterogneos. ICML. 2004. [Ver Contexto].
Robert Burbidge y Matthew Trotter y Bernard F. Buxton y Sean B. Holden. STAR - Sparsity
travs Rechazo automatizado. IWANN (1). 2001. [Ver Contexto].
Juan J. Rodr guez # # y Carlos J. Alonso y Henrik Bostrom. Impulsar basada en intervalos
literales. 2000. [Ver Contexto].
Colin Campbell y Nello Cristianini y Alex J. Smola. Consulta Aprender con grandes
clasificadores de margen. ICML. 2000. [Ver Contexto].
Lorne Mason y Jonathan Baxter y Peter L. Bartlett y Marcus Frean. Impulsar Algoritmos
como Gradient Descent. PNI. 1999. [Ver Contexto].
Kai Ming Ting y Ian H. Witten. Problemas en Stacked generalizacin. J. Artif. Intell. Res..
(JAIR, 10. 1999. [Ver Contexto].
David M J Tax y Robert P W Duin. Apoyar descripcin del dominio del vector. Pattern
Recognition Letters, 20. 1999. [Ver Contexto].
Richard Maclin. Impulsar Clasificadores nivel regional. AAAI / IAAI. 1998. [Ver Contexto].
Robert E. Schapire y Yoav Freund y Peter Bartlett y Wee Sun Lee. Los Anales de
Estadstica, en aparecer. Impulsar la Margen: una nueva explicacin para la efectividad de
los mtodos de votacin. Los laboratorios de AT & T. 1998. [Ver Contexto].
Michalis K. Titsias y Aristidis Likas. Modelos Kernel Shared para la Clase estimacin de
densidades condicionales. [Ver Contexto].
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: N/A N/A accesos 14001
perdidos?
Web:
Fuente :
Propietario original:
IPUMS
Proyectos Censo histricas
Universidad de Minnesota
614 Ciencias Sociales
267 19th Avenue Sur
Minneapolis, MN 55455
IPUMS '@' hist.umn.edu
http://www.ipums.umn.edu/
Donante:
Stephen Bay
Departamento de Informacin y Ciencias de la Computacin ,
Universidad de California, Irvine
Irvine , CA 92697
SBAY '@' ics.uci.edu
Los datos son un ponderado de 1 en 100 muestras de las respuestas de la Los Angeles -
Long Beach area para los aos 1970 , 1980 y 1990 . La familia y los registros individuales
se acoplan en una sola mesa y utilizamos todas las variables que estaban disponibles
para los tres aos. Cuando hay ms de una versin de una variable, como para la carrera ,
hemos utilizado la ms general. Para la ocupacin y la industria se utiliz la base de 1950.
Tenga en cuenta que los datos de PUMS se basa en muestras de racimo, es decir,
muestras estn hechas de hogares o viviendas de las que puede haber varias personas .
Las personas de la misma casa ya no son independientes. Ruggles ( 1995 ) considera que
esta cuestin y analiza su efecto (junto con los efectos de la estratificacin ) en los errores
estndar.
El schltype variables parece tener diferentes valores de codificacin a travs de los aos
1970 , 1980 y 1990 .
El conjunto de datos contiene una pequea muestra de 1 en 1000 del rea de Los Angeles
y Long Beach. Fue formado por muestreo del gran conjunto de datos .
El gran conjunto de datos contiene una muestra de 1 en 100 de la zona de Los ngeles y
Long Beach.
Atributo de la informacin:
Documentos pertinentes:
Ke Wang y Zhou Shiyu y Ada Wai Chee - Fu y Jeffrey Xu Yu. Minera Cambios de
Clasificacin por correspondencia Tracing . SDM . 2003 . [Ver Contexto ] .
Cita de pedidos:
Todas las personas se les concede una licencia limitada para usar y distribuir esta
documentacin y los datos adjuntos, con sujecin a las siguientes condiciones:
Si es posible , las citas deben incluir tambin la direccin del sitio IPUMS : [Web Link] .
Adems , solicitamos que los usuarios nos envan una copia de las publicaciones ,
informes de investigacin , o haciendo uso de material educativo de los datos o la
documentacin. Material impreso debe ser enviada a :
IPUMS
Proyectos Censo histricas
Universidad de Minnesota
614 Ciencias Sociales
267 19th Avenue Sur
Minneapolis, MN 55455
Enviar todo el material electrnico para IPUMS ' @' hist.umn.edu
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 546730
perdidos?
Web:
Fuente :
Creador:
R.A. pescador
Donante:
Este contador se distingue de los datos presentados en el artculo Fishers (identificado por
Steve Chadwick, spchadwick '@' espeedaz.net ) . La muestra de 35 debe ser:
4.9,3.1,1.5,0.2 , "Iris - setosa " donde el error se encuentra en la cuarta funcin. La
muestra 38a : 4.9,3.6,1.4,0.1 , "Iris - setosa " dnde estn los errores en la segunda y
tercera caractersticas.
Atributo de la informacin:
1 . longitud spalo en cm
2 . anchura del spalo en cm
3 . Longitud del ptalo en cm
4 . ancho de ptalo en cm
5 . clase :
- Iris Setosa
- Iris versicolor
- Iris Virginica
Documentos pertinentes:
Dasarathy , BV ( 1980 ) " husmeando el Barrio: A Regla Nueva Estructura del Sistema de
Reconocimiento y Clasificacin en entornos parcialmente expuesta " . IEEE Transactions
on Pattern Analysis y la mquina de Inteligencia , vol. PAMI - 2 , N 1 , 67-71 .
[Web Link]
Gates, G.W. ( 1972 ) " La Reduccin de vecinos ms cercanos " . IEEE Transactions on
Information Theory , mayo de 1972, el 431-433 .
[Web Link]
Anthony K H Tung y Xin Xu y Beng Chin Ooi . CURLER : encontrar y visualizar no lineal
correlacionada Clusters . Conferencia SIGMOD . 2005 . [Ver Contexto ] .
Igor Fischer y Jan Polonia. Amplificar la estructura de la matriz de bloques para Espectral
Clustering. Laboratorio de Telecomunicaciones . 2005 . [Ver Contexto ] .
Yuan Jiang y Zhi -Hua Zhou. Edicin de datos Formacin para kNN Clasificadores con
Red Neural Ensemble. ISNN ( 1 ) . 2004 . [Ver Contexto ] .
Sugato Basu . Clustering semi - supervisado con un conocimiento limitado del fondo .
AAAI . 2004 . [Ver Contexto ] .
Dash Manoranjan y Huan Liu y Peter Scheuermann y Kian - Lee Tan . Agrupacin
jerrquica Fast y su validacin . Conocimiento de Datos. Eng, 44 . 2003 . [Ver Contexto ] .
Bob Ricks y Dan Ventura . El entrenamiento de un red neuronal de Quantum . PNI. 2003 .
[Ver Contexto ] .
Eibe Frank y Mark Hall. Visualizacin de estimadores de probabilidad Clase. PKDD . 2003
. [Ver Contexto ] .
Ross J. Michaels y Patrick Grother y P. Jonathan Phillips. El marco de evaluacin
HumanID NIST . AVBPA . 2003 . [Ver Contexto ] .
Sugato Basu . Aparece tambin como Informe Tcnico, UT -AI . Propuesta de doctorado.
2003 . [Ver Contexto ] .
Dick de Ridder y Olga Kouropteva y Oleg Okun y Matti Pietikinen y Robert PW Duin .
Supervisado Localmente Lineal incrustacin . ICANN. 2003 . [Ver Contexto ] .
Zhi -Hua Zhou y Jiang Yuan y Shifu Chen. La extraccin de reglas simblicas de conjuntos
de redes neuronales entrenadas . AI Commun , 16 . 2003 . [Ver Contexto ] .
Julie Greensmith . Nuevas fronteras para un sistema inmune artificial . Digital Media
Laboratorio de Sistemas HP Laboratorios Bristol. 2003 . [Ver Contexto ] .
Geoffrey Holmes y Bernhard Pfahringer y Richard Kirkby y Eibe Frank y Mark A. Hall.
Multiclase rboles de decisin alterna . ECML . 2002 . [Ver Contexto ] .
Jun Wang y Yu Bin y Les Gasser . Visualizacin Concepto Tree Based Clustering con
sombreados de similitud Matrices . ICDM . 2002 . [Ver Contexto ] .
David Horn y A. Gottlieb . El mtodo de Quantum Clustering. PNI. 2001 . [Ver Contexto ] .
Carlotta Domeniconi y Jing Peng y Dimitrios Gunopulos . Una mquina adaptativa Mtricas
de Clasificacin de patrones . PNI. 2000 . [Ver Contexto ] .
Asa Ben- Hur y David Horn y Hava T. Siegelmann y Vladimir Vapnik . A Apoyo Mtodo del
vector para Clustering. PNI. 2000 . [Ver Contexto ] .
David M J Tax y Robert P W Duin . Apoyar descripcin del dominio del vector. Pattern
Recognition Letters , 20 . 1999 . [Ver Contexto ] .
Tapio Elomaa y Juho Rousu . Encontrar Optimal Multi- Splits para Numerical atributos en
la Decisin Learning Tree . Grupo de trabajo ESPRIT en Neural y Computacional de
Aprendizaje. 1996 . [Ver Contexto ] .
Ron Kohavi . Ampliar los efectivos Precisin de Naive - Bayes clasificadores : Un hbrido
de rbol de decisiones . KDD . 1996 . [Ver Contexto ] .
Ron Kohavi . El poder de las tablas de decisin . ECML . 1995 . [Ver Contexto ] .
Ron Kohavi . Un estudio de la validacin cruzada y Bootstrap para la Precisin Estimacin
y seleccin del modelo . IJCAI . 1995 . [Ver Contexto ] .
Fran ois Poulet . La cooperacin entre los algoritmos automticos , algoritmos interactivos
y herramientas de visualizacin de Visual Data Mining . ESIEA Recherche . [Ver Contexto ]
.
Takao Mohri y Hidehiko Tanaka. Una de indexacin ptima Ponderacin Criterio de caso
tanto numrico y atributos simblicos . Informacin Ingeniera Curso de la Facultad de
Ingeniera de la Universidad de Tokio . [Ver Contexto ] .
Karol Grudzi nski y Wl / odzisl / aw Duch. SBL -PM : Un algoritmo simple para la Seleccin
de instancias de referencia en Mtodos basados en la similitud. Departamento de Mtodos
Computacionales , Universidad Nicols Coprnico. [Ver Contexto ] .
Chih- Wei Hsu y Cheng -Ru Lin. Una Comparacin de Mtodos para Mquinas de
Vectores Soporte multi - clase. Departamento de Ciencias de la Computacin e Ingeniera
de la Informacin de la Universidad Nacional de Taiwn . [Ver Contexto ] .
Ping Zhong y Masao Fukushima. Segundo Cono Orden Programacin Formulaciones para
Robust Clasificacin de clase mltiple. [Ver Contexto ] .
Jun Wang . Visualizacin Clasificacin con Shaded matriz de similitud . Bei Yu Les Gasser
Graduate School of Library and Information Science de la Universidad de Illinois en
Urbana- Champaign. [Ver Contexto ] .
Daichi Mochihashi y Gen -ichiro Kikui y Kenji Kita . Aprender no estructural Distancia
mtrica por distorsiones mnimas en Racimo. ATR oral laboratorios de investigacin
Idioma de traduccin . [Ver Contexto ] .
Wl odzisl / aw Duch y Karol Grudzinski . Reglas basadas en prototipos - Una nueva forma
de entender los datos. Departamento de Mtodos Computacionales , Universidad Nicols
Coprnico. [Ver Contexto ] .
Ron Kohavi y Brian Frasca . Caracterstica til subconjuntos y Rough Set reductos . Tercer
Taller Internacional de Rough Sets y Soft Computing . [Ver Contexto ] .
Geoffrey Holmes y Leonard E. Trigg . Una herramienta de diagnstico para Tree Based
Learning Clasificacin Supervisada Algoritmos . Departamento de Informtica Universidad
de Waikato Hamilton Nueva Zelanda. [Ver Contexto ] .
Michael R. Berthold y Klaus - Peter Huber. Desde Radial para Funciones de Base
Rectangular : Un nuevo enfoque para la Regla Aprendiendo de grandes conjuntos de
datos . Institut fur Rechnerentwurf und Fehlertoleranz (Prof. D. Schmid ) Universitat
Karlsruhe. [Ver Contexto ] .
Asa Ben- Hur y David Horn y Hava T. Siegelmann y Vladimir Vapnik . A Apoyo Mtodo del
vector para la agrupacin jerrquica . Facultad de IE y Gestin Technion . [Ver Contexto ] .
Cita de pedidos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 13557
perdidos?
Web:
Fuente:
Atributo de la informacin:
Rendimientos burstiles. Estambul bolsa de valores ndice nacional 100, Standard & Poora
s 500 ndice de rendimiento, ndice del mercado de valores de retorno de Alemania,
del mercado de valores de ndice de retorno de Reino Unido, del mercado de valores de
ndice de retorno de Japn, del mercado de valores de ndice de retorno de Brasil, el
ndice MSCI Europea, MSCI ndice de mercados emergentes
Documentos pertinentes:
Papel: Akbilgic, O., Bozdogan, H., Balaban, ME, (2013) Una novela modelo RBF Redes
Neuronales hbrido como pronosticador, Estadstica y Computacin. DOI 10.1007/s11222-
013-9375-7
Tesis: Oguz Akbilgic, (2011) Hibrit Radyal Tabanl Fonksiyon Alar ile
Deiken Se IMI ve Tahminleme: Menkul K ymet Yata ra m Kararlar na
likin Bir Uygulama, Universidad de Estambul
Cita de pedidos:
Papel: Akbilgic, O., Bozdogan, H., Balaban, ME, (2013) Una novela modelo RBF Redes
Neuronales hbrido como pronosticador, Estadstica y Computacin. DOI 10.1007/s11222-
013-9375-7
Tesis: Oguz Akbilgic, (2011) Hibrit Radyal Tabanl Fonksiyon Alar ile
Deiken Se IMI ve Tahminleme: Menkul K ymet Yata ra m Kararlar na
likin Bir Uygulama, Universidad de Estambul
ISOLET Data Set 2012/05/21
Resumen:
Objetivo: Predecir el que se hablaba carta-nombre - una tarea de clasificacin simple.
Caractersticas del
Nmero de
Conjunto de Multivariado 7797 rea: Ordenador
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 19706
perdidos?
Web:
Fuente:
Creadores: Ron Cole y Marcos Fanty Department of Computer Science and Engineering, .
Oregon Graduate Institute, Beaverton, OR
97006 cole '@' cse.ogi.edu , fanty'@' cse.ogi.edu Donante: Tom Dietterich Department of
Computer Science Universidad del Estado de Oregon, Corvallis, OR
97331 TGD '@' cs.orst.edu
Este conjunto de datos se gener como sigue. 150 sujetos hablaban el nombre de cada
letra del alfabeto dos veces. De ah, tenemos 52 ejemplos de entrenamiento de cada
altavoz. Las bocinas se agrupan en conjuntos de 30 altavoces cada uno, y se les conoce
como isolet1, isolet2, isolet3, isolet4 y isolet5. Los datos aparecen en isolet1 2 3 4. Datos
en orden secuencial, primero los oradores de isolet1, entonces isolet2, y as
sucesivamente. El equipo de prueba, isolet5, es un archivo independiente. Usted notar
que 3 ejemplos estn desaparecidos. Creo que fueron retirados debido a las dificultades
de grabacin. Creo que esto es un buen dominio para una tarea perceptual
ruidoso. Tambin es un muy buen dominio para probar las capacidades de escala de
algoritmos. Por ejemplo, C4.5 en este dominio es ms lento que el de
retropropagacin! He formateado los datos de C4.5 y proporcionado a los nombres de tipo
C4.5 archivo tambin.
Atributo de la informacin:
Fanty, M., Cole, R. (1991). Reconocimiento de letras hablado. En Lippman, RP, Moody, J.,
y Touretzky, DS (Eds). Los avances en los sistemas de procesamiento de informacin
neuronal 3. San Mateo, CA:. Morgan Kaufmann [Web Link] Dietterich, TG, Bakiri, G.
(1991) de correccin de errores Cdigos de salida del: Un mtodo general para la mejora
de los programas de aprendizaje inductivo multiclase. Actas de la Novena Conferencia
Nacional sobre Inteligencia Artificial (AAAI-91), Anaheim, CA:. AAAI Press [Web
Link] Dietterich, TG, Bakiri, G. (1994) Resolver multiclase Problemas de Aprendizaje a
travs de cdigos de salida de correccin de errores.Disponible como Url: [Web Link] [Web
Link]
Jakko Peltonen y Samuel Kaski. discriminativo Componentes de datos . IEEE. 2004. [ Ver
Contexto ]. Vassilis Athitsos y Stan Sclaroff. Impulsar Clasificadores vecino ms cercano
para el Reconocimiento multiclase . Universidad de Boston Computer Tech
Ciencia. Informe n, 2004-006. 2004. [ Ver Contexto ]. Littau David y Daniel Boley.Usando
poca memoria Representaciones con el clster conjuntos muy grandes de
datos . SDM. 2003. [ Ver Contexto ]. Inderjit S. Dhillon y Dharmendra S. Modha y W. Scott
Spangler. visualizacin Clase de datos de alta dimensin con aplicaciones . Departamento
de Ciencias de la Computacin de la Universidad de Texas. 2002. [ Ver Contexto ]. Erin L.
Allwein y Robert E. Schapire y Yoram Singer. Reducir multiclase a binario: un enfoque
unificador para clasificadores de margen . ICML. 2000. [ Ver Contexto ]. Hiroshi
Shimodaira y Jun Okui y Mitsuru Nakai. Modificado Aprendizaje Error La clasificacin
mnima y su aplicacin a las redes neuronales . SSPR / SPR.1998. [ Ver Contexto .] .
Khaled A. Alsabti y Sanjay Ranka y Vineet Singh NUBES: un clasificador rbol de
decisiones para grandes conjuntos de datos . KDD. 1998. [Ver Contexto ]. Thomas G.
Dietterich y Ghulum Bakiri. Resolver multiclase Problemas de Aprendizaje a travs de
cdigos de salida de correccin de errores . CoRR, csAI/9501101. 1995. [ Ver
Contexto ]. Shlomo Dubnov y Ran Yaniv y El Technion y Yoram Gdalyahu y Elad
Schneidman y Naftali Tishby y Golan Yona. Clustering Por Friends: A New Nonparametric
Pairwise Distancia basada algoritmo de clsteres . Universidad Ben Gurin. [ Ver
Contexto ]. Jakub Zavrel. An Empirical reexamen de votacin ponderada de k-
NN . Computational Linguistics. [ Ver Contexto ]. Hiroshi Shimodaira y junio Okui y Mitsuru
Nakai. MEJORA DEL RENDIMIENTO generalizacin del MCE / GPD
APRENDIZAJE . Facultad de Ciencias de la Informacin de Japn Instituto Avanzado de
Ciencia y Tecnologa Tatsunokuchi, Ishikawa. [ Ver Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Crdito japons Screening 1992/03/19
Data Set
Resumen:
Incluye teora del dominio (generado por hablar con expertos en el dominio japons); datos
en Lisp.
Caractersticas del
Nmero de
Conjunto de Multivariado 125 rea: Finanzas
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 33233
perdidos?
Web:
Fuente:
Creador:
Chiharu Sano
Donante:
Chiharu Sano
csano '@' bonnie.ICS.UCI.EDU
La teora fue generada por hablar con las personas en una empresa japonesa que
concede el crdito.
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Nmero
Tareas Valores N/
Clasificacin de Web 32064
asociadas: perdidos? A
Accesos:
Fuente:
Propietario original y los donantes: Mineichi Kudo, Jun Toyama, Masaru Shimbo Laboratorio de Procesamiento de
Informacin de la Divisin de Sistemas e Ingeniera de la Informacin Escuela de Ingeniera de la Universidad de
Hokkaido, Sapporo 060-8628, JAPN {mo, junio, Shimbo} @ main.eng.hokudai.ac . jp
Datos Conjunto de Informacin: Los datos fueron obtenidos del examen de nuestro clasificador de
nuevo desarrollo para las curvas multidimensionales (series de tiempo multidimensional). Nueve oradores masculinos
pronunciadas a los dos vocales japonesas / ae / sucesivamente. Para cada elocucin con parmetros anlisis
descritos continuacin aplicamos 12 grados anlisis prediccin lineal a obtener series tiempo discreto 12 coeficientes
cepstrum LPC. Esto significa que una declaracin de un altavoz se forma una serie de tiempo cuya duracin es en el
rango de 7-29 y cada punto de una serie de tiempo es de 12 funciones (12 coeficientes). El nmero de la serie de
tiempo es de 640 en total. Se utiliz un conjunto de 270 series de tiempo para la formacin y el otro conjunto de 370
series de tiempo para la prueba. Nmero de instancias (enunciados): * Formacin: (.. 30 expresiones de 9 altavoces
Ver archivo 'size_ae.train') 270 * Pruebas : 370 (. 24-88 enunciados por los mismos 9 altavoces en diferentes
oportunidades Ver archivo 'size_ae.test'.) Longitud de series de tiempo: * 7-29 dependiendo de
expresiones parmetros de anlisis: * Frecuencia de muestreo: 10 kHz * Longitud del marco: 25.6 ms * Duracin de
los turnos: 6.4ms * Grado de coeficientes LPC: 12 Archivos: * Archivo Formacin: ae.train * Archivo de prueba:
ae.test Formato: Cada lnea ae.train o ae.test representa 12 coeficientes LPC en el orden creciente separados por
espacios. Esto corresponde a un cuadro de anlisis. Las lneas se organizan en bloques, que son un conjunto de 7-29
lneas separadas por lneas en blanco y corresponde a una sola expresin verbal de / ae / con 7-29 frames. Cada
altavoz es un conjunto de consecutivo bloques. En ae.train hay 30 bloques para cada altavoz. Bloques 1-30
representan altavoz 1, los bloques 31 a 60 representan altavoces de 2, y as sucesivamente hasta el altavoz 9. En
ae.test, altavoces 1-9 tienen el nmero correspondiente de bloques: 31 35 88 44 29 24 40 50 29. As, los bloques 1 a
31 representan altavoz 1 (31 expresiones de / ae /), los bloques 32 a 66 representan el altavoz 2 (35 expresiones de /
ae /), y as sucesivamente.
KDD Copa 1998 Datos Conjunto de Datos
Resumen : Este es el conjunto de datos utilizados para la Segunda Internacional Descubrimiento
de Conocimiento y Minera de Datos Herramientas de la Competencia, que se celebr
conjuntamente con KDD-98
Nmero de
Valores
Tareas asociadas: Regresin S Web 23738
perdidos?
Accesos:
Fuente:
Ismail Parsa
Epsilon
50 Cambridge Street
Burlington MA 01803 EE.UU.
TEL: (781) 685 hasta 6734
FAX: (781) 685-0806
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
KDD Cup 1999 el conjunto de datos Datos
Resumen : Este es el conjunto de datos utilizados para la Tercera Internacional
Descubrimiento de Conocimiento y Minera de Datos Herramientas de la
Competencia, que se celebr conjuntamente con KDD-99Tercera
Internacional Descubrimiento de Conocimiento y Minera de Datos Herramientas de
la Competencia, que se celebr conjuntamente con KDD-99
Conjunto de datos Nmero de Ordenado
Multivariante 4000000 rea:
Caractersticas: instancias: r
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 42069
perdidos?
Accesos:
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
Salvatore J. Stolfo, Wei Fan, Wenke Lee, Andreas Prodromidis, y Philip K. Chan. Modelado basado
en costos y Evaluacin para la minera de datos con la aplicacin de Fraude y de deteccin de
intrusiones:. Resultados del JAM Project [enlace]Salvatore J. Stolfo, Wei Fan, Wenke Lee, Andreas
Prodromidis, y Philip K. Chan. Modelado basado en costos y Evaluacin para la minera de datos
con la aplicacin de Fraude y de deteccin de intrusiones : Resultados del JAM Project.
KEGG metablico Relacin de red (no dirigida)
Conjunto de Datos
Resumen : KEGG vas metablicas modelados como red de reaccin de la ONU
dirigida. Variedad de caractersticas grficas presentadas.
La clasificacin, Nmero de
Valores
Tareas asociadas: regresin, S Web 10203
perdidos?
clustering Accesos:
Fuente:
KEGG vas metablicas se pueden realizar en la red. Hay dos tipos de red / grfico se pueden
formar. Estos incluyen Reaccin Red y Relacin Network. En la red de reaccin, el sustrato o
compuesto del producto son considerados como nodos y los genes son tratados como
borde. Mientras que en la red de relaciones, del sustrato y del producto componds son considerados
como los bordes, mientras que los genes de la enzima y se colocan como nodos. Nos
herramienta de gran nmero de las rutas metablicas de KEGG XML. Ellos fueron modelados en el
grfico como se describi anteriormente. Con la ayuda de herramienta Cytoscape, variedad de
funciones de red se compunted.
Atributo de la informacin:
a) Camino de texto
b) de componentes conectados Entero (min: 1, mx: 39)
c) Dimetro Entero (min: 1, mx: 46)
d) Radio Entero (min: 1, mx: 13)
e) Centralizacin Entero (min : 0, max: 1)
f) la ruta ms corta Entero (min: 2, max: 23420)
g) Longitud caracterstica Camino entero (min: 1, [Web Link] )
h) Avg.num.Neighbours real ( [Web Link] , [Web Link] )
i) Densidad real ( [Web Link] , max: 1)
j) La heterogeneidad real (min: 0, [Web Link] )
k) Alejado Nodos Entero (min: 0, max: 3)
l) Nmero de Auto Loops Entero (min: 0, max: 4)
m) Multi-borde de nodo par de enteros (min: 0, max: 220)
n) reales (NeighborhoodConnectivity [Web Link] , [Web link] )
o) NumberOfDirectedEdges reales ( [Web Link] , [Web Link] )
p) Estrs real (min: 0, [Web Link] )
q) SelfLoops real (min: 0, [Web Link] )
r) Socio de MultiEdged NodePairs Entero (min: 0 , max: 3)
s) Grado real (min: 1, [Web Link] )
t) TopologicalCoefficient real (min: 0, max: 1)
u) BetweennessCentrality real (min: 0, [Web Link] )
v) radialidad reales ( [Web Link] , max: 30744573457)
w) real (Excentricidad [Web Link] , [Web Link] )
x) NumberOfUndirectedEdges real (min: 0, [Web Link] )
y) ClosenessCentrality real ( [Web Link] , mx : 1)
z) AverageShortestPathLength real ( [Web Link] , [Web Link] )
aa) ClusteringCoefficient real (min: 0, max: 1)
bb) nodeCount Entero (min: 2, max: 232)
cc) edgeCount Entero (min : 1, max: 444)
Documentos pertinentes:
Shannon, P., Markiel, A., Ozier, O., Baliga, NS, Wang, JT, Ramage, D., Amin, N., Schwikowski, B. y
Ideker, T. (2003) Cytoscape: un entorno de software para los modelos integrados de redes de
interaccin biomolecular.Genome Res., 13, 2498 "2504.
Citas:
La clasificacin, Nmero de
Valores
Tareas asociadas: regresin, N/A Web 11257
perdidos?
clustering Accesos:
Fuente:
KEGG vas metablicas se pueden realizar en la red. Hay dos tipos de red / grfico se pueden
formar. Estos incluyen Reaccin Red y Relacin Network. En la red de reaccin, el sustrato o
compuesto del producto son considerados como nodos y los genes son tratados como
borde. Mientras que en la red de relaciones, del sustrato y del producto componds son considerados
como los bordes, mientras que los genes de la enzima y se colocan como nodos. Nos
herramienta de gran nmero de las rutas metablicas de KEGG XML. Ellos fueron modelados en el
grfico como se describi anteriormente. Con la ayuda de herramienta Cytoscape, variedad de
funciones de red se compunted.
Atributo de la informacin:
a) Camino de texto
b) Nodos entero (min: 2, max: 116)
c) Los bordes enteros (min: 1, max: 606)
d) los componentes conectados entero (min: 1, mx: 13)
e) nmero entero Dimetro de red ( min: 1, mx: 30)
f) Red de Radio entero (min: 1, max: 2)
g) nmero entero ruta ms corta (min: 1, max: 3277)
h) Longitud caracterstica Camino real (min: 1, [Web Enlace ] )
i) Avg.num.Neighbours real (min: 1, [Web Link] )
j) Los nodos aislados entero (min: 0, max: 1)
k) nmero de autnomos Loops entero (min: 0, max: 0)
l) Multi-borde Nodo par de enteros (min: 0, mx: 57)
m) NeighborhoodConnectivity real (min: 1, [Web Link] )
n) grado de salida real (min: 0.5, [Web Link] )
o) Estrs real ( min: 0, [Web Link] )
p) SelfLoops entero (min: 0, max: 0)
q) PartnerOfMultiEdgedNodePairs real (min: 0, [Web Link] )
r) EdgeCount real (min: 1, [Web Link] )
s) BetweennessCentrality real (min: 0, [Web Link] )
t) indegree real (min: 0.5, [Web Link] )
u) Excentricidad real ( [Web Link] , [Web Link] )
v) ClosenessCentrality real ( [Web Link] , max: 1)
w) AverageShortestPathLength real ( [Web Link] , [Web Link] )
x) ClusteringCoefficient real (min: 0, [Web Link] )
Documentos pertinentes:
Shannon, P., Markiel, A., Ozier, O., Baliga, NS, Wang, JT, Ramage, D., Amin, N., Schwikowski, B. y
Ideker, T. (2003) Cytoscape: un entorno de software para los modelos integrados de redes de
interaccin biomolecular.Genome Res., 13, 2498 "2504.
Citas:
Valores Nmero de
Tareas asociadas: N/A No 20960
perdidos? Web Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Bergadano, F., Matwin, S. Michalski, R., Zhang, J., La medicin de la calidad de las descripciones
de conceptos, Procs. de la 3 Sesiones de Trabajo Europeo sobre Aprendizaje, Glasgow, octubre
de 1988. [Web Link]Bergadano, F., Matwin, S. Michalski, R., Zhang, J., Representar y adquisicin
imprecisa y conceptos dependientes del contexto en el Conocimiento Los sistemas basados,
Procs. de ISMIS'88, Holanda del Norte, 1988. [Web Link]
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 361
perdidos? A
Accesos:
Fuente:
Este conjunto de datosfue creada por Pedro FB Silva y Andrs RS Mar al uso de hoja
de especmenes recogidos por Rubim Almeida da Silva en la Facultad de Ciencias,
Universidad de Porto, Portugal.hoja especmenes recogidos por Rubim Almeida da Silva en
la Facultad de Ciencias , Universidad de Porto, Portugal.
Para ms detalles sobre este conjunto de datos y / o sus atributos, por favor lea el archivo
'README.pdf' incluido y / o consultar la tesis "Desarrollo de un Sistema de Reconocimiento
Automtico de Especies de Plantas" del Maestro disponible en [Web Link] .Automtico
Plant Especies reconocimiento 'disponible en
Atributo de la informacin:
1. Clase (Especies)
2. Espcimen Nmero
3. Excentricidad
4. Relacin de aspecto 5. Alargamiento 6. Solidez 7. Convexidad estocstico 8. Factor de
isoperimtrico 9. Mxima profundidad de penetracin 10. Lobedness 11. Intensidad
Media 12. Contrast Media 13. Suavidad 14. Tercer
momento 15. Uniformidad 16. EntropaRelacin de aspecto
Documentos pertinentes:
N/A
Citas:
Fuente:
Esta base de datos relacional consta de 24 nombres nicos en dos familias (que tienen
estructuras equivalentes). Hinton utiliza una unidad de salida nica para cada persona y
estaba interesado en la prediccin de las siguientes relaciones: esposa, marido, madre, padre,
hija, hijo, hermana, hermano, ta, to, sobrina, sobrino y. Hinton utilizado 104 pares de
vectores de entrada-salida (de un espacio de 12x24 = 288 posibles pares). La tarea de
prediccin es la siguiente: dado un nombre y una relacin, tienen las salidas sean en slo para
aquellos individuos (entre los 24) que satisfacen la relacin. Las salidas para todas las dems
personas deben estar apagados. resultados de Hinton: El uso de 100 vectores como entrada y
4 para las pruebas, sus resultados en dos pases produjeron 7 respuestas correctas de cada
8. Su red de 36 unidades de entrada, 3 capas de unidades ocultas, y 24 unidades de salida
utiliza 500 barridos del conjunto de entrenamiento durante el entrenamiento. resultados de
Quinlan: El uso de papel de aluminio, repiti el experimento 20 veces (en lugar de 2 tiempos
de Hinton). FOIL era correcta 78 de 80 veces en los casos de prueba.
Atributo de la informacin:
Documentos pertinentes:
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 21994
perdidos?
Accesos:
Fuente:
Fuente original: . Breiman, L. Friedman, JH, Olshen, RA y piedra, CJ (1984) Los rboles de
clasificacin y regresin. Wadsworth International Group: Belmont, California. . (Ver
pginas 43-49) Donante: David Aja
Datos Conjunto de Informacin:
Atributo de la informacin:
- Todos los valores de atributo son o bien 0 o 1, de acuerdo a si la luz correspondiente est
encendido o no para el dgito decimal.
- Cada atributo (excluyendo el atributo de clase, que es un nmero entero comprendido entre
0 y 9 inclusive) tiene un 10 % por ciento de posibilidades de ser invertido.
Documentos pertinentes:
Joao Gama y Ricardo Rocha y Pedro Medas. rboles de decisiones precisas para la minera
de flujos de datos de alta velocidad . KDD. 2003. [ Ver Contexto ]. Tim Leunig y D. Stott
Parker. comparaciones empricas de los diversos mtodos de votacin en el
embolsado . KDD. 2003. [ Ver Contexto ]. Xavier Llor y David E. Goldberg e Ivn Traus y
Ester Bernad i Mansilla. Precisin, parsimonia, y la generalidad en los sistemas de
aprendizaje evolutivo a travs de Seleccin multiobjetivo . IWLCS. 2002. [ Ver
Contexto ]. Xavier Llor y David E. Goldberg. Error Achievable mnima en el LED . Illinois
Algoritmos Genticos Laboratory de la Universidad de Illinois en Urbana-
Champaign.2002. [ Ver Contexto ]. Huan Liu y Rudy Setiono. Incremental Seleccin de
caractersticas . Appl. Intell, 9. 1998. [ Ver Contexto ]. Kamal Ali y Michael J.
Pazzani. Reduccin de errores a travs del aprendizaje mltiples descripciones . Aprendizaje
Automtico, 24. 1996. [ Ver Contexto ]. Vikas Sindhwani y P. Bhattacharya y Subrata
Rakshit. teora de la informacin de funciones de acreditacin en Mquinas de Vectores
Soporte multiclase . [ Ver Contexto ]. Maria Salamo y Elisabet Golobardes. Analizar Rough
Sets mtodos de ponderacin de Razonamiento Basado en Casos de Sistemas . Enginyeria i
Arquitectura La Salle. [ Ver Contexto ]. Ramn Sangesa y Ulises Corts. posibilista
Condicional de Dependencia, la similitud de la Informacin y Medidas: una aplicacin de
recuperacin de la red causal . Departament de Sistemes i Llenguatges Informtics
Departament de Sistemes i Llenguatges Informtics Universidad Politcnica de Catalua
Universidad Politcnica de Catalua. [ Ver Contexto ].
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Valores N/ Nmero de
Tareas asociadas: Clasificacin 12625
perdidos? A Web Accesos:
Fuente:
Ciencia e Ingeniera
New South Wales, Australia
Este conjunto de datos contiene los casos jurdicos de Australia de la Corte Federal de
Australia (FCA). Los casos fueron descargados de AustLII ( [Web Link] ). Se incluyeron
todos los casos a partir del ao 2006,2007,2008 y 2009. Lo construimos para experimentar
con el resumen automtico y anlisis de citas. Para cada documento se recogieron frases,
citas, frases frases citas y clases de citas. Catchphrases se encuentran en el documento, se
utilizaron las frases son estndar de oro para nuestros experimentos de resumen. Frases citas
se encuentran en casos posteriores que citan el presente caso, utilizamos frases de citacin
para el resumen. Frases de citas son las frases (donde est disponible) de los dos casos
posteriores que citan el caso de autos, y los casos de mayor edad citados por el presente
caso. Clases de citas se indican en el documento, y se refieren al tipo de tratamiento que se da
a los casos citados en el presente caso.resumen automtico y anlisis de citas. Para cada
documento se recogieron frases, citas, frases frases citas y clases de citas. Catchphrases se
encuentran en el documento, se utilizaron las frases son estndar de oro para nuestros
experimentos de resumen. Frases citas se encuentran en casos posteriores que citan el
presente caso, utilizamos frases de citacin para el resumen. Frases de citas son las frases
(donde est disponible) de los dos casos posteriores que citan el caso de autos, y los casos de
mayor edad citados por el presente caso. Clases de citas se indican en el documento, y se
refieren al tipo de tratamiento que se da a los casos citados en el presente caso.
Atributo de la informacin:
Documentos pertinentes:
Citas:
Valores Nmero de
Tareas asociadas: Clasificacin No 48433
perdidos? Web Accesos:
Fuente:
Los ejemplos son completa y libre de ruidos. Los ejemplos altamente simplificado el
problema. Los atributos no describen plenamente todos los factores que afectan la decisin
de qu tipo, si los hubiere, para que quepa. Notas:-. Esta base de datos est completa (todas
las combinaciones posibles de pares atributo-valor se representan) - Cada instancia se ha
completado y correctas. - 9 reglas cubren el conjunto de entrenamiento.
Atributo de la informacin:
- 3 Clases
1: el paciente debe estar equipado con lentes de contacto duros,
2: el paciente debe estar equipado con lentes de contacto blandas,
3: el paciente no debe estar equipado con lentes de contacto. 1. edad del paciente: (1) joven,
(2) pre-presbicia, (3) presbicia 2. prescripcin espectculo: (1) miope, (2)
hipermtrope 3. astigmtica: (1) no, (2) s 4. romper la velocidad de produccin: (1)
reduccin, (2) la normalidad
Documentos pertinentes:
Ke Wang y Zhou Shiyu y Ada Wai Chee-Fu y Jeffrey Xu Yu. Minera Cambios de
Clasificacin por correspondencia Tracing . SDM. 2003. [ Ver Contexto ]. Bob Ricks y Dan
Ventura. El entrenamiento de un red neuronal de Quantum . PNI. 2003. [ Ver
Contexto ]. Jeremy Kubica y Andrew Moore. Probabilstico de identificacin de ruido y
limpieza de datos . ICDM. 2003. [ Ver Contexto ]. Jim Prentzas y Ioannis Hatzilygeroudis y
Athanasios K. Tsakalidis. Actualizacin de una base de reglas hbrido con New Empirical
Fuente del Conocimiento . ICTAI. 2002. [ Ver Contexto ]. Pedro Domingos. Descubrimiento
de Conocimiento a travs de mltiples modelos . Intell. Datos Anal, 2. 1998. [ Ver
Contexto ]. J. Kent Martin y Daniel S. Hirschberg. Pequeos estadsticas de la muestra para
la clasificacin de error Precios I: Error Rate Mediciones . Departamento de Informacin y
Ciencias de la Computacin de la Universidad de California, Irvine. 1996. [ Ver
Contexto ]. Geoffrey I. Webb. OPUS: Un Algoritmo admisible Eficiente para Unordered
Buscar . J. Artif. Intell. Res.. .. (JAIR, 3 1995 [ Ver Contexto .] Christophe Giraud y Tony
Martnez y Christophe G. Giraud-Carrier. Universidad del Departamento de Ciencias de la
Computacin de la ILA Bristol: Combinar inductivo de aprendizaje con el conocimiento
previo y Razonamiento 1995 [.. Ver Contexto ]. Anthony D. Griffiths y el Puente de
Derek. A Criterio para la Evaluacin de los clasificadores basados en la caja . Departamento
de Ciencias de la Computacin de la Universidad de York. [ Ver Contexto ]. Mehmet
Dalkilic y Arijit Sengupta. Un clasificador-Logic terico llamado Crculo . Facultad de
Informtica Centro de Genmica y Bioinformtica de la Universidad de Indiana. [ Ver
Contexto ]. Christophe G. Giraud-Carrier y Tony Martnez.UN MODELO DE
APRENDIZAJE INCREMENTAL DE RAZONAMIENTO sentido comn . Departamento
de Ciencias de la Computacin de la Universidad Brigham Young. [ Ver Contexto ].
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Carta de Reconocimiento Conjunto de Datos
Resumen : Base de datos de caractersticas de la imagen de personajes, tratar de identificar
a la carta
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 100366
perdidos?
Accesos:
Fuente:
Creador: David J. Pizarra Odesta Corporation; 1890 Maple Ave., Suite 115, Evanston, IL
60201 Donante: David J. Pizarra ( Dave '@' math.nwu.edu ) (708) 491-3867
Atributo de la informacin:
Documentos pertinentes:
Xiaoli Z. Helecho y Carla Brodley. Conjuntos de clster para alta Clustering Dimensional:
un estudio emprico . Journal of Machine Learning Investigacin n, a. 2004. [ Ver
Contexto ]. Jaakko Peltonen y Arto Klami y Samuel Kaski.Mejora Aprendizaje de Riemann
Mtricas para el anlisis exploratorio . La mejora del aprendizaje de Riemann Mtricas para
el anlisis exploratorio. Redes Neuronales. 2004. [ Ver Contexto ]. Giorgio
Valentini. mtodos Ensemble basados en prejuicios - anlisis de varianza Tesis Series DISI-
TH-2003 . Dipartimento di Scienze e Informatica dell'Informazione. 2003. [ Ver
Contexto ]. Dmitry Pavlov y Alexandrin Popescul y David M. Pennock y Lyle H.
Ungar.Mezclas de Modelos condicional de mxima entropa . ICML. 2003. [ Ver
Contexto ]. Kristin P. Bennett y Ayhan Demiriz y Richard Maclin. Explotar los datos no
marcados en los mtodos de conjunto . KDD. 2002. [ Ver Contexto]. Stephen D.
Bay. clasificacin vecino ms cercano de varios subconjuntos de
caractersticas . Intell. Datos Anal, 3. 1999. [ Ver Contexto ]. Thomas G. Dietterich. Prueba
estadstica aproximada para la comparacin de clasificacin supervisada algoritmos de
aprendizaje . Neural Computation, 10. 1998. [ Ver Contexto ]. Georgios Paliouras y David S.
Bre. El efecto de las caractersticas numricas sobre la escalabilidad de los programas de
aprendizaje inductivo . ECML. 1995. [ Ver Contexto ]. Thomas G. Dietterich y Ghulum
Bakiri. Resolver multiclase Problemas de Aprendizaje a travs de cdigos de salida de
correccin de errores . CoRR, csAI/9501101. 1995. [Ver Contexto ]. Adil M. Bagirov y
Julien Ugon. Un algoritmo para el clculo de la funcin lineal a trozos que separa dos
sets . CIAO, Escuela de Informtica y Ciencias Matemticas de la Universidad de
Ballarat. [ Ver Contexto ].Miguel Moreira y Alain Hertz y Eddy Mayoraz. binarizacin datos
por eliminacin discriminante . Actas del Taller ICML-99: De Aprendizaje Automtico
para. [ Ver Contexto ]. Arto Klami y Samuel Kaski y Ty n ohjaaja y Janne
Sinkkonen. Universidad Tecnolgica de Helsinki Departamento de Ingeniera Fsica y
Matemticas Arto Klami regularizada discriminativo Clustering . Regularizada
discriminativo Clustering. [ Ver Contexto ]. Shailesh Kumar y Melba Crawford y Joydeep
Ghosh. Un marco verstil para las imgenes de marcar con un gran nmero de
clases . Departamento de Ingeniera Elctrica e Informtica. [ Ver Contexto ]. Amund
Tveit. emprico comparativo de precisin y rendimiento para el clasificador MIPSVM con
clasificadores existentes . Divisin de Intelligent Departamento de Informtica y Ciencias de
la Informacin de la Universidad Noruega de Ciencia y Tecnologa de Sistemas.[ Ver
Contexto ]. Hirotaka Inoue y Hiroyuki Narihisa. Incremental Learning con auto-organizacin
neural Grove . Departamento de Ingeniera Elctrica y Ciencias de la Informacin, Kure
Colegio Nacional de Tecnologa. [ Ver Contexto ]. Jaakko Peltonen y Arto Klami y Samuel
Kaski. Mtrica de Aprendizaje para la Visualizacin de Informacin . Redes Neuronales
Research Centre Helsinki University of Technology. [ Ver Contexto ].
Ingeniera Informtica . [
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Libras Movimiento Conjunto de Datos
Resumen : El conjunto de datos contiene 15 clases de 24 casos cada uno. Cada referencias
de clase a un tipo de movimiento de la mano en LIBRAS (nombre portugus 'Lingua
Brasileira de Sinais', oficial lengua brasilea de seales).
Nmero de
Clasificacin, Valores N/
Tareas asociadas: Web 36918
Clustering perdidos? A
Accesos:
Fuente:
Creadores:
Daniel Baptista Dias (Dias, DB)
Sarajane Marques Peres (Peres, SM)
Helton Hideraldo Bscaro (Bscaro. HH)
{danielbdias, heltonhb, sarajane} en usp.br Donante: Universidad de So Paulo - Brasil
Documentos pertinentes:
DIAS, DB; MADEO, RCB; ROCHA, T.; Biscaro, HH; PERES, SM.
Mano Movimiento Reconocimiento por Brasil el lenguaje de seas : un estudio basado en la
distancia Usando Redes Neuronales .
En: 2009 Conferencia Conjunta Internacional sobre Redes Neuronales, 2009, Atlanta, GA.
Actas del 2009 Conferencia Conjunta Internacional sobre Redes Neuronales. Eau Claire ,
WI, EE.UU.: Documation LLC, 2009. p. 697-704. Objetos Digitales
Identificador 10.1109/IJCNN.2009.5178917
Citas:
Nmero de
Valores
Tareas asociadas: N/A No Web 48869
perdidos?
Accesos:
Fuente:
Los primeros 5 variables son todos los exmenes de sangre que se cree que son sensibles a
los trastornos del hgado que podran derivarse de un consumo excesivo de alcohol. Cada
lnea en el archivo bupa.data constituye el registro de un solo individuo masculino. Parece
que las bebidas> 5 es una especie de selector en esta base de datos. Consulte la Gua /
Manual del usuario PC BEAGLE para ms informacin.archivo de datos que constituye el
rcord de un solo individuo masculino.
Atributo de la informacin:
. Zhi-Hua Zhou y Jiang Yuan NeC4.5: Neural Ensemble Based C4.5 . IEEE
Trans. Conocimiento. Datos Eng, 16. 2004. [ Ver Contexto ]. Yuan Jiang y Zhi-Hua
Zhou. datos de entrenamiento edicin para clasificadores KNN con Red Neural
Ensemble . ISNN (1). 2004. [ Ver Contexto ]. Glenn Fung y M. Murat Dundar y Jinbo Bi y
Bharat Rao. Un algoritmo iterativo rpido para fisher discriminante utilizando ncleos
heterogneos . ICML. 2004. [ Ver Contexto]. Jochen Garcke y Michael
Griebel. Clasificacin con rejillas dispersos mediante funciones de base
simplicial . Intell. Datos Anal, 6. 2002. [ Ver Contexto ]. Michail Vlachos y Carlotta
Domeniconi y Dimitrios Gunopulos y George Kollios y Nick Koudas. tcnicas de reduccin
de dimensionalidad no lineales para la clasificacin y visualizacin . KDD. 2002. [ Ver
Contexto ]. Xavier Llor y David E. Goldberg e Ivn Traus y Ester Bernad i
Mansilla. Precisin, parsimonia, y la generalidad en los sistemas de aprendizaje evolutivo a
travs de Seleccin multiobjetivo . IWLCS. 2002. [ Ver Contexto ]. Jochen Garcke y Michael
Griebel y Michael Tes. Minera de datos con Sparse Grids .Informtica, 67. 2001. [ Ver
Contexto ]. Jochen Garcke y Michael Griebel. La minera de datos con rejillas dispersos
mediante funciones de base simplicial . KDD. 2001. [ Ver Contexto ]. Petri Kontkanen y
Jussi Lahtinen y Petri Myllymki y Henry Tirri. visualizacin bayesiano no supervisado de
los datos de alta dimensin . KDD. 2000. [ Ver Contexto ]. Carlotta Domeniconi y Jing Peng
y Dimitrios Gunopulos. Una mquina adaptativa Mtricas de Clasificacin de
patrones . PNI. 2000. [ Ver Contexto .] . Guido Lindner y Rudi Studer AST: Apoyo a la
seleccin del algoritmo con Enfoque CBR . PKDD. 1999. [ Ver Contexto ]. Iaki Inza y
Pedro Larraaga y Basilio Sierra y Ramn Etxeberria y Jos Antonio Lozano y Jos Manuel
Pea. Representar el comportamiento de los algoritmos de aprendizaje de clasificacin
supervisada por redes bayesianas . Pattern Recognition Letters, 20. 1999. [ Ver
Contexto ]. Kristin P. Bennett y Erin J. Bredensteiner. Un mtodo paramtrico Optimizacin
de Aprendizaje Automtico . INFORMA Journal on Computing, 9. 1997. [ Ver
Contexto ]. Jennifer A. Azul y Kristin P. Bennett. Hybrid Extreme Point Bsqueda
Tab . Departamento de Ciencias Matemticas del Instituto Politcnico
Rensselaer. 1996. [ Ver Contexto ]. Peter D. Turney. sensibles a los costes de clasificacin:
evaluacin emprica de una Decisin gentico hbrido Tree Induccin algoritmo . CoRR,
csAI/9503102. 1995. [ Ver Contexto ]. Gabor Melli. Un enfoque basado en modelos
perezoso en On-Line Clasificacin . Universidad de la Columbia Britnica. 1989. [ Ver
Contexto]. Aynur Akku y H. Altay Gvenir. Ponderacin Caractersticas de k vecinos ms
prximos: Clasificacin en Feature Proyecciones . Departamento de Ingeniera Informtica y
Ciencias de la Informacin de la Universidad Bilkent. [Ver Contexto ]. Greg Ridgeway. El
Estado de Impulso . Departamento de Estadstica de la Universidad de Washington. [ Ver
Contexto ]. Adil M. Bagirov y Alex Rubinov y AN Soukhojak y John
Yearwood. clasificacin de datos no supervisada y supervisada a travs de no lisos y
optimizacin global . Escuela de Tecnologa de la Informacin y Ciencias Matemticas de la
Universidad de Ballarat. [ Ver Contexto ]. Adil M. Bagirov y John Yearwood. Un nuevo
algoritmo de optimizacin no lisos para la agrupacin . Centro de Informtica y
Optimizacin Aplicada de la Facultad de Informtica y Ciencias Matemticas de la
Universidad de Ballarat. [ Ver Contexto ]. H. Altay T uvenir y Aynur Akkus. PONDERADO
K MAS CERCANA CLASIFICACIN VECINO DE PROYECCIONES DE
FUNCIONES . Departamento de Ingeniera Informtica y Ciencias de la Informacin de la
Universidad Bilkent. [ Ver Contexto ]. C. . Tito Brown y Harry W. Bullen y Sean P. Kelly y
Robert K. Xiao y Steven G. Satterfield y John G. Hagedorn y Judith E.
Devaney Visualizacin y Minera de Datos en un inmersivo entorno 3D: Proyecto de Verano
2003 . [ Ver Contexto ]. David R. Musicant. MINERA DE DATOS A TRAVS DE
PROGRAMACIN MATEMTICA Y EL APRENDIZAJE DE LA MQUINA . Doctor en
Filosofa (Ciencias de la Computacin) UNIVERSIDAD. [ Ver Contexto ].
Citas:
Univariante,
Conjunto de datos Nmero de
Secuencial, 164860 rea: Vida
Caractersticas: instancias:
Time-Series
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 36612
perdidos?
Accesos:
Fuente:
La gente utiliza para la grabacin de los datos llevaban cuatro etiquetas (en el tobillo
izquierdo, la derecha en el tobillo, el cinturn y el pecho).
Cada instancia es un dato de localizacin para una de las etiquetas. La etiqueta puede ser
identificado por uno de los atributos.
Atributo de la informacin:
Documentos pertinentes:
Citas:
N
Conjunto de datos Domain- Nmero de
/ rea: Ordenador
Caractersticas: Theory instancias:
A
N
Caractersticas del Nmero de
N/A / Fecha Donado N/A
atributo: atributos:
A
N
Valores Nmero de
Tareas asociadas: N/A / 11386
perdidos? Web Accesos:
A
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Citas:
Valores N/ Nmero de
Tareas asociadas: Clasificacin 17395
perdidos? A Web Accesos:
Fuente:
El Satlite Astronmico Infrarrojo (IRAS) fue el primer intento para asignar el total del
cielo en longitudes de onda infrarrojas. Esto no se poda hacer de observatorios de tierra
debido a que grandes porciones del espectro de infrarrojos es absorbida por la atmsfera. El
programa de observacin principal fue la plena alta resolucin cielo mapeo realizado en los
escaneos en 4 frecuencias. El programa de la Resolucin Observacin Bajo (IRAS-LRS)
observ fuentes de alta intensidad durante dos bandas espectrales continuas. Esta base de
datos se deriva de un subconjunto de las observaciones LRS de mayor calidad tomadas entre
12h y 24h ascensin recta. Esta base de datos contiene 531 espectros de alta calidad
derivados de la base de datos de IRAS-LRS. Los datos originales contenan 100 mediciones
espectrales en cada una de las dos bandas superpuestas. De ellos, 44 de la banda azul y 49 de
la banda roja canales contienen mediciones de flujo utilizables. Slo estos se incluyen
aqu. Los valores originales intensidades espectrales se comprimen a 4 dgitos, y cada
espectro incluye 5 parmetros de cambio de escala. Hemos utilizado los LRS especificados
algoritmo para cambiar la escala de stos a las unidades de intensidad espectral
(Janskys). Total de las diferencias de intensidad, han sido eliminados por la normalizacin de
cada espectro con un valor medio de 5000. Esta base de datos se obtuvo originalmente para
su uso en el desarrollo y las pruebas de nuestro sistema AutoClass para la clasificacin
bayesiana. No hemos mantenido ningn resultado de este desarrollo, al haber concentrado
nuestros esfuerzos de una versin 5425 elemento de los mismos datos. Nuestras
clasificaciones se basan en la modelacin simultnea de los 93 intensidades espectrales. Con
la base de datos ms grande que pudimos encontrar clases que corresponden bien con los
tipos espectrales conocidas asociadas con determinados tipos estelares. Tambin
encontramos las clases que coinciden con el espectro esperado de ciertos procesos estelares
bajo investigacin por los astrnomos de Ames. Estas clases han ampliado
considerablemente el conjunto de estrellas que son investigados por los investigadores. datos
originales: La fortran original de archivo de datos se da en los espectros de 2.data. Los
espectros-2.head archivo contiene informacin sobre el contenido. De archivos de datos y
cmo cambiar la escala de las intensidades espectrales comprimido.
Atributo de la informacin:
Documentos pertinentes:
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
LSVT Voz Rehabilitacin conjunto de datos
Resumen : 126 muestras de 14 participantes, 309 funciones. Objetivo: evaluar si la
voz tratamiento de rehabilitacin llevan a fonaciones considerado "aceptable" o
"inaceptable" (problema de clasificacin de clase binario).
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 157
perdidos? A
Accesos:
Fuente:
El conjunto de datos fue creada por Athanasios Tsanas (tsanasthanasis '@' gmail.com) de
la Universidad de Oxford .
El artculo original demostr que es posible replicar correctamente evaluacin binaria de los
expertos, con aproximadamente 90% de precisin utilizando tanto 10 veces cruzar a la
validacin y dejando uno sujeto Salida validacin.Hemos experimentado con ambos bosques
al azar y mquinas de vectores soporte , utilizando enfoques estndar para optimizar
hiperparmetros de la SVM. Ser interesante si los investigadores pueden mejorar en este
descubrimiento utilizando avanzadas herramientas de aprendizaje automtico. Detalles para
el conjunto de datos se pueden encontrar en el siguiente documento. A. Tsanas, MA Little, C.
Fox, LO Ramig: Objective evaluacin automtica de tratamiento de rehabilitacin del
habla en s de Parkinson disease , IEEE Transactions on?? Sistemas Neuronales e
Ingeniera de Rehabilitacin, vol. 22, pginas 181-190, enero 2014 A preimpresin libre
disposicin se halla disponible en el sitio web del primer autor.
Atributo de la informacin:
Documentos pertinentes:
Citas:
Valores Nmero de
Tareas asociadas: Clasificacin S 61748
perdidos? Web Accesos:
Fuente:
Los datos fueron publicados en: Hong, ZQ y Yang, JY "Optimal discriminante Plano para un
pequeo nmero de muestras y Diseo Forma de clasificador en el avin", Reconocimiento
de Patrones, vol. 24, No. 4, pp 317-324, 1991. Donante: Stefan
Aeberhard, stefan '@' coral.cs.jcu.edu.au
Estos datos se usaron por Hong y Young para ilustrar el poder del plano discriminante
ptimo incluso en entornos que plantean los malos. La aplicacin del mtodo KNN en el
plano resultante dio 77% de precisin. Sin embargo, estos resultados estn fuertemente
sesgadas (Ver segundo rbitro que Aeberhard. Anterior, o por correo electrnico
a stefan '@' coral.cs.jcu.edu.au ). Resultados obtenidos por Aeberhard et al. son: RDA:
62,5%, 53,1% KNN, Opt. Disco. Plano 59,4% Los datos describen 3 tipos de cnceres
pulmonares patolgicos. Los autores no dan ninguna informacin sobre las variables
individuales, ni en los que se utiliz originalmente los datos. Notas: - En los datos originales
4 valores para el quinto atributo eran -1. Estos valores han sido cambiados
para? (Desconocido). (*) - En el valor original de datos 1 para el atributo 39 era 4. Este valor
se ha cambiado a? (Desconocido). (*)
Atributo de la informacin:
Atributo 1 es la etiqueta de clase. Todos los atributos predictivos son nominales, tomando
valores enteros 0-3
Documentos pertinentes:
Jinyan Li y Limsoon Wong. Uso de reglas para el Anlisis de Datos Bio-mdica: una
comparacin entre C4.5 y PCL . Waim. 2003. [ Ver Contexto ]. Manoranjan Dash y Huan
Liu. Hbrido Bsqueda de subconjuntos de caractersticas . PRICAI. 1998. [ Ver
Contexto ]. Glenn Fung y Sathyakama Sandilya y R. Bharat Rao. regla de extraccin a partir
de Mquinas de Vectores Soporte lineales . Computer-Aided Diagnosis & Therapy, Siemens
Medical Solutions, Inc. [ Ver Contexto ].
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Linfografa Conjunto de Datos
Resumen : Este dominio linfografa se obtuvo de la University Medical Centre, Instituto
de Oncologa, Ljubljana, Yugoslavia. (Acceso restringido)
Valores Nmero de
Tareas asociadas: Clasificacin No 27599
perdidos? Web Accesos:
Fuente:
Este es uno de los tres dominios proporcionados por el Instituto de Oncologa que ha
aparecido varias veces en el aprendizaje de la mquina literatura. (Ver tambin cncer de
mama y tumor primario.)
Atributo de la informacin:
--- NOTA: Todos los valores de los atributos en la base de datos han sido introducidos
como valores numricos que corresponden a su ndice en la lista de valores de atributos
para ese dominio atributo como se indica a continuacin.
1. clase: hallazgo normal, metstasis, linftico maligno, fibrosis
2. linfticos: normal, en forma de arco, deformados, desplazados
3. bloque de affere: no, s
4. bl. de la linfa. c: no, s
5. bl. de la linfa. s: no, s
6. by pass: no, s
7. extravasa: no, s
8. regeneracin de: no, s
9. temprano en la captacin: no, s
10. lym.nodes dimin: 0-3
11. lym.nodes Enlar: 1-4
12. cambios en linfoma:. frijol, ovalados, redondos
13. defecto en el nodo: no, lacunar, lac. marginal, lac. el centro
14. cambios en el nodo: no, lacunar, lac. margen, lac. el centro
15. cambios en las estru: no, granulada, la cada-como, gruesa, diluida, reticular, pelado,
desmayo,
16. formas especiales: no, clices, vesculas
17. dislocacin de: no, s
18. exclusin de los no: no, s
19. No. de nodos en: 0-9, 10-19, 20-29, 30-39, 40-49, 50-59, 60-69,> = 70
Documentos pertinentes:
Citas:
Valores N/ Nmero de
Tareas asociadas: N/A 11501
perdidos? A Web Accesos:
Fuente:
Ross D. King
Departamento de Ciencias de la Computacin , Universidad de Gales, Aberystwyth, SY23
3DB, Gales rdk '@' aber.ac.uk http://users.aber.ac.uk/rdk
Los datos fueron recolectados de varias fuentes, entre ellas el Centro Sanger ( [Web Link] )
y SWISSPROT ( [Web Link] ). Estructura de prediccin fue hecha por PROF ( [Web
Link] ). La bsqueda de homologas fue hecha por PSI-BLAST ( [Web Link] .) Los datos
estn en formato de registro de datos. Los valores perdidos no son explcitas, pero algunos
genes tienen ms relaciones que otras. Dependencias: M. genes de tuberculosis (ORF) estn
relacionados entre s por el tb_to_tb_evalue predicado (TBNumber, E-valor). Se relacionan
con otros (SWISSPROT) las protenas por el e_val predicado (AccNo, E-valor). Todos los
datos de un solo gen (ORF) se encierra entre delimitadores de la forma: begin (modelo
(TBNumber)). final (modelo (TBNumber)). Otra informacin relevante: Las clases
funcionales de genes estn en una jerarqua. Ver [Web Link] . Hay dos archivos de registro
de datos: tb_data.pl y ecoli_functions.pl 1. tb_functions.pl Enumera las clases y funciones
de la ORF. Las lneas son de la siguiente forma: la clase ([1,0,0,0], "el metabolismo de
pequea molcula"). clase ([1,1,0,0], "Degradacin"). clase ([1,1 , 1,0], "compuestos de
carbono"). Los argumentos son una lista de 4 nmeros (que describen la clase en los 4
niveles diferentes), seguido por una clase de cadena de descripcin. Por ejemplo, la funcin
(tb186, [1,1,1,0], 'bgls "," beta-glucosidasa "). Los argumentos son varios ORF, la lista de
nmeros de clase 4, el nombre de genes (o null si no hay nombre de genes) en comillas
simples , descripcin ORF entre comillas dobles. 2. tb_data.pl de datos para cada ORF
(gen) est delimitada por BEGIN (modelo (X)). final (modelo (X)). donde X es el nmero
de ORF. Otros predicados son los siguientes (ejemplos): tb_protein (X). % X es el nmero
de genes de funcin (2,1,5,0, 'gyrA', 'ADN girasa subunidad A'). % 4 niveles de jerarqua
funcional, gen nombre, descripcin coding_region (7302,9815). % Start,
end. enteros tb_mol_wt (19934). % Nmero entero de acceso (1, e, 20). % Int (posicin),
{e, i, b}, int (longitud) access_exposed (1,20). % Int (posicin), int
(longitud) access_intermediate (26,1). % Int (posicin), int (longitud) access_burried
(1,2). % Int (posicin), int (longitud) access_dist (b, 42.8). % {E, i, b}, float
(porcentaje)sec_struc (1, c, 23). % Int (posicin), {a, b, c}, int (longitud) sec_struc_coil
(1,23). % Int (posicin), int (longitud) sec_struc_alpha (1,15). % Int (posicin), int
(longitud) sec_struc_beta (1,6). % Int (posicin), int (longitud) struc_dist (a, 32.1). % {A, b,
c}, float (porcentaje) sec_struc_conf (78.8). % De flotacin (de
confianza) sec_struc_conf_alpha (88.9). % De flotacin (de confianza) sec_struc_conf_beta
(58.0). % De flotacin (de confianza)sec_struc_conf_coil (77.7). % De flotacin (de
confianza) psi_sequences_found (1,7). % Cuntos encontrado, que
iteracin psi_sequences_found_again (2,7). % Cuntos encontrado, que la
iteracin psi_sequences_found_new (2,0). % Cuntos encontrado, que la
iteracin amino_acid_ratio (a, 11.2). % de aminocidos carta, flotar amino_acid_pair_ratio
(a, c, 0,0). Carta de aminocidos%, carta de aminocidos, float (de 1000, es decir, 2,8 =
0,28%)sequence_length (187). % Nmero entero tb_to_tb_evalue (tb3671, 1.100000e-
01). % Nmero de ORF, e-valor (doble) e_val (p35925, 7.0e-59). % SWISSPROT no la
adhesin, e-valor (dobles) especie (p35925, 'streptomyces_coelicolor'). % SWISSPROT acc
no, cadena de clasificacin (p35925, bacterias). % SWISSPROT acc no, nombre mol_wt
(p35925, 19772). % SWISSPROT acc no, nmero entero de palabras clave (p35925,
'hypothetical_protein'). % SWISSPROT acc no, cadena db_ref (p35925, EMBL, l27063,
g436026, null). % SWISSPROT acc no, Identificacin del db, id primaria, id secundaria, id
estado signalip (c, 35, no). % {C, a, s}, int (pptido seal c / y / s score), s / no signalip (ss,
1,34, no). % Ss, int, int, s / no signalip (escote, 59,60). % Escote, int / null, int /
null hydro_cons (-0.498, -0.474,0.624,3.248,0.278). % Matrimoniales, dobles, dobles,
matrimoniales, dobles gene_name (p41514, 'gyrB'). % SWISSPROT acc no, cadena
Atributo de la informacin:
N/A
Documentos pertinentes:
Citas:
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 40403
perdidos? A
Accesos:
Fuente:
Isabelle Guyon
Clopinet
955 Creston carretera
Berkeley, CA 90708 isabelle '@' clopinet.com
Datos Conjunto de Informacin:
Atributo de la informacin:
Documentos pertinentes:
Citas:
Isabelle Guyon, Steve R. Gunn, Asa Ben-Hur, Gideon Dror, 2004. Anlisis de los
resultados del desafo de seleccin de caractersticas NIPS 2003. En:. NIPS .
Valores Nmero de
Tareas asociadas: Clasificacin No 37670
perdidos? Web Accesos:
Fuente:
Los datos son generados MC (ver ms abajo) para simular el registro de partculas de alta
energa gamma en un telescopio atmosfrica gamma de Cherenkov con base en tierra
utilizando la tcnica de formacin de imgenes.Telescopio gamma de Cherenkov observa
rayos gamma de alta energa, tomando ventaja de la radiacin emitida por las partculas
cargadas producidas en el interior de las duchas electromagnticas iniciadas por los gammas, y
el desarrollo en la atmsfera. Esta radiacin Cherenkov (de visible a longitudes de onda UV)
se filtra a travs de la atmsfera y se graba en el detector, lo que permite la reconstruccin de
los parmetros de la ducha. La informacin disponible se compone de pulsos dejados por los
fotones Cherenkov entrantes en los tubos fotomultiplicadores , dispuestos en un plano, la
cmara. Dependiendo de la energa de la gamma primaria, un total de unos pocos cientos a
unos 10.000 fotones Cherenkov conseguir recoge, en patrones (llamados la imagen ducha), lo
que permite discriminar estadsticamente las causadas por radiaciones gamma primarios
(seal) de las imgenes de duchas hadrnicas inici por los rayos csmicos en la atmsfera
superior (fondo). Tpicamente, la imagen de una ducha despus de algn procesamiento previo
es un racimo alargado. Su eje longitudinal est orientado hacia el centro de la cmara si el eje
de la ducha es paralelo al eje ptico del telescopio, es decir, si el eje del telescopio se dirige
hacia una fuente puntual . Un anlisis de componentes principales se lleva a cabo en el plano
de la cmara, lo que resulta en un eje de correlacin y define una elipse. Si las deposiciones se
distribuyeron como gaussiana bivariante, esto sera una elipse equidensity. Los parmetros
caractersticos de esta elipse (a menudo llamadas parmetros Hilla) son algunos de los
parmetros de imagen que pueden ser utilizados para la discriminacin. Las deposiciones de
energa son tpicamente asimtrica a lo largo del eje mayor, y esta asimetra tambin pueden
ser utilizados en la discriminacin. . Hay, adems, las caractersticas ms exigentes, como la
medida de la agrupacin en el plano de la imagen, o la suma total de deposiciones El conjunto
de datos fue generado por un Monte Carlo programa, Corsika, se describe en: D. Diablos et al.,
Corsika, un cdigo de Monte Carlo para simular amplias duchas de aire, Forschungszentrum
Karlsruhe FZKA 6019 (1998). [Web Link] El programa se ha ejecutado con los parmetros
que permiten observar los acontecimientos con energas hasta por debajo de 50 GeV.
Atributo de la informacin:
Documentos pertinentes:
Bock, RK, Chilingarian, A., ind, M., Hakl, F., Hengstebeck, T., Jirina, M., Klaschka, J., Kotrc,
E., Savicky, P., Torres, S., Vaicilius , A., Wittek W. (2004).
Mtodos de clasificacin multidimensional de eventos: un caso de estudio utilizando imgenes
de un telescopio de rayos gamma de Cherenkov.
Nucl.Instr.Meth. A, 516, pp 511-528. P. Savicky, E. Kotrc. Estudio experimental de la hoja de
Confidencias de Random Forest. Actas de COMPSTAT 2004, En: Estadstica
Computacional. (Ed.: Antoch J.) -. Heidelberg, Physica Verlag 2004, pp 1767-1774 J. Dvorak.,
P. Savicky ablandamiento Splits en rboles de decisin de Uso de recocido simulado. Actas de
ICANNGA 2007, Varsovia, (Ed.:. Beliczynski et al), Parte I, LNCS 4431, pp 721-729.
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Mamogrfica Misa Conjunto de Datos
Resumen : La discriminacin de masas mamogrficas benignos y malignos basado en BI-
RADS atributos y la edad del paciente.
Valores Nmero de
Tareas asociadas: Clasificacin S 45678
perdidos? Web Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Citas:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 26962
perdidos?
Accesos:
Fuente:
F. Bergadano suministra esta base de datos. Cada instancia contiene muchos componentes,
cada uno de los cuales tiene 8 atributos. Diferentes casos en esta base de datos tienen
diferentes nmeros de componentes. Era imposible poner un caso en una lnea. l tena
originalmente una instancia por archivo, pero esto hace que sea difcil para ellos ftp
(imagine ftp'ing 222 o menos archivos!). Me liado el conjunto de 209 casos en un
solo archivo de datos , anteponiendo cada uno con la lnea: ===== Instancia nmero 1:
===== donde "n" es un nmero en [1221]. Sin embargo, no lo son, no repetir en orden
secuencial. Doce (12) de los casos han desaparecido. Bergadano suministra estos 12 casos
adicionales (nmeros 8,12,32,33,66,69,73,152,167,194,203,208) en un sub-directorio
"notused". I liada estos con el mismo formato en el archivo "-instances
notused". Un examen rpido de su archivo no revel cul es el propsito de estos doce
casos.
Atributo de la informacin:
Documentos pertinentes:
Citas:
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 23523
perdidos?
Accesos:
Fuente:
Este conjunto de datos se trata de los resultados de proyectos Statlog. El proyecto realiz un
estudio comparativo entre estadstico, Neural y simblicos de aprendizaje de
algoritmos. Statlog Proyecto (Proyecto Esprit 5170) se ocupaba de los estudios
comparativos de diferentes aprendizaje de mquinas , de los nervios y los algoritmos de
clasificacin estadstica. Cerca de 20 algoritmos diferentes fueron evaluados en ms de 20
conjuntos de datos diferentes. Las pruebas realizadas en el marco del proyecto producen
muchos resultados interesantes. Los resultados de estas pruebas se describen ampliamente
en un libro (D.Michie et.al, 1994).
Atributo de la informacin:
Documentos pertinentes:
Citas:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
MicroMass Conjunto de Datos
Resumen : Un conjunto de datos para explorar aprendizaje automtico enfoques para la
identificacin de microorganismos a partir de datos de espectrometra de masas.
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 6734
perdidos? A
Accesos:
Fuente:
Documentos pertinentes:
Citas:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en blanco.
129-154 Guatemala
http://archive.ics.uci.edu/ml/datasets.html
MiniBooNE datos de identificacin de
partculas Set
Resumen: Este conjunto de datos se toma del experimento MiniBooNE y se utiliza para distinguir
los neutrinos de electrones (seal) de neutrinos mun (fondo).
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 18000
perdidos?
Accesos:
Fuente:
Byron Roe ( byronroe '@' umich.edu )
Departamento de Fsica Universidad de Michigan
Ann Arbor, MI 48109
Atributo de la informacin:
50 variables (reales) de identificacin de partculas para cada evento.
Documentos pertinentes:
. B. Roe et al, "rboles de decisin potenciados, una alternativa a las Redes Neuronales Artificiales
'< [Web Link] >,
arXiv: physics/0408124, Nucl. Instrum. Meth. A543, 577 (2005).
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Mobile Robots Data Set
Resumen : conceptos de los datos del sensor de un robot mvil Aprendizaje; un conjunto de
conjuntos de datos
N
Conjunto de datos Domain- Nmero de
/ rea: Ordenador
Caractersticas: Theory instancias:
A
N
Caractersticas del Categrico, Nmero de Fecha
/ 07/15/1995
atributo: entero, real atributos: Donado
A
N Nmero de
Valores
Tareas asociadas: N/A / Web 21455
perdidos?
A Accesos:
Fuente:
Donantes: Volker Klingspor, Katharina J. Morik, Anke D. Rieger Informtica Dpto. LS
VIII Universidad de Dortmund, Alemania
Documentos pertinentes:
Volker Klingspor, Katharina Morik, Anke Rieger. Conceptos de los datos del sensor de un Robot
Mvil Aprender. Machine Learning Journal, 1995. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Biologa Molecular (promotor del gen de
Secuencias) Conjunto de datos
Resumen : E. Coli secuencias del gen promotor (ADN) con la teora de dominio parcial
Valores Nmero de
Tareas asociadas: Clasificacin No 25781
perdidos? Web Accesos:
Fuente:
Creadores: 1. instancias promotoras: S. Harley ( CHARLEY '@' McMaster.CA ) y R.
Reynolds 2. instancias no promotoras y teora del dominio: M. Noordewier - (sin promotores
derivados del trabajo del laboratorio del Prof. Tom Record, Universidad de Wisconsin Departamento
de Bioqumica) Donante: M. Noordewier y J. Shavlik, {noordewi, Shavlik} @ cs.wisc.edu
Documentos pertinentes:
Harley, C. y Reynolds, R. 1987. "El anlisis de E. Coli secuencias promotoras." Nucleic Acids
Research, 15:2343-2361. [Web Link] Towell, G., Shavlik, J. y Noordewier, M. 1990. "El
perfeccionamiento de las teoras de dominio aproximados por Redes Neuronales Artificiales Basados
en Conocimiento." En Actas de la Conferencia Nacional de la Octava de la Inteligencia Artificial
(AAAI-90). [Web Link]
Biologa Molecular (estructura secundaria de
protenas) Conjunto de datos
Resumen : A partir de CMU conexionista repositorio de banco; Clasifica estructura secundaria de
ciertas protenas globulares
Fuente:
El conjunto de datos es una contribucin a la coleccin de referencia en Terry Sejnowski, ahora en
el Instituto Salk y la Universidad de California en San Deigo. El conjunto de datos fue desarrollada
en colaboracin con Ning Qian, de la Universidad Johns Hopkins.
Atributo de la informacin:
N/A
Documentos pertinentes:
Ning Qian y Terrnece J. Sejnowski (1988), "La prediccin de la estructura secundaria de las
protenas globulares Usando modelos de red neuronal", en Journal of Molecular Biology 202, 865-
884. Academic Press.[Web Link]
Biologa Molecular (Splice-unin secuencias
gnicas) Conjunto de datos
Resumen : secuencias de primates de empalme de unin de genes (ADN) con la teora de
dominio imperfecto asociado
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 35793
perdidos?
Accesos:
Fuente:
Creadores: 1. Todos los ejemplos tomados de GenBank 64.1 (sitio ftp:
genbank.bio.net) 2. Categoras "ei" y "decir" incluyen todos los "split-gen" para los primates en el
Genbank 64.1 3. ejemplos no empalme tomadas a partir de secuencias conocidas de no incluir un
sitio de corte y empalme donante: G. Towell, M. Noordewier y J. Shavlik, {towell, Shavlik} @
cs.wisc.edu, noordewi '@' cs.rutgers.edu
Atributo de la informacin:
1. Uno de {n} ei es decir, lo que indica la clase.
2. El nombre de la instancia.
3-62. Los 60 campos restantes son la secuencia, comenzando en la posicin -30 y termina en la
posicin 30. Cada uno de estos campos es casi siempre ocupados por uno de {a, g, t, c}. Otros
caracteres indican la ambigedad entre los caracteres estndar de acuerdo con la siguiente
tabla: carcter: es decir, D: A o G o T N: A o G o C o T S: C o G R: A o G
Valores Nmero de
Tareas asociadas: Clasificacin No 121713
perdidos? Web Accesos:
Fuente:
Donante: Sebastian Thrun Facultad de Ciencias de la Computacin de la Universidad Carnegie
Mellon de Pittsburgh, PA 15213, EE.UU. Correo electrnico: Thrun '@' cs.cmu.edu
Datos Conjunto de Informacin:
El problema del MONJE fueron la base de una primera comparacin internacional de los algoritmos
de aprendizaje. El resultado de esta comparacin se resume en "Problemas del Monk - una
comparacin de rendimiento de diferentes algoritmos de aprendizaje" por SB Thrun, J. Bala, E.
Bloedorn, I. Bratko, B. Cestnik, J. Cheng, K. De Jong, S. Dzeroski, SE Fahlman, D. Fisher, R.
Hamann, K. Kaufman, S. Keller, I. Kononenko, J. Kreuziger, RS Michalski, T. Mitchell, P. Pachowicz,
Y. Reich H. Vafaie, W . Van de Welde, W. Wenzel, J. Wnek, y J. Zhang ha sido publicado como
Informe Tcnico CS-CMU-91-197 de la Universidad Carnegie Mellon en diciembre de 1991. Una
caracterstica importante de esta comparacin es que se llev a cabo por un conjunto de
investigadores, cada uno de los cuales era un defensor de la tcnica que probaron (a menudo eran
los creadores de los diferentes mtodos). En este sentido, los resultados son menos sesgada que en
las comparaciones realizadas por una sola persona abogar por un mtodo de aprendizaje
especficos, y reflejan con mayor precisin el comportamiento de la generalizacin de las tcnicas de
aprendizaje aplicadas por usuarios expertos. Hay tres problemas de Monk. Los dominios para todos
los problemas de MONJE son los mismos (que se describe ms adelante). Uno de los problemas del
monje ha aadido ruido. Para cada problema, el dominio se ha dividido en un tren y equipo de
prueba.
Atributo de la informacin:
1. clase: 0, 1
2. A1: 1, 2, 3
3. A2: 1, 2, 3
4. A3: 1, 2
5. A4: 1, 2, 3
6. a5: 1, 2, 3, 4
7. A6: 1, 2
8. Id: (Un smbolo nico para cada instancia)
Documentos pertinentes:
Wnek, J., "La induccin constructiva hiptesis impulsada", tesis de doctorado de la Facultad de
Tecnologa de la Informacin e Ingeniera, Repertorio de aprendizaje automtico e Inferencia
Laboratorio, MLI 93-2, Centro para la Inteligencia Artificial, George Mason University, marzo de
1993. [Web Link] Wnek, J. y Michalski, RS, "Comparando Simblico y subsimblica aprendizaje: tres
estudios," en Aprendizaje Automtico: Un enfoque Multiestrategia, vol. .. 4, RS Michalski y G. Tecuci
(Eds.), Morgan Kaufmann, San Mateo, CA, 1993 [Web Link] Ver archivo: thrun.comparison.ps.Z
Moral Reasoner Data Set
Resumen : Modelo de clusula de Horn-que simula cualitativamente razonamiento moral; Teora
incluye literales negados
Valores N/ Nmero de
Tareas asociadas: N/A 11760
perdidos? A Web Accesos:
Fuente:
Creadores: TR Shultz y JM Daley donantes: James L. Wogulis Universidad de California,
Irvine Irvine, CA, EE.UU.
Datos Conjunto de Informacin:
Este es un modelo basado en reglas que simula cualitativamente el razonamiento moral. El modelo
fue pensado para simular cmo una persona comn y corriente, hasta cerca de cinco aos de edad,
acerca de las razones. Dao haciendo La teora de cuerno clusula y los casos 202 son los mismos
que se utilizaron en (Wogulis, 1994). El predicado de nivel superior para predecir es culpable /
1. Para obtener ms informacin, por ejemplo, en la generacin de instancias, vea (Wogulis, 1994).
Atributo de la informacin:
N/A
Documentos pertinentes:
Darley, JM & Shultz, TR (1990). Las reglas morales: su contenido y adquisicin. Annual Review of
Psychology, 41, 525-556. Shultz, TR (1990). Un modelo de base de reglas de juzgar dao-hacer. En
Actas de la XII Conferencia Anual de la Sociedad de Ciencias Cognitivas, (pp. 229-236)., Cambridge,
MA. Lawrence Erlbaum. [Web Link] Wogulis, JL (1994). Un acercamiento a la reparacin y
evaluacin de teoras de primer orden que contiene varios conceptos y negacin. Disertacin
Doctoral. Universidad de California, Irvine. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Movie Set Data
Resumen : Este conjunto de datos contiene una lista de ms de 10.000 pelculas, entre ellas
muchos ms, impares y Pelculas de culto. Hay informacin sobre los actores, los yesos,
directores, productores, estudios, etc
Nmero de
Valores
Tareas asociadas: N/A S Web 42551
perdidos?
Accesos:
Fuente:
Propietario original y donante Gio Wiederhold Universidad de Stanford 650-725-
8363 gio '@' cs.stanford.edu
Documentos pertinentes:
N/A
Valores Nmero de
Tareas asociadas: N/A N/A 25931
perdidos? Web Accesos:
Fuente:
David Heckerman ( heckerma '@' microsoft.com )
Documentos pertinentes:
I. Cadez, D. Heckerman, C. Meek, P. Smyth, S. White, "Visualizacin de los patrones de navegacin
en un sitio Web utilizando clustering basado en modelos", Revista de la minera de datos y
descubrimiento de conocimiento. [Web Link]
Cita de pedidos:
Estos datos est disponible gracias a msnbc.com
Mltiples funciones de datos Fije
Resumen : Este conjunto de datos se compone de caractersticas de los nmeros escritos a mano
(`0 '-` 9') extrados de una coleccin de mapas holandeses de servicios pblicos
Valores Nmero de
Tareas asociadas: Clasificacin No 33212
perdidos? Web Accesos:
Fuente:
Robert PW Duin
Departamento de Fsica Aplicada de la
Universidad Tecnolgica de Delft
PO Box 5046, 2600 GA Delft
Holanda email: duin '@' ph.tn.tudelft.nl http: / / www.ph.tn.tudelft.nl/ ~ duin tel +31 15 2786143
Atributo de la informacin:
6 Archivos:
1. mfeat-fou: 76 coeficientes de Fourier de las formas de los caracteres;
2. mfeat-fac: 216 Fecha de correlaciones;
3. mfeat-kar: 64 coeficientes Karhunen-Amor;
4. mfeat-pix: 240 promedios de pxeles en 2 x 3 ventanas;
5. mfeat-zer 47 Zernike momentos;
6. mfeat-mor: 6 caractersticas morfolgicas.
Documentos pertinentes:
M. van Breukelen, RPW Duin, Impuesto DMJ, y JE den Hartog, Manuscrito reconocimiento de dgitos
por los clasificadores combinados, Kybernetika, vol. 34, no. 4, 1998, 381-386. [Web Link] M. van
Breukelen y RPW Duin, red neuronal de inicializacin por Combined Clasificadores, en: AK Jain, S.
Venkatesh, BC Lovell (eds.), ICPR'98, Proc. 14a Int.. Conferencia sobre el Reconocimiento de
Patrones (Brisbane, Aug. 16-20),AK Jain, RPW Duin, J. Mao, Patrn Statisitcal Reconocimiento: una
revisin, en la preparacin
Valores Nmero de
Tareas asociadas: Clasificacin S 117206
perdidos? Web Accesos:
Fuente:
Origen: registros de hongos procedentes de La Gua de Campo de la Sociedad Audubon de Setas
de Amrica del Norte (1981). GH Lincoff (Pres.), Nueva York: Alfred A. Knopf Donante: Jeff
Schlimmer (Jeffrey.Schlimmer '@' a.gp.cs.cmu.edu )
Datos Conjunto de Informacin:
Este conjunto de datos incluye descripciones de muestras hipotticas correspondientes a 23
especies de setas con aletas en el Agaricus y Lepiota Familia (pp. 500-525). Cada especie se
identifica como sin duda comestible, sin duda venenosa o de comestibilidad desconocida y no se
recomienda. Esta ltima clase se combin con el venenoso. La gua establece claramente que no
existe una regla simple para determinar la comestibilidad de una seta; hay una regla como `` folletos
de tres, que sea'' para Venenoso roble y la hiedra.
Atributo de la informacin:
1. cap-forma: campana = b, c, = cnicas convexas = x, plana = f, knobbed = k, hundidos = s
2. cap-superficie: fibrosa = f, ranuras = g, escamosa = y, = lisos s
3. cap-color: marrn = n, buff = b, c = canela, gris = g, verde = r, rosa = p, prpura = u, rojo = e,
blanco = w, amarillo = y
4. moretones:? contusiones = t, no = f
5. Olor: almendra = a, ans = l, la creosota = c, a pescado = y, falta = f, = mohosos m, ninguno = n,
acre = p, = picantes s
6. gill-apego: adosada = a, descendiente = d, libre = f, con muescas = n
7. gill-spacing: close = c, lleno de gente = w, distante d =
8. gill-size: amplia = b, estrecho = n
9. gill-color: negro = k, marrn = n, buff = b, = h de chocolate, gris = g, verde = r, naranja = o, rosa =
p, prpura = u, rojo = e, blanco = w, amarillo = y
10. acechar-forma: ampliacin = e, estrechndose = t
11. tallo-raz: = b bulbosas, club = c, taza = u, igual = e, rizomorfos = z, enraizada = r, perdido =?
12. tallo tierra-arriba-ring: fibrosa = f, = y escamosa, sedoso = k, = lisos s
13. tallo tierra-abajo-ring: fibrosa = f, = y escamosa, sedoso = k, = lisos s
14. acechar-color-por encima de la junta: marrn = n, buff = b, c = canela, gris = g, naranja = o, rosa
= p, rojo = e, blanco = w, amarillo = y
15. acechar-color-abajo-ring: marrn = n, buff = b, c = canela, gris = g, naranja = o, rosa = p, rojo = e,
blanco = w, amarillo = y
16. de tipo velo: = p, = universales parciales u
17. velo-color: marrn = n, naranja = o, blanco = w, amarillo = y
18. ring-nmero: ninguno = n, uno = o, dos t =
19. tipo anillo: = c telaraas, evanescente = e, la quema = f, grandes = l, ninguno = n, pendiente = p,
envainando = s, zona z =
20. espora-print-color: negro = k, marrn = n, buff = b, = h de chocolate, verde = r, naranja = O,
prpura = u, w = blanco, amarillo = y
21. poblacin: abundante = A, = c, agrupados numerosos = n, = dispersos s, varios = v, = solitarias y
22. hbitat: las hierbas = g, deja = l, prados = m = p, caminos, urbana = u = w, residuos, bosques = d
Documentos pertinentes:
Schlimmer, JS (1987). Concepto adquisicin a travs de representacin de Ajuste (Informe Tcnico
87-19). Disseration Doctoral, Departamento de Informacin y Ciencias de la Computacin de la
Universidad de California, Irvine. [Web Link] Iba, W., Wogulis, J., y Langley, P. (1988). Modificando
los Simplicidad y Cobertura en Incremental Concepto de Aprendizaje. En las actas de la 5
Conferencia Internacional sobre Aprendizaje Automtico, 73-79. Ann Arbor, Michigan: Morgan
Kaufmann. [Web Link] Duch W, Adamczak R, Grabczewski K (1996) Extraccin de reglas lgicas de
datos de entrenamiento que utilizan las redes de retropropagacin, en: Proc. del Taller La primera
lnea de Soft Computing, 19-30.Aug.1996, pp 25-30, [Web Link] [Web Link] Duch W, Adamczak R,
Grabczewski K, Ishikawa M, Ueda H, Extraccin de crujientes reglas lgicas que utilizan las redes de
retropropagacin restringidos - Comparacin de dos nuevos enfoques, en: Proc. del Simposio
Europeo sobre Redes Neuronales Artificiales (ESANN'97), Brujas, Blgica 16-18.4.1997. [Web Link]
Almizcle (Version 1) Conjunto de datos
Resumen : El objetivo es aprender a predecir si las nuevas molculas sern almizcles o no
almizcles
Valores Nmero de
Tareas asociadas: Clasificacin No 22178
perdidos? Web Accesos:
Fuente:
Creadores: Grupo AI a Arris Pharmaceutical Corporation contacto: David Chapman o Ajay Jain Arris
Pharmaceutical Corporation 385 Oyster Point Blvd.. South San Francisco, CA 94080 415-737-
8600 zvona '@'arris.com , jain '@' arris.com Donantes : Tom Dietterich Departamento de Ciencias
de la Computacin de la Universidad Estatal de Oregon en Corvallis, OR 97331 503-737-
5559 TGD '@' cs.orst.edu
Atributo de la informacin:
molecule_name: Nombre simblico de cada molcula. Almizcles tienen nombres como MUSK-
188. Los no almizcles tienen nombres tales como NO MUSK-JP13.
conformation_name: Nombre simblico de cada conformacin. Estos tienen el formato MOL_ISO +
CONF, donde MOL es el nmero de molculas, la ISO es el nmero estereoismero (generalmente
1), y es el nmero CONF conformacin.
f1 a F162: Estos son "caractersticas" a lo largo de los rayos distancia (vase el documento antes
citado) . Las distancias se miden en centsimas de Angstroms. Las distancias pueden ser negativo
o positivo, ya que en realidad se miden con respecto a un origen colocado a lo largo de cada
rayo. El origen fue definida por una superficie "consenso almizcle" que ya no se utiliza. Por lo tanto,
cualquier experimento con los datos deberan tratar estos valores de caractersticas como la
mentira en una escala continua arbitraria. En particular, el algoritmo no debe hacer ningn uso del
punto cero o el signo de cada caracterstica de valor.
F163: Esta es la distancia del tomo de oxgeno en la molcula a un punto designado en el espacio
de 3 dimensiones. Esto tambin se llama OXY-DIS.
F164: OXY-X:. X-desplazamiento desde el punto designado
F165: OXY-Y:. Y-desplazamiento desde el punto designado
F166: OXY-Z: Z-desplazamiento desde el punto designado.
clase: 0 => no almizcle, 1 => almizcle Por favor, tenga en cuenta que los atributos molecule_name
y conformation_name no deben ser utilizados para predecir la clase.
Documentos pertinentes:
Dietterich, TG, Lathrop, RH, Lozano-Prez, T. Resolver el problema de la doble instancia con
rectngulos de ejes paralelos. Inteligencia Artificial. [Web Link]
Valores Nmero de
Tareas asociadas: Clasificacin No 22461
perdidos? Web Accesos:
Fuente:
Creadores: Grupo AI a Arris Pharmaceutical Corporation contacto: David Chapman o Ajay Jain Arris
Pharmaceutical Corporation 385 Oyster Point Blvd.. South San Francisco, CA 94080 415-737-
8600 zvona '@'arris.com , jain '@' arris.com Donantes : Tom Dietterich Departamento de Ciencias de
la Computacin de la Universidad Estatal de Oregon en Corvallis, OR 97331 503-737-
5559 TGD '@' cs.orst.edu
Datos Conjunto de Informacin:
Este conjunto de datos describe un conjunto de 102 molculas de las cuales 39 son juzgados por
expertos humanos para ser almizcles y los 63 restantes molculas son juzgados como los no
almizcles. El objetivo es aprender a predecir si las nuevas molculas sern almizcles o no
almizcles. Sin embargo, las 166 caractersticas que describen estas molculas dependen de la forma
exacta, o la conformacin, de la molcula.Debido a que los bonos pueden rotar, una sola molcula
puede adoptar muchas formas diferentes. Para generar este conjunto de datos, se han generado
todas las conformaciones de baja energa de las molculas para producir 6.598
conformaciones. Entonces, un vector de caractersticas se extrajo que describe cada
conformacin. Este de muchos a uno entre los vectores de caractersticas y las molculas se llama el
"problema de mltiples instancias". Al aprender un clasificador para estos datos, el clasificador debe
clasificar una molcula como "almizcle" Si alguno de sus conformaciones se clasifica como un
almizcle. Una molcula debera ser clasificado como "no almizcle" si ninguno de sus conformaciones
se clasifica como un almizcle.
Documentos pertinentes:
Dietterich, TG, Jain, A., Lathrop, R., Lozano-Prez, T. (1994). Una comparacin de reposando
dinmica y la distancia tangente para la prediccin de la actividad del frmaco. Los avances en la
informacin Neural Processing Systems, 6. San Mateo, CA: Morgan Kaufmann. . 216-223 [Web
Link] Jain, AN, Dietterich, TG, Lathrop, RH, Chapman, D., Critchlow, RE, Bauer, BE, Webster, TA,
Lozano-Prez, T. Brjula: basa forma-A mquina herramienta de aprendizaje para el diseo de
frmacos. Computer-Aided Molecular Design. [Web Link] Dietterich, TG, Lathrop, RH, Lozano-Prez,
T. Resolver el problema de la doble instancia con rectngulos de ejes paralelos. Inteligencia
Artificial. [Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 10803
perdidos?
Accesos:
Fuente:(A) El dueo original de la base de datos (nombre / telfono / direccin caracol / direccin
de correo electrnico)
Nomao / 00 33 5 62 48 33 90/1 avenida Jean Rieux, 31500 Toulouse / desafo '@' nomao.com
(b) Donante de base de datos ( nombre / telfono / direccin caracol / direccin de correo
electrnico)
Laurent Candillier / - / 1 avenida Jean Rieux, 31500 Toulouse / laurent '@' nomao.com
Datos Conjunto de Informacin:
El conjunto de datos se ha enriquecido durante el Nomao Desafo: [Web Link] organizada junto con
el taller ALRA (Aprendizaje Activo en aplicaciones del mundo real): [Web Link] celebrada en la
conferencia ECML-PKDD 2012.
Atributo de la informacin:
120 atributos: 89 continua, 31 nominal (incluida la 'etiqueta' de los atributos y 'id').
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 9707
perdidos? A
Accesos:
Fuente:
Farid Bourennani de la Universidad de Ontario Institute of Technology, farid.bourennani '@' uoit.ca
Documentos pertinentes:
Proporcionar referencias a los documentos que han citado este conjunto de datos en el pasado (si
los hay).
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en blanco.
Premio de Investigacin NSF Abstracts 1990-
2003 Conjunto de Datos
Resumen : Este conjunto de datos se compone de (a) 129 000 resmenes que describen premios
NSF para la investigacin bsica, (b) los archivos de datos de bolsa de palabras extradas de los
resmenes, (c) una lista de palabras que se usan para la indexacin de la palabra bolsa-de-
Fuente:
Propietario y donante original Abstracts proporcionadas por: Michael J. Pazzani Departamento ICS,
Facultad de Ciencias de la Computacin, UCI, Irvine CA, 92697,
EE.UU. Pazzani '@' ics.uci.edu Bolsa-de-palabra de datos proporcionadas por: Amnn
Meyers Departamento ICS , Facultad de Ciencias de la Computacin, UCI, Irvine CA, 92697,
USA ameyers '@' ics.uci.edu
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Nursery Data Set
Resumen : Base de datos Nursery se deriva de un modelo de decisin jerrquica desarrollada
originalmente para clasificar las solicitudes de las escuelas de prvulos.
Valores Nmero de
Tareas asociadas: Clasificacin No 57743
perdidos? Web Accesos:
Fuente:
Creador: Vladislav Rajkovic et al. (13 expertos) Donantes: Marko Bohanec
( marko.bohanec '@' ijs.si ) Blaz Zupan ( blaz.zupan '@' ijs.si )
Atributo de la informacin:
padres: habituales, pretenciosos, great_pret
has_nurs:, less_proper,,, impropio adecuada crtico very_crit
forma: completos, terminados, incompletos, crianza
hijos: 1, 2, 3, ms
vivienda: conveniente, less_conv, crtica
financiamento: conveniente, inconv
sociales: no prob, slightly_prob, problemtica
de la salud: recomendado, prioridad, not_recom
Documentos pertinentes:
M. Olave, V. Rajkovic, M. Bohanec: Una aplicacin para la admisin en los sistemas de escuelas
pblicas. En (I. Th. M. Snellen y WBHJ van de Donk y J.-P. Baquiast, editores) Sistemas Expertos en
Administracin Pblica, pginas 145-160. Elsevier Science Publishers (Holanda del Norte), de
1989. [Web Link] B. Zupan, M. Bohanec, I. Bratko, J. Demsar: Aprendizaje automtico con la funcin
de descomposicin. ICML-97, Nashville, TN. 1997 [Web Link]
Multivariante,
Conjunto de datos Nmero de
Secuencial, 10421 rea: Social
Caractersticas: instancias:
Texto
Nmero de
Valores
Tareas asociadas: Clustering N/A Web 5951
perdidos?
Accesos:
Fuente:
- Aura lien Lauf ( alu '@' amisw.com )
- Leila Khouas ( lkh '@' amisw.com )
- Mohamed Dermouche ( mde '@' amisw.com )
Atributo de la informacin:
Los documentos se filtran y se presentan en formato XML. Todos los campos XML se explica por s
mismo.
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Especies de plantas De cien hojas Conjunto
de datos Conjunto de datos
Resumen : Diecisis muestras de hojas, cada una de las especies de plantas uno a cien. Para
cada muestra, un descriptor de forma, el margen de escala fina y textura histograma se dan.
Valores Nmero de
Tareas asociadas: Clasificacin N/A 14084
perdidos? Web Accesos:
Fuente:
James Cope, Thibaut Beghin, Paolo Remagnino, Sarah Barman.
Las imgenes en color no estn incluidos en esta presentacin.
Las hojas se recogen en el Real Jardn Botnico de Kew, Reino Unido.
email: james.cope '@' kingston.ac.uk
Este conjunto de datos consiste en un trabajo llevado a cabo por James Cope, Charles Mallah, y
James Orwell. . Kingston University London
Donantes de base de datos Charles Mallah: charles.mallah '@' kingston.ac.uk ; James
Cope: james.cope '@' kingston.ac.uk
Atributo de la informacin:
Para cada funcin, un elemento del vector 64 se da por muestra de hoja. Un archivo para cada uno
de 64 elementos de vectores de caractersticas. Cada fila comienza con la etiqueta de clase. Los
64 elementos restantes es el vector de caractersticas.
Documentos pertinentes:
Este es un nuevo conjunto de datos, el papel provisional: La clasificacin Hoja Planta
Utilizando Probabilstico Integracin de forma, textura y caractersticas de margen "en SPPRA
2013. Autores: Carlos. Mallah, James Cope, y James Orwell o Kingston University London partes
anteriores de la serie de datos relacionados con la extraccin de caractersticas de las hojas
de: J. Cope, P. Remagnino, S. Barman, y P. Wilkin.Plant clasificacin textura usando
cooccurrences gabor. Los avances en computacin visual, pginas 669A "677, 2010. T. Beghin,
J. Cope, P. Remagnino y. S. Barman clasificacin hoja de la planta de forma y textura a
base. En Conceptos avanzados de Sistemas de Visin Inteligente, pginas 345a "353. Springer,
2010.
Cita de pedidos:
Charles Mallah, James Cope, James Orwell. Planta de Clasificacin de la hoja Usando
Probabilstico Integracin de la forma, la textura y el margen de Caractersticas. Procesamiento de
Seales, Reconocimiento de Patrones y Aplicaciones, en prensa. 2013.
Opinosis opinin / revisin del conjunto de
datos
Resumen : Este conjunto de datos contiene frases extradas de opiniones sobre un tema
determinado. Temas de ejemplo se performance de Toyota Camry ? y calidad
sound de ipod Nanoa ?.
Fuente:
Kavita Ganesan kganes2 '@' illinois.edu http://kavita-ganesan.com/opinosis-opinion-dataset
Atributo de la informacin:
N/A
Documentos pertinentes:
Kavita Ganesan, Chengxiang Zhai, Jiawei Han. Opinosis: Un Enfoque Basado Grfico de
Abstractive Recapitulacin de Opiniones altamente redundantes. En las actas de la 23
Conferencia Internacional de Lingstica Computacional (Coling 2010). Beijing, China.
Cita de pedidos:
Kavita Ganesan, Chengxiang Zhai, Jiawei Han. Opinosis: Un Enfoque Basado Grfico de
Fuente:
Kavita Ganesan y Chengxiang Zhai
Universidad de Illinois en Urbana Champaign @ http://www.kavita-ganesan.com/entity-ranking-data
Atributo de la informacin:
N/A
Documentos pertinentes:
'Clasificacin Opinin basada entidad Ganesan, KA, y CX Zhai,, Recuperacin de Informacin,
2011.
Cita de pedidos:
Bibtex de la siguiente manera: @ article {opinrank, title = {Clasificacin Opinin basada
Entidad}, journal = {} Recuperacin de Informacin, ao = {2011}, keywords = {adhoc bsqueda
polifactica, orientada entidad de bsqueda, clasificacin entidad, la recuperacin de la entidad,
producto bsqueda}, doi = {} 10.1007/s10791-011-9174-8, attachments = { [Web Link] }, author =
{Kavita Ganesan y Chengxiang Zhai} }
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 16019
perdidos?
Accesos:
Fuente:
Daniel Roggen, usable Computing Laboratory ETH Zurich, droggen '@' gmail.com
Alberto Calatroni, usable Computing Laboratory ETH Zurich, calatroni.alberto '@' gmail.com
largo Van Nguyen Dinh-, usable Computing Laboratory ETH Zurich
Ricardo Chavarriaga, Presidente en interfaz cerebro-mquina no invasiva,
EPFL, ricardo.chavarriaga '@' epfl.ch
Hesam Sagha, Ctedra de Non-Invasive Brain-Machine Interface, EPFL, hesam.sagha '@' epfl.ch
Sundara Tejaswi Digumarti, Presidente en No Invasiva interfaz cerebro-mquina, EPFL
Documentos pertinentes:
** En primer partido **
[1] Daniel Roggen, Alberto Calatroni, Mirco Rossi, Thomas Holleczek, Gerhard Trster, Paul Lukowicz,
Gerald Pirkl, David Bannach, Alois Ferscha, Jakob Doppler, Clemens Holzmann, Marc Kurz, Gerald
Holl, Ricardo Chavarriaga , Hesam Sagha, Hamidreza Bayati, y Jos del R. Milln. "Recopilacin de
los conjuntos de datos de actividades complejas en entornos altamente ricos sensores conectados en
red" en la sptima Conferencia Internacional sobre Networked Sensing Systems (INSS'10), Kassel,
Alemania, 6 de 2010.
[2] Hesam Sagha, Sundara Tejaswi Digumarti, Jos del R. Milln, Ricardo Chavarriaga, Alberto
Calatroni, Daniel Roggen, Gerhard Trster. Evaluacin comparativa de las tcnicas de clasificacin
utilizando el Opportunity actividad humana conjunto de datos. Conferencia Internacional IEEE sobre
Sistemas, Hombre y Ciberntica, Anchorage, AK, EE.UU., 9 a 12 octubre, 2011
[3] El video presenta el conjunto de datos: [Web Link]
[4] R. Chavarriaga et al. Creacin Ensemble y reconfiguracin para el reconocimiento de actividad: una
aproximacin terica informacin. IEEE Conf. Sistemas, Hombre y Ciberntica (SMC), 2011
[5] H. Sagha et al. La deteccin de anomalas para mejorar la clasificacin de rendimiento en una red
de sensores oportunista, sptimo IEEE Taller Internacional de Redes y Sistemas de Pervasive
Computing (PerSens), 2.011 sensores.
[6] A. Calatroni et al., la transferencia automtica de capacidades de reconocimiento de actividad entre
desgastado cuerpo sensores de movimiento: El entrenamiento de los recin llegados a reconocer la
locomocin, la 8 Conferencia Internacional sobre Networked Sensing Systems (INSS), 2011
[7] M. Kurz et al. La cuantificacin dinmica de capacidades de reconocimiento de la actividad en los
Sistemas de oportunistas. IV Jornadas de Concientizacin Contexto para Proactive Systems, 2011
[8] H. Sagha et al. Detectar y rectificar anomalas en redes de sensores oportunistas. Conferencia
Internacional sobre Body Sensor Networks (BSN), 2011
[9] R. Chavarriaga et al. Robusto reconocimiento actividad de las tecnologas de asistencia:. Tcnicas
de Benchmarking ML, Taller de Aprendizaje Automtico para las Tecnologas de Apoyo en la 24
Conferencia Anual sobre Sistemas de procesamiento neural (PNA) de 2010
[10] P. Lukowicz et al. Grabacin de un complejo de varios datos, actividad modal establecidos para su
reconocimiento contexto 1er Taller sobre Context-Systems Diseo, Evaluacin y Optimizacin de
ARCS, 2010, 2010
[11] R. Chavarriaga, H. Sagha, A. Calatroni, S. Digumarti, G. Trster, J. del R. Milln, D. Roggen. El
reto Oportunidad: Una base de datos referente para el cuerpo-el reconocimiento de actividad basada
en sensores, Pattern Recognition Letters, 2013
[12] L.-V. Nguyen Dinh-, D. Roggen, A. Calatroni, G. Trster. Mejorar el reconocimiento de gestos en
lnea con mtodos de correspondencia de plantilla en los datos del acelermetro, Proc 12 Int. Conf.
sobre Sistemas Inteligentes de Diseo y Aplicaciones, 2012 ** terceros ** stos son algunos de los
trabajos por parte de terceros que utilizan el conjunto de datos OPORTUNIDAD: [100] T. Pltz, NY
Hammerla, P. Olivier. Aprendizaje de funciones para el reconocimiento de actividades de la
Computacin Ubicua, IJCAI de 2011 [101] A. Manzoor et al., Identificacin Primitives accin importante
para alto nivel de actividad de reconocimiento, Proc. Conferencia Europea de deteccin inteligente y
contexto (EuroSSC), 2010 [102] T. Ploetz, N. Hammerla, A. Rozga, A. Reavis, N. Call, G.
Abowd. Evaluacin automtica de la conducta problemtica en Individuos con Discapacidades del
Desarrollo. Proc. 14a Int. Conf. sobre Computacin Ubicua, 2012. [103] D. Gordon, J. Czerny, M.
Beigl. Actividad Reconocimiento por criaturas de hbito: Clasificacin Embedded Energy-Efficient
utilizando prediccin. Informtica Personal y ubicua, 2013.
Cita de pedidos:
El uso de este conjunto de datos en las publicaciones debe ser reconocido por referencia a la siguiente
publicacin [1] o [2].
Recomendamos consultar esta base de datos como la "OPORTUNIDAD Actividad reconocimiento
conjunto de datos" en las publicaciones.
Tambin agradeceramos que nos caiga un email ( daniel.roggen '@' ieee.org ) para informarnos de
cualquier publicacin que utiliza este conjunto de datos, por lo que podemos apuntar a su publicacin
en nuestra pgina web. Referencia [1] se detalla el conjunto de datos en general, el escenario, la
multimodalidad y aspectos de redes de sensores la configuracin, mtricas de calidad y mejores
prcticas para el registro de los complejos conjuntos de datos de actividades multimodales. Referencia
[2], prev la realizacin de un sistema de reconocimiento de la actividad de referencia en el conjunto
de datos OPORTUNIDAD, que puede ser utilizado como un rendimiento del ndice de referencia. [1]
Daniel Roggen, Alberto Calatroni, Mirco Rossi, Thomas Holleczek, Gerhard Trster, Paul Lukowicz,
Gerald Pirkl , David Bannach, Alois Ferscha, Jakob Doppler, Clemens Holzmann, Marc Kurz, Gerald
Holl, Ricardo Chavarriaga, Hesam Sagha, Hamidreza Bayati, y Jos del R. Milln. "Recopilacin de los
conjuntos de datos de actividades complejas en entornos altamente ricos sensores conectados en red"
en la sptima Conferencia Internacional sobre Networked Sensing Systems (INSS'10), Kassel,
Alemania, 2010. [2] Ricardo Chavarriaga, Hesam Sagha, Alberto Calatroni, Sundaratejaswi Digumarti,
Gerhard Trster , Jos del R. Milln, Daniel Roggen. "El reto Oportunidad: Una base de datos de
referencia para el cuerpo-el reconocimiento de actividad basado en sensores", Reconocimiento de
Patrones Letters, 2013
Reconocimiento ptico de Dgitos
Manuscritos Data Set
Resumen : Hay dos versiones de esta base de datos disponibles; ver carpeta
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 63052
perdidos?
Accesos:
Fuente:
E. Alpaydin, C. Kaynak
Departamento de Ingeniera Informtica
de la Universidad Bogazici, 80815 Estambul Turqua alpaydin '@' boun.edu.tr
Atributo de la informacin:
Todos los atributos de entrada son enteros en el rango de 0 .. 16.
El ltimo atributo es el cdigo de la clase 0 .. 9
Documentos pertinentes:
C. Kaynak (1995) Mtodos de Combinacin de varios clasificadores y sus aplicaciones a Digit
Manuscrita reconocimiento, Tesis de maestra, Instituto de Estudios de Posgrado en Ciencias e
Ingeniera de la Universidad Bogazici. [Web Link] E. Alpaydin, C. Kaynak (1998) Los clasificadores
en cascada, Kybernetika. [Web Link] [Web Link]
Valores Nmero de
Tareas asociadas: N/A No 8822
perdidos? Web Accesos:
Fuente:
Tom Fawcett ( Fawcett '@' cs.umass.edu )
MONEDAS Deptartment, LGRC
Universidad de Massachusetts
Amherst, MA 10373
Atributo de la informacin:
N/A
Documentos pertinentes:
T. y P. Fawcett Utgoff. "Un mtodo hbrido para la funcin de generacin". VIII Taller Internacional
sobre el aprendizaje de la mquina. Northwestern University, Evanston Illinois. 1991. pp 137-
141 [Web Link] T.Fawcett y P. Utgoff. "Generacin de funciones automticas para la resolucin de
problemas de sistemas". Novena Conferencia Internacional sobre Aprendizaje
Automtico. Aberdeen, Escocia. 1992. pp 144-153.[Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Deteccin de nivel de ozono de conjunto de
datos
Resumen: Dos conjuntos de datos a nivel de la capa de ozono del suelo se
incluyen en esta coleccin. Uno de ellos es el conjunto mximo ocho horas
(eighthr.data), el otro es el conjunto pico una hora (onehr.data). Esos datos
fueron recogidos desde 1998 hasta 2004 en el Houston, Galveston y
Brazoria rea.
Multivariante,
Conjunto de datos Nmero de
Secuencial, Time- 2536 rea: Fsico
Caractersticas: instancias:
Series
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 50250
perdidos?
Accesos:
Fuente :
Kun Zhang, zhang.kun05 '@' gmail.com , Departamento de Ciencias de la Computacin ,
Universidad Xavier de Louisiana
Wei Fan , wei.fan '@' gmail.com , IBM TJ Watson de Investigacin
Xiaojing Yuan , xyuan '@' uh.edu , Ingeniera Departamento de Tecnologa de la Facultad de
Tecnologa de la Universidad de Houston
Todo el atributo empezar con T significa la temperatura medida en funcin del tiempo
durante todo el da , y esas salidas con SW indica la velocidad del viento en diversos tiempo .
WSR_PK : continuo. velocidad del viento peek - resultante ( es decir, la media de vector de
viento )
RH50 : continuo.
U50 : continuo.
V50 : continuo.
HT50 : continuo.
Atributo de la informacin:
Las siguientes son las especificaciones para varios atributos ms importantes que son
altamente valorados por la Comisin de Calidad Ambiental de Texas ( TCEQ) . Ms detalles
se pueden encontrar en los dos documentos pertinentes .
Documentos pertinentes:
Pronosticar da ozono estocsticos sesgados asimtricos : anlisis , soluciones y ms all , el
Conocimiento y Sistemas de la Informacin, vol. 14 , No. 3, 2008 .
Discute los detalles sobre el conjunto de datos , su uso , as como diversos experimentos
(tanto de validacin cruzada y streaming ) utilizando muchos mtodos del estado de la
tcnica .
Una versin ms corta del papel ( no contiene algunos experimentos detallados como el papel
de diario arriba) se encuentra en :
Pronosticar sesgadas das ozono sesgada estocsticos : Anlisis y Soluciones . ICDM 2006 :
753-764
Cita de pedidos:
Por favor refirase a la poltica de la citacin del Aprendizaje Repositorio Machine.
p53 mutantes Conjunto de datos
Resumen: El objetivo es modelar la actividad transcripcional de p53 mutante
(activo vs inactivo) basado en datos obtenidos de las simulaciones biofsicas.
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 33034
perdidos?
Accesos:
Fuente :
Richard H. Lathrop , UC Irvine, http://www.ics.uci.edu/ ~ Rickl
Los archivos siguientes se proporcionan con el fin de reconstruir este subconjuntos histricos
de este conjunto de datos:
K8.instance.tags - proporciona la p53 mutante etiqueta precisa para cada caso en el K8.data ,
para su uso con los archivos histricos de definicin :
K1.def - define los casos en conjunto el " K1 " .
K2.def - define los casos en conjunto el " K2 " .
K3.def - define los casos en el conjunto de la ' K3 ' .
K4.def - define los casos en el conjunto de la " K4 " .
K5.def - define los casos en el conjunto de la ' K5 ' .
K6.def - define los casos en el conjunto de la ' K6 ' .
K7.def - define los casos en el conjunto de la ' K7 ' .
K8.def - define las instancias en el ' K8 ' set ( completo).
Atributo de la informacin:
Hay un total de 5.409 atributos por ejemplo .
Atributos 1-4.826 representan caractersticas basadas electrostticas y de superficie 2D.
Atributos 4827-5408 representan caractersticas basadas distancia 3D.
Atributo 5409 es el atributo de la clase , que puede ser activo o inactivo.
Las etiquetas de clase se han de interpretar de la siguiente manera : "activo" representa , p53
activa transcriptonally competente, mientras que la etiqueta de "inactivo" representa
canceroso , p53 inactiva. Etiquetas de clase se determinan experimentalmente.
Danziger , SA , Swamidass , SJ, Zeng , J., Escasez , LR, Lu, P. , Chen, JH, Cheng , J., Hoang
, VP , Saigo , H., Luo , R., Baldi , P., Brachmann , RK y Lathrop , RH ( 2006 ) del censo
funcional de la mutacin espacios de secuencia : el ejemplo de p53 mutantes de rescate
cncer, IEEE / ACM Operaciones en biologa computacional y bioinformtica / IEEE , ACM
, 3, 114-125 .
Cita de pedidos:
Si utiliza este conjunto de datos, por favor, cite los documentos pertinentes anteriormente.
Gracias.
Bloques La clasificacin de conjunto de datos
Resumen: El problema consiste en clasificar todos los bloques del diseo de pgina de un
documento que ha sido detectado por un proceso de segmentacin.
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 32600
perdidos?
Accesos:
Fuente :
Propietario original:
Donato Malerba
Dipartimento di Informatica
Universidad de Bari
a travs de Orabona 4
70126 Bari - Italia
telfono +39 - 80-5.443.269
Fax: +39 - 80-5.443.196
malerbad '@' vm.csata.it
Donante:
Donato Malerba
Atributo de la informacin:
altura : entero. | Altura de la cuadra.
Longitud : entero. | Duracin de la manzana.
rea : entero. | Zona del bloque (altura * tamao) ;
ECCEN : continuo. | Excentricidad del bloque (tamao / altura );
p_black : continuo. | Porcentaje de pxeles negros dentro del bloque ( blackpix / rea) ;
p_and : continuo. | Porcentaje de pxeles negros despus de la aplicacin de la longitud de los
tramos el Algoritmo ( RLSA ) ( blackand / rea) ;
mean_tr : continuo. | El nmero medio de transiciones negro- blanco ( blackpix / wb_trans );
blackpix : entero. | Nmero total de pxeles negros en el mapa de bits original del bloque .
blackand : entero. | Nmero total de pxeles negros en el mapa de bits del bloque despus de
la RLSA .
wb_trans : enteros . | Nmero de transiciones negro- blanco en el mapa de bits original del
bloque .
Documentos pertinentes:
Malerba , D., Esposito , F., y Semeraro , G. " Un adicional Comparacin de los mtodos de
simplificacin para la Toma de rbol de induccin ". En D. Fisher y H. Lenz ( Eds. ) , "
Aprender de los datos: la Inteligencia Artificial y Estadstica V " , Lecture Notes in Statistics,
Springer Verlag, Berlin , 1995 .
[Web Link]
C. Tito Brown y Harry W. Bullen y Sean P. Kelly y Robert K. Xiao y Steven G. Satterfield y
John G. Hagedorn y Judith E. Devaney . Visualizacin y Minera de Datos en un inmersivo
entorno 3D : Proyecto de Verano de 2003. [Ver Contexto ] .
Adil M. Bagirov y Julien Ugon . Un algoritmo para el clculo de la funcin lineal por tramos
que separa dos conjuntos . CIAO , Escuela de Informtica y Ciencias Matemticas de la
Universidad de Ballarat . [Ver Contexto ] .
Cita de pedidos:
Por favor refirase a la poltica de la citacin del Aprendizaje Repositorio Machine.
PAMAP2 Actividad Fsica Monitoreo Conjunto
de datos
Resumen: El PAMAP2 Actividad Fsica Monitoreo conjunto de datos contiene datos de 18
actividades fsicas diferentes, realizadas por 9 sujetos que llevan 3 unidades de medicin
inercial y un monitor de frecuencia cardaca.
Conjunto de
Multivariado, Nmero de
datos 3850505 rea: Ordenador
Time-Series instancias:
Caractersticas:
Valores Nmero de
Tareas asociadas: Clasificacin S 14821
perdidos? Web Accesos:
Fuente :
Attila Reiss, Departamento Aumentada Vision, DFKI , Alemania, attila.reiss '@' dfki.de
Fecha: agosto de 2012.
Sensores ** **
3 unidades Colibri inalmbricas Medicin Inercial (IMU ):
- Frecuencia de muestreo : 100 Hz
- Posicin de los sensores :
- 1 IMU sobre la mueca en el brazo dominante
- 1 IMU en el pecho
- 1 IMU en el tobillo del lado dominante
HR- Monitor :
- Frecuencia de muestreo : ~ 9 Hz
Atributo de la informacin:
Las 54 columnas en los archivos de datos estn organizados de la siguiente manera :
1 . marca de tiempo ( s )
2 . activityID ( ver ms abajo para la asignacin a las actividades)
3 . frecuencia cardaca ( latidos por minuto )
4-20 . mano IMU
21-37 . IMU pecho
38-54 . tobillo IMU
Documentos pertinentes:
Las dos publicaciones siguientes describen el conjunto de datos y proporcionan un punto de
referencia de lnea de base en diversas tareas de reconocimiento de la actividad fsica y la
intensidad de estimacin :
Cita de pedidos:
Este conjunto de datos est disponible gratuitamente para la investigacin acadmica , no hay
restricciones ( legales o de otro tipo ) sobre el uso de los datos con fines cientficos .
Agradeceramos referencia a una de las siguientes publicaciones ( [ 1 ] o [ 2 ] ) si se utiliza
este conjunto de datos.
Si usted tiene alguna pregunta o sugerencia , por favor pngase en contacto con Attila Reiss (
[ Nombre] . [ Apellido ] @ dfki.de ) . Tambin, por favor , hganos saber si usted tiene
cualquier publicacin que utiliza este conjunto de datos .
Recomendamos para referirse a este conjunto de datos como la PAMAP2 Dataset ? o
el PAMAP2 Actividad Fsica Monitoreo Dataset ? .
Nmero de
Clasificacin, Valores
Tareas asociadas: No Web 577
Clustering perdidos?
Accesos:
Fuente:
Prof. Dr. Bekir Karlik, bkarlik '@' selcuk.edu.tr , Departamento de Ingeniera Informtica de la
Universidad de Selcuk, Konya-Turqua
Assoc. Prof. Dr. Yousif Al-Bastaki, Departamento de Ciencias de la Computacin de la Universidad
de Bahrein, Reino de Bahrein
Atributo de la informacin:
Los datos se obtuvieron de 20 perfumes diferentes mediante el uso de un olor medidor de mano
(sensor OMX-GR). Los nombres de estos perfumes son: ajayeb, ajmal, amreaj, DOOA, asgar_ali,
bujur, burberry, dehenalaod, junaid, kausar, rosa, solidmusk, TeaTreeOil, frambuesa, RoseMusk,
fresa, constrected2, carolina_herrera, oudh_ma'alattar, constrected1.
Documentos pertinentes:
1 -? Karlik Bekir, Bastaki Yousif, Real Tiempo Monitoreo Olor Sistema de Deteccin de Uso de
OMX-GR Sensor y Neural Network , WSEAS Transacciones en Electrnica, nmero 2, vol.1,
pp.337-342, de abril de 2004
2 - Temel Turgay y Karlik Bekir, Oean Mejorado Sistema de reconocimiento de olor Usando
Aprendizaje cuantificacin vectorial con un nuevo discriminante Analysis , Neural Network World,
vol??. 17 (4), pp 287-294, 2007
3 -? Karlik Bekir y YUKSEK Kemal Fuzzy Clustering Redes Neuronales para el Real Time
Reconocimiento Olor System , Revista de Mtodos automatizados y Gestin en Qumica,
diciembre de 2007 Id. de artculo 38405 , [Web Link]
4 - AL-Bastaki, Yousif, 'Una basada en Redes Neuronales Artificiales monitoreo en lnea Sistema de
Deteccin de Olor ", Journal of Computer Science, vol. 5, no. 11, pginas 878-882, 2009.
Cita de pedidos:
1 -? Karlik Bekir, Bastaki Yousif, Real Tiempo Monitoreo Olor Sistema de Deteccin de Uso de
OMX-GR Sensor y Neural Network , WSEAS Transacciones en Electrnica, nmero 2, vol.1,
pp.337-342, de abril de 2004
2 - Temel Turgay y Karlik Bekir, Oean Mejorado Sistema de reconocimiento de olor Usando
Aprendizaje cuantificacin vectorial con un nuevo discriminante Analysis , Neural Network World,
vol??. 17 (4), pp 287-294, 2007
3 -? Karlik Bekir y YUKSEK Kemal Fuzzy Clustering Redes Neuronales para el Real Time
Reconocimiento Olor System , Revista de Mtodos automatizados y Gestin en Qumica,
diciembre de 2007 Id. de artculo 38405 , [Web Link] .
Parkinson Data Set
Resumen : La enfermedad de Parkinson Oxford Deteccin
Dataset
Valores Nmero de
Tareas asociadas: Clasificacin S 67918
perdidos? Web Accesos:
Fuente:
El conjunto de datos fue creada por Max Poco de la Universidad de Oxford, en colaboracin con el
Centro Nacional para la voz y el habla, Denver, Colorado, quien grab las seales de voz. El estudio
original publicado los mtodos de extraccin de caractersticas para trastornos de la voz en general.
Atributo de la informacin:
Entradas de la columna Matrix (atributos):
nombre - ASCII nombre del sujeto y nmero de grabacin
MDVP: Fo (Hz) - Media vocal frecuencia fundamental
MDVP: Fhi (Hz) - Mxima vocal frecuencia fundamental
MDVP: Flo (Hz) - vocal frecuencia fundamental mnima
MDVP: Jitter (%), MDVP: Jitter (Abs), MDVP: RAP, MDVP: PPQ, Jitter: DDP - Varias medidas de la
variacin en la frecuencia fundamental
MDVP: Shimmer, MDVP: Shimmer (dB), Shimmer: APQ3, Shimmer: APQ5, MDVP: APQ, Shimmer:
DDA - Varias medidas de la variacin en la amplitud
de NHR, HNR - dos medidas de la relacin entre el ruido de componentes tonales de la voz
de estado - Estado de salud del sujeto (uno) - Parkinson, (cero) - sano
RPDE, D2 - Dos medidas de complejidad dinmicos no lineales
DFA - Seal fractal exponente de escala
Spread1, spread2, PPE - Tres medidas lineales de variacin de frecuencia fundamental
Documentos pertinentes:
N/A
Cita de pedidos:
Si utiliza este conjunto de datos, por favor, cite el siguiente documento: Aprovechamiento lineal
Recurrencia y Fractal Escala Propiedades para la deteccin trastorno de la voz ', Little MA, McSharry
PE, Roberts SJ, Costello DAE, Moroz IM. BioMedical Engineering OnLine, 2007, 06:23 (26 de junio
de 2007)
Parkinson Telemonitoring Data Set
Resumen : La enfermedad de Parkinson Oxford Telemonitoring Dataset
Nmero de
Valores
Tareas asociadas: Regresin No Web 37997
perdidos?
Accesos:
Fuente:
El conjunto de datos fue creada por Athanasios Tsanas ( tsanasthanasis "@" gmail.com ) y Max
Little ( littlem "@" physics.ox.ac.uk ) de la Universidad de Oxford, en colaboracin con 10 centros
mdicos en los EE.UU. e Intel Corporation quien desarroll el dispositivo de telemonitorizacin para
registrar las seales de voz. El estudio original utiliza una serie de mtodos de regresin lineal y no
lineal para predecir la enfermedad puntuacin de los sntomas de Parkinson del mdico en la escala
UPDRS.
Documentos pertinentes:
Poco MA, McSharry PE, Hunter EJ, Ramig LO (2009),
'Adecuacin de las mediciones disfona para telemonitorizacin de la enfermedad de Parkinson ",
IEEE Transactions on Biomedical Engineering, 56 (4) :1015-1022 Poco MA, McSharry PE, Roberts
SJ, Costello DAE, Moroz IM. Aprovechamiento lineal Recurrencia y Fractal Escala Propiedades
para la deteccin trastorno de la voz ', BioMedical Engineering OnLine, 2007, 06:23 (26 junio 2007)
Cita de pedidos:
Si utiliza este conjunto de datos, por favor, cite el siguiente documento:
A Tsanas, MA Little, PE McSharry, LO Ramig (2009)
'telemonitorizacin precisa de la progresin de la enfermedad de Parkinson mediante pruebas de
lenguaje no invasivo ",
IEEE Transactions on Biomedical Engineering (aparezca) .
PEMS-SF Conjunto de Datos
Resumen : 15 meses el valor de los datos diarios (440 registros diarios) que describe la tasa de
ocupacin, entre 0 y 1, de los diferentes carriles de coches de las autopistas de la zona Baha de
San Francisco a travs del tiempo.
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 18659
perdidos?
Accesos:
Fuente:
Fuente: Departamento de Transporte de California, www.pems.dot.ca.gov
Creador: Marco Cuturi, Universidad de Kyoto, mcuturi '@' i.kyoto-u.ac.jp
Documentos pertinentes:
M. Cuturi, Fast Global Alignment Kernels, Proceedings of the Intern. Conferencia sobre Aprendizaje
Automtico 2011.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Reconocimiento basado en pluma de
Manuscrito Dgitos del conjunto de datos
Resumen de bases de datos de dgitos de 250 muestras de 44 escritores:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 49555
perdidos?
Accesos:
Fuente:
E. Alpaydin, Fevzi. Alimoglu
Departamento de Ingeniera Informtica
de la Universidad Bogazici, 80815 Estambul Turqua alpaydin '@' boun.edu.tr
Atributo de la informacin:
Todos los atributos de entrada son enteros en el rango 0 .. 100.
El ltimo atributo es el cdigo de la clase 0 .. 9
Documentos pertinentes:
F. Alimoglu (1996) Combinacin de varios clasificadores para Digit Manuscrito base-Pen
Reconocimiento, Tesis de maestra, Instituto de Estudios de Posgrado en Ciencias e Ingeniera de la
Universidad Bogazici. [Web Link]
[Web Link]
Ken Tang y Ponnuthurai N. Suganthan y Xi Yao y A. Kai Qin. dimensionalityreduction lineal utilizando
LDA relevancia ponderada . Escuela de Ingeniera Elctrica y Electrnica de la Universidad
Tecnolgica de Nanyang. 2005. [ Ver Contexto ]. Mikhail Bilenko y sugato Basu y Raymond J.
Mooney. limitaciones de la integracin y el aprendizaje mtrica en la agrupacin semi-
supervisado . ICML. 2004. [ Ver Contexto ]. Fabian Hoti y Lasse Holmstrm. Un enfoque de
estimacin de densidad semiparamtrico de clasificacin de patrones . Reconocimiento de Patrones,
37. 2004. [ Ver Contexto ]. Thomas Serafini y G. Zanghirati y Del Zanna y T. Serafini y Gaetano
Zanghirati y Luca Zanni. Dipartimento DI MATEMATICA . Mtodos de Proyeccin de la pendiente
para. 2003. [ Ver Contexto ]. Manoranjan Dash y Liu Huan y Peter Scheuermann y Kian-Lee
Tan. agrupacin jerrquica Fast y su validacin . Conocimiento de Datos. Eng, 44. 2003. [ Ver
Contexto ]. Dennis DeCoste. Anytime Mquinas Kernel Query-Tuned mediante factorizacin de
Cholesky . SDM. 2003. [ Ver Contexto ]. Greg Hamerly y Charles Elkan. Aprender la k en k-
medias . PNI. 2003. [Ver Contexto ]. Marina Meila y Michael I. Jordan. Aprender con mezclas de
rboles . Journal of Machine Learning Research, 1. 2000. [ Ver Contexto ]. Ethem
Alpaydin.Combinado 5 x 2 cv Prueba F para comparar clasificacin supervisada algoritmos de
aprendizaje . Neural Computation, 11. 1999. [ Ver Contexto ]. Georg Thimm y Emile Fiesler. IDIAP
informe Tcnico de Alto Orden y Perceptrn multicapa inicializacin . IEEE Transactions. 1994. [ Ver
Contexto ]. Adil M. Bagirov y Julien Ugon. Un algoritmo para el clculo de la funcin lineal a trozos
que separa dos sets . CIAO, Escuela de Informtica y Ciencias Matemticas de la Universidad de
Ballarat. [ Ver Contexto ].Charles Campbell y Nello Cristianini. simple algoritmos de aprendizaje para
las Mquinas de Vectores Soporte Entrenamiento . Departamento de Ingeniera Matemtica. [Ver
Contexto ]. Perry Moerland. Mezclas de modelos de variables latentes para la estimacin de la
densidad y la clasificacin . ESEARCHREPRORTIDIAPD alle M olle yo nstitutefor Pe r cep t ua l Una
Inteligencia rtificial. [ Ver Contexto ]. Luca Zanni. Una mejorada Gradient tcnica de descomposicin
basada Proyeccin de Mquinas de Vectores Soporte . Dipartimento di Matematica, Universitdi
Modena e Reggio Emilia. [ Ver Contexto ]. Adil M. Bagirov y John Yearwood. Un nuevo algoritmo de
optimizacin no lisos para la agrupacin . Centro de Informtica y Optimizacin Aplicada de la
Facultad de Informtica y Ciencias Matemticas de la Universidad de Ballarat. [ Ver
Contexto ]. Ahmed Hussain Khan y Cuidados Intensivos. Multiplicador libres Feedforward
Redes . 174. [ Ver Contexto ]. Adil M. Bagirov y Alex Rubinov y AN Soukhojak y John
Yearwood. clasificacin de datos no supervisada y supervisada a travs de no lisos y optimizacin
global . Escuela de Tecnologa de la Informacin y Ciencias Matemticas de la Universidad de
Ballarat. [ Ver Contexto ]. Georg Thimm y Emile Fiesler. Alto Orden y Perceptrn multicapa
inicializacin . [ Ver Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Propiedades fisicoqumicas de Protena
Estructura Terciaria Data Set
Resumen : Se trata de un conjunto de datos de las propiedades fisicoqumicas de la protena de
estructura terciaria. El conjunto de datos se toma del CASP 5-9. Hay 45730 seuelos y tamao
variables 0-21 Armstrong.
Valores Nmero de
Tareas asociadas: Regresin No 2517
perdidos? Web Accesos:
Fuente:
Prashant Singh Rana, psrana '@' gmail.com , ABV - Instituto Indio de Tecnologa de la Informacin y
Gestin, Gwalior, MP, India.
Atributo de la informacin:
RMSD-Tamao del residuo.
F1 -. Superficie total
F2 - no polar rea expuesta.
F3 -. rea fraccionada del residuo no polar expuesto
F4 - rea fraccional de una parte polar no expuesta de residuos.
F5 - Masa molecular rea expuesta ponderado.
F6 - Desviacin media del rea estndar expuesta de residuos.
F7 -. distancia euclidiana
F8 -. pena de estructura secundaria
F9 - limitaciones distribucin espacial (N, K Value).
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin.
Indios Pima Diabetes Data Set
Resumen : Desde el Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales; Incluye
datos sobre los costos (donado por Peter Turney)
Valores Nmero de
Tareas asociadas: Clasificacin S 108362
perdidos? Web Accesos:
Fuente:
Propietarios Original: Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales de los
donantes de base de datos: Vincent Sigillito ( vgs "@" aplcen.apl.jhu.edu) Centro de Investigacin,
RMI Jefe de Grupo Laboratorio de Fsica Aplicada Johns Hopkins University Johns Hopkins
Ruta Laurel, MD 20707 (301) desde novecientos cincuenta y tres hasta seis mil doscientos treinta y
una
Atributo de la informacin:
1. Nmero de veces embarazadas
2. Concentracin de glucosa en plasma a 2 horas en una prueba de tolerancia oral a la glucosa
3. La presin arterial diastlica (mm Hg)
4. Grosor del pliegue cutneo del trceps (mm)
5. Insulina en suero 2 horas (mu U / ml)
6. ndice de masa corporal (peso en kg / (altura en metros) ^ 2)
7. Funcin pedigr Diabetes
8. Edad (aos)
9. Variable de clase (0 1) ** ACTUALIZACIN: 02/28/2011 Hasta esta pgina web indic que no
hubo valores perdidos en el conjunto de datos. Como se ha sealado por un usuario repositorio, esto
no puede ser cierto: hay ceros en lugares donde son biolgicamente imposible, como el atributo de la
presin arterial. Parece muy probable que los valores cero codifican los datos que faltan. Sin
embargo, ya que los donantes de conjuntos de datos efectuado tal declaracin le animamos a que
utilice su mejor juicio y declarar sus suposiciones.
Documentos pertinentes:
Smith, JW, Everhart, JE, Dickson, WC, Knowler, WC, y Johannes, RS (1988). Usando el algoritmo de
aprendizaje ADAP para predecir el inicio de la diabetes mellitus. En Actas del Simposio sobre
aplicaciones informticas y la asistencia mdica} (pp. 261-265). IEEE Computer Society Press. [Web
Link]
. Jeroen Eggermont y Joost N. Kok y Walter A. Kosters Programacin Gentica para la clasificacin
de los datos: la particin del espacio de bsqueda . SAC. 2004. [ Ver Contexto ]. Eibe Frank y Mark
Hall. estimadores de probabilidad Visualizacin de clase . PKDD. 2003. [ Ver Contexto ]. Michael L.
Raymer y Travis E. Doom y Leslie A. Kuhn y William F. Punch. Descubrimiento de conocimiento en
bases de datos mdicas y biolgicas utilizando un clasificador de Bayes / algoritmo evolutivo
hbrido .Transacciones de IEEE en Sistemas, Hombre y Ciberntica, parte B, de 33 aos. 2003. [ Ver
Contexto ]. Peter Sykacek y Stephen J. Roberts. Clasificacin de adaptacin por Variational Kalman
filtrado . PNI. 2002. [ Ver Contexto ]. Marina Skurichina y Ludmila Kuncheva y Robert PW
Duin. Embolsado y impulso para el clasificador ms cercano Mean: Efectos del tamao de la muestra
sobre la diversidad y precisin . Sistemas Clasificadores mltiples. 2002. [ Ver Contexto ]. Ilya
Blayvas y Ron Kimmel.multirresolucin Aproximacin para la Clasificacin . CS Dept.
Technion. 2002. [ Ver Contexto ]. Tao Jiang y Art B. Owen. Quasi-regresin para la visualizacin e
interpretacin de las funciones de la caja negra . Departamento de Estadstica de la Universidad de
Stanford. 2002. [ Ver Contexto ]. Jochen Garcke y Michael Griebel y Michael Tes. Minera de datos
con Sparse Grids . Informtica, 67. 2001. [ Ver Contexto ]. Robert Burbidge y Matthew Trotter y
Bernard F. Buxton y Sean B. Holden. STAR - Sparsity travs Rechazo automatizado . IWANN
(1). 2001. [ Ver Contexto ]. Simon Tong y Daphne Koller. Restricted Bayes clasificadores
ptimo . AAAI / IAAI. 2000. [Ver Contexto ]. Stavros J. Perantonis y Vassilis Virvilis. Caracterstica de
entrada Extractor de mltiples capas Perceptrones Usando Anlisis de Componentes Principales
supervisada . Neural Processing Letters, 10. 1999. [ Ver Contexto ]. Huan Liu y Rudy
Setiono. Caracterstica Transformacin y Decisin multivariado rbol de induccin .Discovery
Science. 1998. [ Ver Contexto ]. Thomas G. Dietterich. Prueba estadstica aproximada para la
comparacin de clasificacin supervisada algoritmos de aprendizaje . Neural Computation,
10. 1998. [ Ver Contexto ]. Kristin P. Bennett y Erin J. Bredensteiner. Un mtodo paramtrico
Optimizacin de Aprendizaje Automtico .INFORMA Journal on Computing, 9. 1997. [ Ver
Contexto ]. Jennifer A. Azul y Kristin P. Bennett. Hybrid Extreme Point Bsqueda
Tab . Departamento de Ciencias Matemticas del Instituto Politcnico Rensselaer. 1996. [ Ver
Contexto ]. Peter D. Turney. sensibles a los costes de clasificacin: evaluacin emprica de una
Decisin gentico hbrido Tree Induccin algoritmo . CoRR, csAI/9503102. 1995. [ Ver
Contexto ]. Ilya Blayvas y Ron Kimmel. PAPEL INVITADO Nmero especial sobre el anlisis
multirresolucin Machine Learning a travs de multirresolucin aproximacin . [ Ver Contexto ]. Lois
C. Boggess Andrew Watkins y Jon Timmis y. Sistema Inmune Artificial Reconocimiento (AIRS): Un
ImmuneInspired supervisadas algoritmo de aprendizaje . (Abw5, jt6@kent.ac.uk) Laboratorio de
Computacin de la Universidad de Kent. [ Ver Contexto ]. Ilya Blayvas y Ron Kimmel. Clasificacin
eficiente a travs de multirresolucin Training Set aproximacin . CS Dept. Technion. [ Ver
Contexto ]. Matthias Scherf y W. Brauer. Seleccin de caractersticas por medio de un enfoque de
funciones de ponderacin . GSF - Centro Nacional de Investigacin del Medio Ambiente y de la
Salud. [ Ver Contexto ]. Rudy Setiono y Huan Liu. Selector de funciones neuronales de la
red . Departamento de Sistemas Informticos y la Universidad Nacional de Ciencias de la
Computacin de Singapur. [ Ver Contexto ]. Christopher P. Diehl y Gert Cauwenberghs. SVM
Incremental aprendizaje, adaptacin y optimizacin .Laboratorio de Fsica Aplicada de la Universidad
Johns Hopkins. [ Ver Contexto ]. Wl odzisl / aw Duch y Rudy Setiono y Jacek M. Zurada. mtodos de
inteligencia computacional para la comprensin de datos basado en normas . [ Ver
Contexto ]. Michalis K. Titsias y Aristidis Likas. Modelos Kernel Shared para la Clase estimacin de
densidades condicionales . [ Ver Contexto ]. Lawrence O. Hall y Nitesh V. Chawla y Kevin W.
Bowyer. Combinando rboles de decisin aprendidas en paralelo .Departamento de Ciencias de la
Computacin e Ingeniera, ENB 118 University of South Florida. [ Ver Contexto ]. Charles Campbell y
Nello Cristianini. simple algoritmos de aprendizaje para las Mquinas de Vectores Soporte
Entrenamiento . Departamento de Ingeniera Matemtica. [ Ver Contexto ]. Liping Wei y Russ B.
Altman. y un sistema automatizado para la generacin de perfiles de Enfermedades comparativo
hacer diagnsticos . Seccin de Informtica Universidad de Stanford Escuela de Medicina de
Medicina, MSOB X215. [ Ver Contexto ]. Chotirat Ann y Dimitrios Gunopulos. Ampliacin de la
Ingenuo clasificador bayesiano: Utilizacin de rboles de decisin para la seleccin de
caractersticas . Departamento de Ciencias de la Computacin de la Universidad de California. [ Ver
Contexto ]. Federico Divina y Elena Marchiori. Basada en el Conocimiento Evolutiva Buscar inductivo
Concepto de Aprendizaje . Vrije Universiteit de msterdam. [ Ver Contexto ]. Michael Lindenbaum y
Sal Markovitch y Dmitry Rusakov. Muestreo Selectivo Usando Random Campo Modelado . [ Ver
Contexto ]. Federico Divina y Elena Marchiori. Manejo de atributos continuos en un Evolutiva
inductivo de Aprendices . Departamento de Ciencias de la Computacin Vrije Universiteit. [ Ver
Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Nmero de
Valores
Tareas asociadas: No No Web 12710
perdidos?
Accesos:
Fuente:
Matthew D. Schmill, Paul R. Cohen
Experimental Knowledge Systems Laboratory
del Departamento de Ciencias de la Computacin
Caja 34610
Universidad de Massachusetts, Amherst
Amherst, MA 01003-4610 Schmill '@' cs.umass.edu , cohen '@' cs.umass.edu
Atributo de la informacin:
TRIAL-ID: categrico, el id de prueba de la experiencia que la observacin pertenece al
DESCRIPCIN: una descripcin simblica de la experiencia de diseo
TIEMPO-SEG: una lectura del reloj interno de la Pioneer, en segundos
BATERA NIVEL: una lectura del nivel de la batera, en voltios
SONAR-0: lectura de profundidad sonar, en mm, de la izquierda (90) sealando sonar
SONAR-1: lectura de profundidad sonar, en mm, de una sonda (15) sealando
SONAR-2: lectura de profundidad sonar, en mm, de un sonar (7.5) apuntando
SONAR-3: Lectura de la profundidad de sonar, en mm, de un delantero (0) apuntando sonar
SONAR-4: Lectura de la profundidad de sonar, en mm, de un (-7,5) apuntando sonar
SONAR-5: sonar lectura de profundidad, en mm, de una (-15) apuntando sonar
SONAR-6: Lectura de la profundidad de sonar, en mm, de un derecho (-90) apuntando sonar
DENOMINACIN: Rbrica lectura, en grados, a partir de "norte verdadero" del robot
R RUEDAS-VEL: velocidad de la rueda derecha, en mm / seg
L-WHEEL-VEL: velocidad de la rueda izquierda, en mm / seg
TRANS-VEL: velocidad de traslacin, mm / seg
ROT-VEL: velocidad de rotacin, mm / seg
R-BLOQUEO : sensor de atascamiento de la rueda derecha, binaria (0/1)
L-PARADA: sensor de la rueda izquierda la parada, binaria (0/1)
ROBOT-STATUS: Estado robot, 2.0 = parado, 3,0 = mover
GRIP-ESTADO: pinza estado
GRIP-FRONT -BEAM: haz pausa pinza, binario, 1.0 = roto
GRIP-REAR-BEAM: haz pausa pinza, binario, 1.0 = roto
GRIP-BUMPER: pinza parachoques, binario, 1.0 = en contacto
VIS-A-AREA: rea del visible dominante objeto para el canal A, en pxeles
VIS-AX: X ubicacin del objeto en el canal A en plano de la imagen, -140 ... 140
VIS-AY: Y la ubicacin del canal A en el plano de la imagen
VIS-AH: altura del objeto en el canal A en el plano, en pxeles
VIS-AW: anchura del objeto en A el plano de la imagen, en pxeles
VIS-A-DIST: distancia al objeto en el canal A, en mm
VIS-B-AREA: rea del objeto visible dominante para el canal B, en pxeles
VIS-BX: X ubicacin del objeto en el canal B en el plano de la imagen, -140 ... 140
VIS-BY: Y la ubicacin del canal B en el plano de la imagen
VIS-BH: altura del objeto en el canal B en el plano, en pxeles
VIS-BW: anchura del objeto en B el plano de la imagen, en pxeles
VIS-B-DIST: distancia al objeto en el canal B, en mm
VIS-C-AREA: rea del objeto visible dominante para el canal C, en pxeles
VIS-CX : X ubicacin del objeto en el canal C en plano de la imagen, -140 ... 140
VIS-CY: Y la ubicacin del canal C en la imagen del avin
VIS-CH: altura del objeto en C el plano de la imagen, en pxeles
VIS-CW: Ancho del objeto en C en plano de la imagen, en pxeles
VIS-C-DIST: distancia al objeto en el canal C, en mm Para las variables visuales, cuando no hay
ningn objeto visible, width = 0, height = 0, area = 0, la distancia = 10000.0, Y = 0, X = 140,0. Los
sonares reportan 5,201.0 como su distancia mxima.
Documentos pertinentes:
Oates, Tim; Schmill, Matthew D. y Cohen, Paul R. Identificar experiencias cualitativamente
diferentes:. Experimentos con un Robot Mvil [Web Link] Schmill, Matthew D.; Oates, Tim, y Cohen,
Paul R. Learned Modelos para Continuo Planificacin. VII Taller Internacional sobre Inteligencia
Artificial y Estadstica. [Web Link]
Cita de pedidos:
El trabajo representado aqu fue financiado por DARPA contrae F49620-97-1-0485 y N66001-96-C-
8504. Para uso exclusivo en investigacin.
Valores Nmero de
Tareas asociadas: Clasificacin S 29375
perdidos? Web Accesos:
Fuente:
Creadores: Yoram Reich y Steven J. Fenves Departamento de Ingeniera Civil y de Ingeniera de
Diseo del Centro de Investigacin de la Universidad Carnegie Mellon de Pittsburgh, PA
15213 Recopilado de diversas fuentes. Donante: Yoram Reich ( yoram.reich '@' cs.cmu.edu )
Atributo de la informacin:
El estado de campo de tipo si una propiedad es continua / entero (c) o nominal (n). Para las
propiedades con c, n tipo, el rango de nmeros continuos se da primero y los posibles valores de la
nominal seguir el punto y coma. Nombre / Tipo / Posibles valores / Comentarios 1. IDENTIF / - / - /
identificador de los ejemplos 2. RO / n / A, M, O / - 3. UBICACIN / n / 1 a 52 / - 4. ERIGIDO / c, n /
1818-1986; ARTESANA, EMERGENTES, MADURO, MODERNO / - 5. FIN / n / WALK,
ACUEDUCTO, RR, CARRETERA / - 6. LONGITUD / c, n / 804-4558; CORTO, MEDIO, LARGO / -
7. CARRILES / C, N / 1, 2, 4, 6; 1, 2, 4, 6 / - 8. CLEAR-G / N / N, G / - 9. T-OR-D / n / TRAVS DE
LA CUBIERTA / - 10. MATERIAL / n / MADERA, hierro, acero / - 11. SPAN / n / CORTO, MEDUIM,
LONG / - 12. REL-L / N / S, SF, F / - 13. TIPO / n / MADERA, suspensiones, SIMPLE-T, ARCH,
CANTILEV, CONT-T / -
Documentos pertinentes:
Reich & Fenves (1989). Aprendizaje incremental para capturar Diseo Expertise. Informe tcnico:
EDRC 12-34-89, Diseo de Ingeniera Centro de Investigacin de la Universidad Carnegie Mellon,
Pittsburgh, PA. Reich (1989). La convergencia de `` Ideal'' Diseo Conocimiento por aprendizaje,
Actas del Primer Taller Internacional de Mtodos Formales en Ingeniera de Diseo, pp:. 330-349,
Colorado Springs, CO, 01 1990 [Web Link] Reich (1989) Combinando nominal y Propiedades
continuas en un sistema de aprendizaje incremental para el diseo. Informe tcnico:. EDRC 12-33-
89 Reich (1989) Incremental Concepto Formacin con tipos de propiedad mixta.Manuscrito indito.
Ljupco Todorovski y Saso Dzeroski. Los experimentos en aprendizaje a nivel de Meta con
ILP . PKDD. 1999. [ Ver Contexto ]. Paul D. Wilson y Tony R. Martnez.Combinar la validacin
cruzada y confianza para medir la aptitud . corporacin fonix la Universidad Brigham Young. [ Ver
Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Nmero de
Tareas asociadas: Clasificacin Valores perdidos? No Web 13372
Accesos:
Fuente:
Rajen Bhatt, rajen.bhatt '@' gmail.com , IIT Delhi
Documentos pertinentes:
1. Rajen B. y M. Gopal Bhatt, 2008, FRCT: Clasificacin Fuzzy-Rough Treesa , Pattern
Analysis and Applications, 11 (1), pp 73-88??.
2. Shweta Sahu y Rajen B. Bhatt, una clasificacin Automatic de Seales Electroencefalografa
utilizando Wavelet anlisis de paquetes y la Decisin Fuzzy Treesa ?, En Proc. de 28 Conferencia
Nacional de Sistemas (NSC-2004), Dic. 16-18, Vellore, India.
3. Rajen Bhatt, "Enfoque Fuzzy-Rough de Clasificacin de patrones: Algoritmos hbridos y
Optimizacin ', Ph.D. Tesis, IIT Delhi, 2006.
Cita de pedidos:
Rajen Bhatt, "Planificacin-Relax conjunto de datos para la clasificacin automtica de seales de
EEG ', UCI Machine Learning Repositorio
Valores Nmero de
Tareas asociadas: Clustering S 57651
perdidos? Web Accesos:
Fuente:
Fuente original:
USDA base de datos de las plantas: http://plants.usda.gov/index.html
Los datos estn en la forma transaccional. Contiene los nombres latinos (especie o gnero) y
abreviaturas del estado.
Atributo de la informacin:
Cada fila contiene un nombre latino (especie o gnero) y una lista de abreviaturas de estado.
Documentos pertinentes:
Cita de pedidos:
Incluso si se procesan los datos, es bueno dar una referencia a la fuente original:
USDA, NRCS. 2008. La base de datos PLANTAS ( [Web Link] , 31 de diciembre de 2008). Nacional
Plant Data Center, Baton Rouge, LA 70874-4490 EE.UU..
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 178002
perdidos?
Accesos:
Fuente:
Creadores: Robert CATTRAL ( Cattral '@' gmail.com ) Franz Oppacher
( Oppacher '@' scs.carleton.ca ) Carleton University, Departamento de Ciencias de la
ComputacinUnidad de Investigacin en Sistemas Inteligentes 1125 Colonel By Drive, Ottawa,
Ontario, Canad, K1S5B6
Atributo de la informacin:
1) S1 "Juego de la tarjeta # 1"
ordinal (1-4), que representa {corazones, picas, diamantes, clubs} 2) C1 "Posicin de la tarjeta #
1" numrica (1-13) que representa (As, 2, 3, ..., reina, rey) 3) S2 "Juego de la tarjeta # 2" ordinal (1-
4), que representa {corazones, picas, diamantes, clubs} 4) C2 "Posicin de la tarjeta # 2" numrica
(1-13) que representa (As, 2, 3, ..., reina, rey) 5) S3 "Juego de la tarjeta # 3" ordinal (1-4) representan
{corazones, espadas, diamantes, clubs} 6) C3 "Posicin de la tarjeta # 3 " numrica (1-13) que
representa (As, 2, 3, ..., reina, rey) 7) S4 "Juego de la tarjeta # 4" ordinal (1-4), que representa
{corazones, picas, diamantes, clubs} 8) C4 "Posicin de la tarjeta # 4" numrica (1-13) que
representa (As, 2, 3, ..., reina, rey) 9) S5 "Juego de la tarjeta # 5" ordinal (1-4), que representa {
corazones, picas, diamantes, clubs} 10) C5 "Rango de tarjetas 5" numrica (1-13) que representa
(As, 2, 3, ..., reina, rey) 11) Clase de "Poker Hand" Ordinal (0 - 9) 0: No hay nada en la mano, no una
mano de pquer reconocido 1: Un par; un par de filas iguales dentro de cinco cartas 2: Dos pares,
dos pares de filas iguales dentro de cinco tarjetas 3: Tres de una clase, tres filas iguales dentro cinco
tarjetas 4: Recta; cinco cartas, secuencialmente clasificados sin brechas 5: Flush, cinco cartas del
mismo palo 6: Construccin completa, par + diferente rango tres de una clase 7: Cuatro de una
clase, cuatro filas iguales dentro de cinco cartas 8: Escalera de color; recta + ras 9: Escalera real;
{As, Rey, Reina, Jota, Diez} + flush
Documentos pertinentes:
R. Cattral, F. Oppacher, D. Deugo. Evolutiva de minera de datos con Automatic Regla
Generalizacin. . Avances recientes en Informtica, Informtica y Comunicaciones, pp.296-300,
WSEAS Press, 2002
Nota: Este fue un conjunto de datos ligeramente diferente que tena ms clases, y era mucho ms
difcil.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Valores Nmero de
Tareas asociadas: Clasificacin S 31775
perdidos? Web Accesos:
Fuente:
Creadores: Sharon Summers, la Escuela de Enfermera de la Universidad de Kansas Medical
Center, Kansas City, KS 66160 Linda Woolery, Escuela de Enfermera de la Universidad de
Missouri, Columbia, MO 65211 Donante: Jerzy W. Grzymala-Busse ( jerzy '@' cs. ukans.edu ) (913)
864-4488
Atributo de la informacin:
1. L-CORE (temperatura del paciente interno en C):
alta (> 37), media (> = 36 y <= 37), baja (<36)
2. L-SURF (temperatura de la superficie del paciente en C):
alta (> 36,5), medio (> = 36,5 y <= 35), baja (<35)
3. L-O2 (saturacin de oxgeno en%):
excelente (> = 98), buena (> = 90 y <98),
justo (> = 80 y <90), mala (<80)
4. L-BP (ltima medicin de la presin arterial):
alta (> 130/90), medio (<= 130/90 y> = 90/70), baja (<90/70)
5. SURF-STBL (estabilidad de la temperatura de la superficie del paciente):
estable-mod estable, inestable
6. CORE-STBL (estabilidad de la temperatura central del paciente)
estable-mod estable, inestable
7. BP-STBL (estabilidad de la presin arterial del paciente)
estable-mod estable, inestable
8. COMFORT (confort del paciente percibida al momento del alta, medida como
un entero entre 0 y 20)
9. decisin ADM-DECS (decisin del alta):
I (paciente enviado a la Unidad de Cuidados Intensivos),
S (paciente preparado para volver a casa),
A (paciente enviado a planta de hospitalizacin general)
Documentos pertinentes:
A. Budihardjo, J. Grzymala-Busse, L. Woolery (1991). Programa LERS_LB 2.5 como una
herramienta para la adquisicin del conocimiento en enfermera, Actas de la cuarta
internacional. Conferencia sobre Ingeniera Industrial y Aplicaciones de la IA y sistemas expertos, pp
735-740. [Web Link] L. Woolery, J. Grzymala-Busse, S. Summers, A. Budihardjo (1991). El uso del
programa de aprendizaje automtico LERS_LB 2,5 en la adquisicin de conocimientos para el
desarrollo de sistemas expertos en enfermera. Informtica en Enfermera 9, pp 227-234.
Petri Kontkanen y Jussi Lahtinen y Petri Myllymki y Henry Tirri. visualizacin bayesiano no
supervisado de los datos de alta dimensin . KDD. 2000. [ Ver Contexto ]. Art B. Owen. vecinos
tubulares para la regresin y clasificacin . La Universidad de Stanford. 1999. [ Ver Contexto ]. Glenn
Fung y Sathyakama Sandilya y R. Bharat Rao.regla de extraccin a partir de Mquinas de Vectores
Soporte lineales . Computer-Aided Diagnosis & Therapy, Siemens Medical Solutions, Inc. [ Ver
Contexto ].
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Predecir las actividades de las palabras clave
en una lnea de comunicacin social
Conjunto de Datos
Resumen : Los datos de Twitter se recogieron durante 360 das consecutivos. Lo hizo mediante la
consulta de 1497 palabras clave en ingls de la muestra de Wikipedia.Se propone este conjunto de
datos en un aprendizaje para clasificar ajuste.
Multivariante,
Conjunto de datos Nmero de
Secuencial, 51 rea: Ordenador
Caractersticas: Time-Series instancias:
Nmero de
Valores
Tareas asociadas: No No Web 4968
perdidos?
Accesos:
Fuente:
Franois Kawala (1,2) Ahlame Douzal (1) Eric Gaussier (1) Eustache Diemert (2)
Instituciones:
(1) Universidad Joseph Fourier (Grenoble I) - Laboratoire d'Informatique de Grenoble (LIG) - Equipe
AMA
(2) TechMediaNetwork - www.techmedianetwork.com Correspondencia: Franois
Kawala: francois.kawala '@' imag.fr / fkawala '@' techmedianetwork.com
Atributo de la informacin:
Ver archivos y / o [Web Link]
Documentos pertinentes:
Apprentissage d'ordonnancement et influencia de l'ambigut pour la prdiction d'activit sur les
rseaux sociaux (F. Kawala, A. Douzal-Chouakria, E. Gaussier, E. Dimert), en Actes de la
Confrence en Recherche d'infomations et Aplicaciones (CORIA), pp 22, 2014.
Cita de pedidos:
Apprentissage d'ordonnancement et influencia de l'ambigut pour la prdiction d'activit sur les
rseaux sociaux (F. Kawala, A. Douzal-Chouakria, E. Gaussier, E. Dimert), en Actes de la
Confrence en Recherche d'infomations et Aplicaciones (CORIA), pp 22, 2014.
Tumor primario Data Set
Resumen : Desde Ljubljana Instituto de Oncologa
Valores Nmero de
Tareas asociadas: Clasificacin S 33382
perdidos? Web Accesos:
Fuente:
Este es uno de los tres dominios previstos por la Oncologa Institutenthat ha aparecido
repetidamente en la literatura de aprendizaje de mquina. (Vase tambin el cncer de mama y
linfografa.)
Atributo de la informacin:
--- NOTA: Todos los valores de los atributos en la base de datos han sido introducidos como valores
numricos que corresponden a su ndice en la lista de valores de atributos para ese dominio atributo
como se indica a continuacin.
1. clase: de pulmn, cabeza y cuello, esophasus, tiroides, estmago, duoden y sm.int, colon, recto,
ano, las glndulas salivales, pncreas, vescula biliar, hgado, rin, vejiga, testculos, prstata,
ovario, cuerpo de tero, cuello del tero , la vagina, mama
2. edad: <30, 30-59,> = 60
3. sexo: masculino, femenino
4. tipo histolgico: epidermoide, adenocarcinoma, anaplsico
5. grados de dife: bien, bastante, poco
6. hueso: s, no
7. de mdula sea: s, no
8. pulmn: s, no
9. pleura: s, no
10. peritoneo: s, no
11. hgado: s, no
12. cerebro: s, no
13. la piel: si, no
14. cuello: s, no
15. supraclavicular: s, no
16. axilar: s, no
17. mediastino: s, no
18. abdominal: s, no
Documentos pertinentes:
Xavier Llor y David E. Goldberg e Ivn Traus y Ester Bernad i Mansilla. Precisin, parsimonia, y la
generalidad en los sistemas de aprendizaje evolutivo a travs de Seleccin
multiobjetivo . IWLCS. 2002. [ Ver Contexto ]. Remco R. Bouckaert. Precisin limita para conjuntos
bajo 0 {1 derrota . Xtal Montaa Tecnologa de la Informacin y Departamento de Ciencias de la
Computacin de la Universidad de Waikato. 2002. [ Ver Contexto ]. Igor Kononenko y Edvard Simec
y Marko Robnik-Sikonja. Superacin de la miopa de los algoritmos de aprendizaje inductivo con
RELIEFF . Appl. Intell, 7. 1997. [ Ver Contexto ]. Pedro Domingos. Control-Sensible Seleccin de
caractersticas para los Estudiantes de Lazy . Artif. Intell. Rev, 11. 1997. [ Ver Contexto ]. Kamal Ali y
Michael J. Pazzani. Reduccin de errores a travs del aprendizaje mltiples
descripciones . Aprendizaje Automtico, 24. 1996. [ Ver Contexto ]. Geoffrey I. Webb. OPUS: Un
Algoritmo admisible Eficiente para Unordered Buscar . J. Artif.Intell. Res.. (JAIR, 3. 1995. [ Ver
Contexto ]. Alexander K. Seewald. Disertacin hacia la comprensin de apilamiento Los estudios de
un general Ensemble Aprendizaje Esquema ausgefuhrt zum Zwecke der Erlangung des
akademischen Grados eines der Doktors technischen Naturwissenschaften . [ Ver
Contexto ]. Geoffrey I Webb .Aprender Listas de decisin anteponiendo Reglas inferidos . Facultad
de Informtica y Matemticas de la Universidad de Deakin. [ Ver Contexto ].
Cita de pedidos:
Este dominio tumor primario se obtuvo del Centro Mdico de la Universidad, Instituto de Oncologa,
Ljubljana, Yugoslavia. Damos las gracias a M. y M. Zwitter Soklic de proporcionar los datos. Por
favor, incluya esta cita si tiene previsto utilizar esta base de datos.
Prodigy Data Set
Resumen : dominios variados como blocksworld, eightpuzzle y schedworld.
Nmero de
Valores
Tareas asociadas: N/A N/A Web 10221
perdidos?
Accesos:
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin.
Protein Data Set Data
Resumen : Indocumentados
Nmero de
Tareas asociadas: N/A Valores perdidos? N/A Web 21455
Accesos:
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Documentos que citan este conjunto de datos 1 :
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Pseudo Peridico sinttico de serie temporal
de Conjunto de Datos
Resumen : Este conjunto de datos se ha diseado para los sistemas
de pruebas de indexacin en bases de datos de series de tiempo. Los
datos aparecen altamente peridica, pero nunca se repite exactamente
en s.
Nmero de
Valores
Tareas asociadas: N/A N/A Web 14544
perdidos?
Accesos:
Fuente:
Eamonn J. Keogh y Michael J. Pazzani
Departamento de Informacin y Ciencias de la Computacin
de la Universidad de California, Irvine, California 92697
EE.UU. eamonn '@' ics.uci.edu , Pazzani '@' ics.uci.edu
Documentos pertinentes:
Eamonn J. Keogh, Michael J. Pazzani: (1999). Un esquema de indexacin de bsqueda de similitud
en grandes bases de datos de series de tiempo. La 11 Conferencia Internacional sobre Gestin de
Base de Datos de la Ciencia y de Estadstica. Cleveland, Ohio. [Web Link] Sanghyun Park, Dongwon
Lee, y Wesley W. Chu. "Recuperacin rpida de subsecuencias similares en larga secuencia de
bases de datos", en el tercero IEEE Conocimiento e Ingeniera Taller de Intercambio de Datos
(KDEX), Chicago, IL, EE.UU., noviembre de 1999 [Web Link]
Cita de pedidos:
Disponible de forma gratuita para su uso en investigacin.
PubChem Bioensayo de datos Conjunto de
datos
Resumen : Estos conjuntos de datos de bioensayo altamente desequilibrados son de los diferentes
tipos de evaluacin que se pueden realizar con la tecnologa HTS. 21 conjuntos de datos se crean
a partir de 12 bioensayos.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 13790
perdidos?
Accesos:
Fuente:
Virtual de Bioensayo datos
Amanda C Schierz, Centro de Investigacin de Tecnologa Inteligente de la Universidad de
Bournemouth, Talbot Campus, Poole, Dorset, BH12 5BB, Reino Unido
Journal of Quimioinformtica 2009, uno y veintin doi: 10.1186/1758-2946-1-21
Atributo de la informacin:
Cada atributo se ha descrito completamente en la publicacin de acceso abierto. Los datos son una
mezcla de boolean, integer y valores reales. Slo 2 de clase - activa e inactiva. Altamente
desequilibrada.
Documentos pertinentes:
Citaciones para papel: El uso de rboles de clasificacin para la bioinformtica Xiang Chen, Minghui
Wang, Zhang Heping: 6 JAN 2011 DOI: 10.1002/widm.14 modelo de consenso para la identificacin
de nuevos inhibidores de PI3K en gran biblioteca qumica Chin Yee Liew, Xiao Hua Ma y Chun Wei
Yap Journal of Computer-Aided Molecular Design Volumen 24, Nmero 2, 131-141, DOI:
10.1007/s10822-010-9321-0 gentica del algoritmo de red neuronal-(GANN): un estudio de las
funciones de activacin de redes neuronales y la profundidad de Bsqueda algoritmo gentico
aplicado a la seleccin de funcin Dong Ling Tong y Robert Mintram Revista Internacional de
Aprendizaje Automtico y Ciberntica Volumen 1, Nmeros 1-4, 75-87, DOI: 10.1007/s13042-010-
0004-x
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
QSAR biodegradacin Data Set
Resumen : Conjunto de datos que contiene los valores para 41 atributos (descriptores
moleculares) que se utiliza para clasificar los 1.055 productos qumicos en 2 clases (listos y no
listos biodegradable).
Nmero de
Valores
Tareas asociadas: Clasificacin N/A Web 3702
perdidos?
Accesos:
Fuente:
Kamel Mansouri, Tine Ringsted, Davide Ballabio ( davide.ballabio '@' unimib.it ), Roberto Todeschini,
Viviana Consonni, Milano Quimiometra y QSAR Research Group
(http://michem.disat.unimib.it/chm/ ), Universitt degli Studi Milano "Bicocca, Milano (Italia)
Atributo de la informacin:
41 descriptores moleculares y 1 clase experimental:
1) SpMax_L: Leading valor propio de la matriz de Laplace
2) J_Dz (e): Balaban-como ndice de matriz Barysz ponderado por Sanderson electronegatividad
3) NHM: El nmero de tomos pesados
4) F01 [NN]: Frecuencia de NN a la distancia topolgica 1
5) F04 [CN]: Frecuencia de CN en la distancia topolgica 4
6) NssssC: Nmero de tomos de tipo ssssC
7) NCB-: Nmero de benceno sustituido C (sp2)
8) C%: Porcentaje de tomos de C
9) NCP: Nmero de primaria C terminal (sp3)
10) nO: El nmero de tomos de oxgeno
11) F03 [CN]: Frecuencia de CN en la distancia topolgica 3
12) SdssC: Suma de DSSC E-estados
13) HyWi_B (m): ndice de Hyper-Wiener-like (funcin de registro) de la matriz de la carga ponderada
por la masa
14) LOC: Poda ndice centric
15) SM6_L: Momento espectral de orden 6 de la matriz de Laplace
16) F03 [CO]: Frecuencia de C - O a una distancia topolgica 3
17) Yo: electronegatividad Sanderson atmica (escalado en el tomo de carbono) Media
18) Mi: primer potencial de ionizacin media (escalado en el tomo de carbono)
19) nN-N: Nmero de N Hidracinas
20) nArNO2: Nmero de nitro grupos (aromtico)
21) nCRX3: Nmero de CRX3
22) SpPosA_B (p): Normalizado suma positiva espectral de la matriz de la carga ponderada por
polarizabilidad
23) nCIR: Nmero de circuitos
24) B01 [C-Br]: Presencia / ausencia de C - Br en la distancia topolgica 1
25) B03 [C-Cl]: Presencia / ausencia de C - Cl a distancia topolgica 3
26) N-073:.. Ar2NH / Ar3N / Ar2N-Al / R. N. R
27) SpMax_A: Liderando valor propio de la matriz de adyacencia (ndice Lovasz-Pelikan)
28) Psi_i_1d: ndice pseudoconnectivity estado Intrinsic - Tipo de 1d
29) B04 [C-Br]: Presencia / ausencia de C - Br en la distancia topolgica 4
30) SDO: Suma de E -dice
31) TI2_L: ndice Segundo Mohar de matriz de Laplace
32) CNRT: Nmero de anillo de C terciario (sp3)
33) C-026: R - CX - R
34) F02 [CN]: Frecuencia de C - N a distancia topolgica 2
35) nHDon: Nmero de tomos donadores de enlaces de H (N y O)
36) SpMax_B (m): A la vanguardia de valores propios de la matriz de la carga ponderada por la
masa
37) Psi_i_A: ndice pseudoconnectivity estado Intrinsic - Tipo S promedio
38) nN : El nmero de tomos de nitrgeno
39) SM6_B (m): Momento espectral de orden 6 de la matriz de la carga ponderada por la masa
40) nArCOOR: Nmero de steres (aromtico)
41) NX: Nmero de tomos de halgeno
42) clase experimental: listo biodegradable (RB ) y no est listo biodegradable (NRB)
Documentos pertinentes:
Mansouri, K., Ringsted, T., Ballabio, D., Todeschini, R., Consonni, V. (2013). Estructura Cuantitativa -
modelos de actividad Relacin de biodegradabilidad de las sustancias qumicas. Journal of Chemical
Information and Modeling, 53, 867-878
Cita de pedidos:
Por favor, cite el siguiente documento si publica los resultados basados en la biodegradacin de
datos QSAR: Mansouri, K., Ringsted, T., Ballabio, D., Todeschini, R. consonni, V. (2013). Estructura
Cuantitativa - modelos de actividad Relacin de biodegradabilidad de las sustancias
qumicas. Journal of Chemical Information and Modeling, 53, 867-878
QtyT40I10D100K Data Set
Resumen : Ya que no hay flujo de datos secuencial numrico disponible en los conjuntos de datos
estndar, este conjunto de datos se genera a partir del conjunto de datos original, T40I10D100K
Valores Nmero de
Tareas asociadas: N/A N/A 10868
perdidos? Web Accesos:
Fuente:
Omid Shakeri, M.Sc omid.shakeri '@' tmu.ac.ir ; omid.shakeri '@' gmail.com . Laboratorio de Minera
de Datos, Informtica Departamento de Ingeniera de la Universidad Kharazmi, Karaj / Tehern,
Irn Mir Mohsen Pedram, Ph. D Pedram '@' tmu.ac.ir Lab para minera de datos., Informtica
Departamento de Ingeniera de la Universidad Kharazmi, Karaj / Tehern, Irn
Atributo de la informacin:
CustomerID: el ID del cliente que ha realizado la transaccin (generado aleatoriamente [1 100])
Tiempo: el tiempo en que la transaccin se ha realizado
la transaccin: la operacin que se ha realizado
Cantidad: el valor de la cantidad de cada transaccin (generado aleatoriamente [ 1 10])
Documentos pertinentes:
Los trabajos que utilizan este conjunto de datos estn siendo revisados por rbitros.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
QtyT40I10D100K Conjunto de datos
Resumen: Ya que no hay flujo de datos secuencial numrico disponible en los conjuntos de datos
estndar, este conjunto de datos se genera a partir del conjunto de datos original, T40I10D100K
Fuente:
Omid Shakeri, M.Sc
omid.shakeri '@' tmu.ac.ir; omid.shakeri '@' gmail.com
Laboratorio de minera de datos., Computadora Departamento de Ingeniera de la Universidad Kharazmi,
Karaj / Tehern, Irn
Atributo de la informacin:
CustomerID: el ID del cliente que ha realizado la transaccin (generado aleatoriamente [1 100])
Tiempo: el tiempo en que la transaccin se ha realizado
Transaccin: la operacin que se ha realizado
Cantidad: el valor de la cantidad de cada transaccin (generado al azar [1 10])
Documentos pertinentes:
Los trabajos que utilizan este conjunto de datos estn siendo revisados por rbitros.
Cuadrpedos mamferos Conjunto
de datos
Resumen: El animals.c archivo es un generador de datos de instancias
estructuradas que representan animales cuadrpedos
Fuente:
Origen:
Donante:
Las nicas notas que tengo al respecto es que yo no uso el formato de datos que crea ms. Para cambiar
esto, modificar "printpart ()". Tambin, se utiliza una aproximacin muy spera para una distribucin en
forma de campana. Actualmente, yo uso un generador de nmeros aleatorios mucho ms
sofisticado. Para solucionarlo, basta con sustituir "bellrand ()" con una distribucin en forma de campana
real.
Atributo de la informacin:
A. Ocho componentes por instancias / animal:
1. Cabeza
2. Cola
3. 4 patas
4. torso
5. cuello
B. Nueve atributos por componente:
1. Ubicacin 1
2. Ubicacin 2
3. Ubicacin 3
4. Eje 1
5. Eje 2
6. Eje 3
7. Altura
8. Radio
9. Textura
Fuente:
Ross D. King
Modelizacin Biomolecular Laboratorio
Imperial Cancer Research Fund
PO Box 123
Inn Fields 44 de Lincoln
Londres WC2A 3PX
Reino Unido
+44-71-242-0200 X3023
rd_king '@' icrf.ac.uk
Fuente:
Fuente de informacin
- Creador: Mr.A.Martin (jayamartin '@' yahoo.com)
Mr.J.Uthayakumar (uthayakumar17691 '@' gmail.com)
Mr.M.Nadarajan (nadaraj.muthuvel '@' gmail.com)
- Guided By: Dr.V.Prasanna Venkatesan
- Institucin: Sri Manakula Vinayagar Facultad de Ingeniera y la Universidad de Pondicherry
- Pas: India
- Fecha: febrero 2014
Atributo de la informacin:
Atributo Informacin: (P = Positivo, A-Normal, N-negativo, B-Bancarrota, NB-No-Quiebra)
Documentos pertinentes:
Los parmetros que hemos utilizado para la recogida del conjunto de datos se conoce a partir del
documento "El descubrimiento de reglas de decisin experts a partir de datos de bancarrota
cualitativos utilizando algoritmos genticos" por Myoung-Jong Kim *, Ingoo Han.
Fuente:
Los registros subyacentes se derivan del registro de cncer epidemiolgico de la
Estado alemn de Renania del Norte-Westfalia (NRW Epidemiologisches Krebsregister,
http://www.krebsregister.nrw.de ). Creacin de patrones de comparacin y
asignacin de estado de coincidencia se llevaron a cabo por miembros del personal de
el Instituto de Medicina Bioestadstica, Epidemiologa e Informtica (IMBEI)
en el Centro Mdico de la Universidad de la Universidad Johannes Gutenberg en Mainz,
Alemania ( http://www.imbei.uni-mainz.de ).
Este procedimiento dio lugar a 5.749.132 pares de registros, de los cuales 20.931 son partidos.
El acuerdo de los componentes del nombre se mide como un nmero real en el intervalo [0,1], donde 0
indica desacuerdo mxima y 1 la igualdad de los valores subyacentes. Para las dems comparaciones,
slo se utilizan los valores de 0 (no iguales) y 1 (igual).
is_match es la variable de resultado. id_1 y ID_2 no se utilizan para la prediccin, pero podra ser
utilizado para construir los componentes conectados de las coincidencias encontradas.
Documentos pertinentes:
1. Irene Schmidtmann, Gael Hammer, Murat Sariyar, Aslihan Gerhold-Ay:
Evaluacin des Krebsregisters NRW Schwerpunkt Record Vinculacin. Tcnico
Informe, IMBEI 2009.
[Web Link]
- Describe la evaluacin externa de la vinculacin de registros del Registro
procedimientos.
- Los patrones de comparacin en este conjunto de datos se crearon en el transcurso del
esta evaluacin.
Fuente:
F. Graf, H.-P. Kriegel, M. Schubert, S. Poelsterl, A. Cavallaro
Ludwig-Maximilians-Universitt de Mnich
Base de datos del Grupo de Sistemas
Oettingenstrae 67
80538 Munich, Alemania
Atributo de la informacin:
1. PatientID: Cada ID identifica un paciente diferente
2. - 241:. Histograma que describe estructuras seas
242. - 385:. Histograma que describe inclusiones de aire
386. Referencia: ubicacin relativa de la imagen en el eje axial (clase
valor). Los valores estn en el intervalo [0; 180], donde 0 denota
la parte superior de la cabeza y 180 las plantas de los pies.
Documentos pertinentes:
1. F. Graf, H.-P. Kriegel, M. Schubert, S. Poelsterl, A. Cavallaro
Registro de imgenes 2D en imgenes computarizadas que utilizan radiales Descriptores
Imagen
En Informtica de Imgenes Mdicas e Intervencin Asistida por Ordenador (MICCAI),
Toronto, Canada, 2011.
Fuente:
Creadores:
Rafael Ponce Medelln y Juan Gabriel Gonzlez Serna
rafaponce '@' cenidet.edu.mx, gabriel '@' cenidet.edu.mx
Departamento de Ciencias de la Computacin.
Centro Nacional para la Investigacin y el Desarrollo Tecnolgico CENIDET, M xico
Los donantes de la base de datos:
Blanca Vargas-Govea y Juan Gabriel Gonzlez Serna
blanca.vargas '@' cenidet.edu. mx / blanca.vg @ gmail.com, gabriel '@' cenidet.edu.mx
Departamento de Ciencias de la Computacin.
Centro Nacional para la Investigacin y el Desarrollo Tecnolgico CENIDET, M xico
Atributo de la informacin:
Los archivos, las instancias y atributos
Nmero de archivos: 9
Restaurantes
1 chefmozaccepts.csv
2 chefmozcuisine.csv
3 chefmozhours4.csv
4 chefmozparking.csv
5 geoplaces2.csv
Consumidores
6 usercuisine.csv
7 userpayment.csv
8 userprofile.csv
Usuario-Item-Clasificacin
9 rating_final.csv
1 chefmozaccepts.csv
Instancias: 1314
Atributos: 2
placeID: Nominal
Rpayment: Nominal, 12 [cash,VISA,MasterCard-
Eurocard,American_Express,bank_debit_cards,checks,Discover,Carte_Blanche,Diners_Club,Visa,Japan_
Credit_Bureau,gift_certificates]
2 chefmozcuisine.csv
Instancias: 916
Atributos: 2
placeID: Nominal
Rcuisine: Nominal,
59 [Afghan,African,American,Armenian,Asian,Bagels,Bakery,Bar,Bar_Pub_Brewery,Barbecue,Brazilian,Br
eakfast-Brunch,Burgers,Cafe-Coffee_Shop,
Cafeteria,California,Caribbean,Chinese,Contemporary,Continental-European,Deli-Sandwiches,Dessert-
Ice_Cream,Diner,Dutch-
Belgian,Eastern_European,Ethiopian,Family,Fast_Food,Fine_Dining,French,,Game,German,Greek,Hot_D
ogs,
International,Italian,Japanese,Juice,Korean,Latin_American,Mediterranean,Mexican,Mongolian,Organic-
Healthy,Persian,
Pizzeria,Polish,Regional,Seafood,Soup,Southern,Southwestern,Spanish,Steaks,Sushi,Thai,Turkish,Veget
arian,Vietnamese]
3 chefmozhours4.csv
Instancias: 2339
Atributos: 3
placeID: Nominal
hora:, Rango :00:00-23 nominal: 30
da: nominales, 7 [lun, mar, mi, jue, vie, sb, dom]
4 chefmozparking.csv
Instancias: 702
Atributos: 2
placeID: Nominal
parking_lot: Nominal, 7 [pblica, ninguno, s, valet_parking, libre, calle, validated_parking]
5 geoplaces2.csv
Instancias: 130
Atributos: 21
placeID: Nominal
latitud: Numrico
longitud: Numrico
the_geom_meter: Nominal (Geospatial)
Nombre: Nominal
Direccin: Nominal, Missing: 27
ciudad: Nominal, Missing: 18
Estado: Nominal, Missing: 18
pas: Nominal, Missing: 28
fax: Numrico, donde desapareci: 130
zip: Nominal, Missing: 74
alcohol: Nominal, Valores: 3 [No_Alcohol_Served, Wine_Beer, Full_Bar]
smoking_area: Nominal, 5 [ninguno, only_at_bar, permitido, seccin, not_permitted]
dress_code: Nominal, 3 [informal, casual, formal]
accesibilidad: Nominal, 3 [no_accessibility, por completo, parcialmente]
precio: Nominal, 3 [media, baja, alta]
url: Nominal, Missing: 116
Rambience: Nominal, 2 [familiar, tranquilo]
franquicia: Nominal, 2 [e, f]
rea: Nominal, 2 [abierto, cerrado]
other_services: Nominal, 3 [ninguno, internet, la variedad]
6 rating_final.csv
Instancias: 1161
Atributos: 5
ID de usuario: Nominal
placeID: Nominal
Evaluacin: Numrico, 3 [0,1,2]
food_rating: Numrico, 3 [0,1,2]
service_rating: Numrico, 3 [0,1,2]
7 usercuisine.csv
Instancias: 330
Atributos: 2
ID de usuario: Nominal
Rcuisine: nominal,
103 [Afghan,African,American,Armenian,Asian,Australian,Austrian,Bagels,Bakery,Bar,Bar_Pub_Brewery,
Barbecue,Basque,Brazilian,Breakfast-Brunch,British,Burgers,Burmese,Cafe-
Coffee_Shop,Cafeteria,Cajun-
Creole,California,Cambodian,Canadian,Caribbean,Chilean,Chinese,Contemporary,Continental-
European,Cuban,Deli-Sandwiches,Dessert-Ice_Cream,Dim_Sum,Diner,Doughnuts,Dutch-
Belgian,Eastern_European,Eclectic,Ethiopian,Family,Fast_Food,Filipino,Fine_Dining,French,Fusion,Gam
e,German,Greek,Hawaiian,Hot_Dogs,Hungarian,Indian-
Pakistani,Indigenous,Indonesian,International,Irish,Israeli,Italian,Jamaican,Japanese,Juice,Korean,Kosher
,Latin_American,Lebanese,Malaysian,Mediterranean,Mexican,Middle_Eastern,Mongolian,Moroccan,North
_African,Organic-
Healthy,Pacific_Northwest,Pacific_Rim,Persian,Peruvian,Pizzeria,Polish,Polynesian,Portuguese,Regional,
Romanian,Russian-
Ukrainian,Scandinavian,Seafood,Soup,Southeast_Asian,Southern,Southwestern,Spanish,Steaks,Sushi,S
wiss,Tapas,Tea_House,Tex-Mex,Thai,Tibetan,Tunisian,Turkish,Vegetarian,Vietnamese]
8 userpayment.csv
Instancias: 177
Atributos: 2
ID de usuario: Nominal
Upayment: Nominal, 5 [efectivo, bank_debit_cards, MasterCard, Eurocard, VISA, American_Express]
9 userprofile
Instancias: 138
Atributos: 19
ID de usuario: Nominal
latitud: Numrico
longitud: Numrico
the_geom_meter: Nominal (Geospatial)
Hbitos: Nominal, donde desapareci: 3, 2 [false, true]
drink_level: Nominal, 3 [abstemia, bebedor social, bebedor ocasional]
dress_preference: Nominal, donde desapareci: 5, 4 [informal, formal, sin preferencia, elegante]
ambiente: Nominal, donde desapareci: 6, 3 [de la familia, los amigos, solitario]
transporte: Nominal, donde desapareci: 7, 3 [a pie, pblico, propietario del vehculo]
estado_civil: Nominal, donde desapareci: 4, 3 [soltero, casado, viudo]
Hijos: Nominal, donde desapareci: 11, 3 [independientes, nios, dependiente]
birth_year: Nominal
inters: nominal, 5 [variedad, tecnologa, nadie, retro, respetuoso del medio ambiente]
personalidad: Nominal, 4 [ahorrativa-protector, cazador ostentoso, duro trabajador, conformista]
religin: Nominal, 5 [ninguno, catlica, cristiana, mormona, juda]
actividad: Nominal, donde desapareci: 7, 4 [estudiante, profesional, desempleados, la clase obrera]
color: Nominal, 8 [negro, rojo, azul, verde, morado, naranja, amarillo, blanco]
peso: Numrico
Presupuesto: Nominal, donde desapareci: 7, 3 [media, baja, alta]
altura: Numrico
Documentos pertinentes:
Blanca Vargas-Govea, Juan Gabriel Gonzlez-Serna, Rafael Ponce-Medelln. Efectos de las
caractersticas contextuales relevantes en el funcionamiento de un sistema de recomendacin de
restaurantes. En RecSys 11: Taller sobre Context Aware Sistemas de Recomendacin (CARS-
2011), Chicago, IL, EE.UU., 23 de octubre de 2011.
Reuters RCV1 RCV2 multilinge, Multiview
Categorizacin Texto coleccin de prueba de
conjunto de datos
Resumen: Esta coleccin de prueba contiene caractersticas funcionales que ofrece documentos
escritos originalmente en cinco idiomas diferentes y sus traducciones, sobre un conjunto comn de 6
categoras.
Fuente:
Massih-Reza Amini
Universit Joseph Fourier
Laboratoire d'Informatique de Grenoble
Email: Massih-Reza.Amini '@' imag.fr
Cyril Goutte
Consejo de Investigacin Nacional de Canad
Grupo de Tecnologa Interactiva Idioma
Email: Cyril.Goutte '@' nrc.ca
Cada archivo contiene un documento indexado por lnea, en un formato similar al SVM_light. Cada lnea
es de la forma: : : Donde ... es la etiqueta de categora, es decir, uno de C15, CCAT, E21, ECAT, GCAT o
M11. : es la caracterstica, par de valores, en orden ascendente del ndice de funcin.
Nmero de vocabulario
El tamao de los documentos de Idiomas porcentaje
**********************************************
Ingls 18.758 16,78 21.531
Francs 26.648 23,45 24.893
German 29.953 26,80 34.279
Italian 24.039 21,51 15.506
Espaol 12.342 11.46 11.547
-------
Total 111.740
En los experimentos que realizamos en cite {} Aug09, consideramos cada documento disponible en un
idioma determinado como la vista observada para un ejemplo y todos los documentos traducidos se
utilizaron como los otros puntos de vista para que el ejemplo, generado utilizando la traduccin
automtica. Los resultados mostrados en este estudio fueron en promedio ms de 10 muestras al azar de
10 ejemplos etiquetados por vista para la formacin, y el 20% de la coleccin para la prueba.
Documentos pertinentes:
Massih-Reza Amini, Nicolas Usunier y Cyril Goutte. Aprender de mltiples vistas parcialmente
observados - una aplicacin para que Categorizacin textos en varios idiomas. Los avances en los
sistemas neuronales de procesamiento de informacin 22, pp 28-36, 2009
Massih-Reza Amini y Cyril Goutte. Un enfoque de clasificacin para el aprendizaje a partir de corpus
multilinge. Aprendizaje Automtico Diario Springer, 79 (1-2) :105-121, 2010
Abhishek Kumar, Hal Dauma III. Un enfoque de co-formacin para mltiples vistas clustering
espectral. Conferencia Internacional sobre Aprendizaje Automtico, pp 393-400. 2011
Cita de pedidos:
Si publica los resultados sobre la base de este conjunto de datos, por favor, mencione su uso, al hacer
referencia a:
M.-R. Amini, N. Usunier, C. Goutte. Aprender de mltiples vistas parcialmente observados - una
aplicacin para que Categorizacin textos en varios idiomas. Los avances en los sistemas de
procesamiento de informacin neural 22, p. 28-36, 2009
Fuente:
Shourya Roy
shourya.roy '@' gmail.com
y
Shantanu Godbole
shantanu '@' godbole.net
Formato de datos:
----------
Hay 10 directorios etiquetados con el nombre del tema.
Cada uno contiene 20 archivos de transcripciones.
Referencias:
----------
[1] LR Bahl, S. Balakrishnan-Aiyer, J. Bellegarda, M. Franz,
P. Gopalakrishnan, D. Nahamoo, M. Novak, M. Padmanabhan,
M. Picheny y S. Roukos,
Rendimiento del vocabulario amplio sistema de reconocimiento de habla continua IBM en
la tarea Wall Street Journal ARPA.
En Proc. de ICASSP '95,
pginas 41-44, Detroit, MI, 1995.
[2] S. Agarwal, S. Godbole, D. Punjani y S. Roy,
Cunto ruido es demasiado: Un estudio en clasificacin automtica de texto ',
En Proc. de ICDM 2007
Atributo de la informacin:
Proporcionar informacin acerca de cada atributo del conjunto de datos.
Documentos pertinentes:
'"Cunto ruido en texto es demasiado: A Study in Clasificacin automtico de documentos", ICDM 2007,
Sumeet Agarwal, Shantanu Godbole, Diwakar Punjani y Shourya Roy
Fuente:
David D. Lewis
AT & T Labs. - Investigacin
lewis '@' research.att.com
En 1990, se pusieron a disposicin los documentos por Reuters y CGI con fines de investigacin en el
Laboratorio de Recuperacin de Informacin (W. Bruce Croft, Director) del Departamento de Informtica y
Ciencias de la Informacin en la Universidad de Massachusetts en Amherst. Formato de los documentos
y de la produccin de archivos de datos asociados se hizo en 1990 por David D. Lewis y Stephen Harding
en el Laboratorio de Recuperacin de la Informacin.
Adems el formato de archivo de datos y la produccin se hizo en 1991 y 1992 por David D. Lewis y
Peter Zapatero en el Centro de Estudios de Idiomas de la Informacin y de la Universidad de
Chicago. Esta versin de los datos se hizo disponible para FTP annimo como "Reuters-22173,
Distribucin 1.0" en enero de 1993. Desde 1993 hasta 1996, Distribucin 1.0 fue alojado en una sucesin
de sitios FTP que mantiene el Centro de Recuperacin de Informacin Inteligente (W. Bruce Croft,
Director) del Departamento de Ciencias de la Computacin en la Universidad de Massachusetts en
Amherst.
Steve Finch y David D. Lewis hizo esta limpieza de la coleccin de septiembre a noviembre de 1996, la
fuerte dependencia de la versin de etiquetado SGML de Finch de la coleccin de un estudio
anterior. Uno de los resultados de la revisin de la coleccin fue la eliminacin de 595 documentos que
eran rplicas exactas (basada en la identidad de las marcas de tiempo hasta el segundo) de otros
documentos de la coleccin. Por ello, la nueva coleccin tiene slo 21.578 documentos, y as se llama la
coleccin Reuters-21578. Este README describe la versin 1.0 de esta nueva coleccin, la cual nos
referimos como "Reuters-21578, Distribucin 1.0".
En la preparacin de la reunin y la documentacin que nos hemos beneficiado de las discusiones con
Eric Brown, William Cohen, Fred Damerau, Yoram Cantante, Amit Singhal, y Yiming Yang, entre muchos
otros.
Agradecemos a todas las personas y organizaciones que se enumeran ms arriba por su esfuerzo y
apoyo, sin el cual no existira esta coleccin.
Atributo de la informacin:
Reuters-21578, Distribucin 1.0 incluye cinco archivos (todos-los intercambios-strings.lc.txt, todo-orgs-
strings.lc.txt, de todo el pueblo-strings.lc.txt, todo-lugares-strings.lc.txt, y todo-temas-strings.lc.txt) que
enumeran los nombres de * todas las categoras legales * en cada juego. Un sexto archivo, cat-
descriptions_120396.txt da alguna informacin adicional sobre los conjuntos de categoras.
Documentos pertinentes:
Chidanand Apt, Fred Damerau, Sholom M. Weiss. "Automated Learning de Reglas de decisin para la
Categorizacin de texto." Transacciones de ACM en Sistemas de Informacin, 1994.
[Web Link]
Chidanand Apt, Fred Damerau, Sholom M. Weiss, "Hacia el aprendizaje de idiomas Automatizado
Independiente de modelos de categorizacin de texto." SIGIR 1994.
[Web Link]
Philip J. Hayes, Peggy M. Anderson, rene B. Nirenburg, Linda M. Schmandt. "TCS: A Shell para
contenido basado en texto Categorizacin". IEEE Conferencia sobre Aplicaciones de Inteligencia Artificial,
1990.
[Web Link]
Philip J. Hayes y Steven P. Weinstein. "Interpretar / TIS: Un sistema para contenido basado en la
indizacin de una base de datos de News Stories". Segunda Conferencia Anual de Aplicaciones
innovadoras de la Inteligencia Artificial, 1990.
[Web Link]
. Manuel Oliveira Biblioteca Release Form Nombre del Autor: Stanley Robson de Oliveira Medeiros Ttulo
de la tesis: transformacin de datos para la privacidad-Preservar Data Mining Titulacin: Doctor en
Filosofa Ao este ttulo otorgado . Universidad de Alberta Library. 2005. [ Ver Contexto ].
David Littau y Daniel Boley. Usando poca memoria Representaciones con el clster conjuntos muy
grandes de datos . SDM. 2003. [ Ver Contexto ].
Vijay S. Iyengar y Chidanand Apt y Tong Zhang. aprendizaje activo utilizando remuestreo
adaptativo . KDD. 2000. [ Ver Contexto ].
Dmitry Pavlov y Jianchang Mao y Byron Dom. Mquinas de Vectores Soporte Scaling-Up Uso Impulsar
Algoritmo . ICPR. 2000. [ Ver Contexto ].
Daphne Koller y Mehran Sahami. Hacia ptima Seleccin de caractersticas . ICML. 1996. [ Ver
Contexto ].
. Omid Madani y David M. Pennock y Gary William Flake Co-validacin: El uso de modelos Desacuerdo
para validar algoritmos de clasificacin . Yahoo! Research Labs. [Ver Contexto ].
Cita de pedidos:
El copyright del texto de los artculos de noticias y anotaciones de Reuters en la coleccin Reuters-21578
reside con Reuters Ltd. Reuters Ltd. y Carnegie Group, Inc. han acordado permitir la distribucin gratuita
de estos datos para fines de investigacin * solamente *.
Si publica los resultados sobre la base de este conjunto de datos, por favor, mencione su uso, consulte el
conjunto de datos con el nombre "Reuters-21578, Distribucin 1.0", e informar a sus lectores de la
ubicacin actual del conjunto de datos (vase "Disponibilidad y Preguntas ").
Fuente:
Creador de conjunto de datos y donante: ZhiLiu, e-mail: liuzhi8673 '@' gmail.com, institucin: Centro de
Investigacin de Ingeniera Nacional de E-Learning de Hubei, Wuhan, China
Atributo de la informacin:
Los atributos del conjunto de datos son de carcter n-gramas (n = 1-5)
Documentos pertinentes:
J. Houvardas, E. Stamatatos, Feature Oen-grama de seleccin para la autora de identificacin,
en Proc. de la 12 Int.. Conf. sobre Inteligencia Artificial: Metodologa, Sistemas, Aplicaciones, vol. 4183,
pp.77-86, (2006) 12-15 septiembre; Varna, Bulgaria.
E. Stamatatos, Author identificacin Usando desequilibrada y Limited Textos de capacitacin,
En Proc. del 4 Taller Internacional sobre Recuperacin de Informacin basado en texto, (2007) 3 a 7
septiembre; Regensburg, Alemania.
Fuente:
Propietario original y de los donantes:
Atributo de la informacin:
Todas las caractersticas son numricos, aunque se entero valoran solamente. Cada caracterstica
representa una fuerza o un par medido despus de la deteccin de fallos; cada caso de fallo se
caracteriza en trminos de muestras 15 fuerza / par recogidos a intervalos de tiempo regulares
comenzando inmediatamente despus de la deteccin de fallos; La ventana de observacin total para
cada instancia de fracaso fue de 315 ms.
clase
Fx1 Fy1 Fz1 Tx1 Ty1 TZ1
Fx2 Fy2 FZ2 Tx2 Ty2 tz2
......
FX15 FY15 FZ15 TX15 Ty15 TZ15
donde Fx1 ... FX15 es la evolucin de la fuerza Fx en la ventana de observacin, lo mismo para Fy, Fz y
los pares; hay un total de 90 funciones.
Documentos pertinentes:
Seabra Lopes, L. (1997) "El aprendizaje del robot en el nivel de tarea: un estudio en el dominio de la
Asamblea", Ph.D. tesis, Universidade Nova de Lisboa, Portugal.
[Web Link]
Fuente:
Autores: Michael McCann, Adrian Johnston
Para mejorar las tcnicas de mejora de negocio actuales se est investigando la aplicacin de seleccin
de caractersticas como tcnica de sistemas inteligentes.
El conjunto de datos presentados en este caso representa una seleccin de estas caractersticas, donde
cada ejemplo representa una sola entidad de produccin con caractersticas asociadas medida y las
etiquetas de representar una sencilla rendimiento pasa / no pasa en las pruebas internas de lnea, figura
2, y la fecha asociada sello de tiempo. Dnde -1 corresponde a un paso y 1 corresponde a un error y el
sello de tiempo de datos es para ese punto especfico de examen.
Los resultados pueden ser presentados en trminos de relevancia para la funcin de la previsibilidad
utilizando las tasas de error como nuestras mtricas de evaluacin.Se sugiere que se aplique la
validacin cruzada para generar estos resultados. Algunos resultados de referencia se muestran a
continuacin para las tcnicas bsicas de seleccin de caractersticas utilizando un sencillo clasificador
cresta ncleo y 10 veces la validacin cruzada.
Atributo de la informacin:
Datos clave: Estructura de datos: Los datos se compone de 2 archivos de la SECOM archivo de conjunto
de datos que consta de 1.567 ejemplos, cada uno con 591 cuenta con una matriz de 1567 x 591 y un
archivo que contiene las etiquetas de las clasificaciones y fecha de sello de tiempo para cada ejemplo.
Al igual que en cualquier situacin de la vida real de datos de estos datos contiene valores nulos que
varan en intensidad dependiendo de las caractersticas de los individuos. Esto debe ser tenido en cuenta
en la investigacin de los datos, ya sea a travs de pre-procesamiento o dentro de la tcnica aplicada.
Los datos se representan en un archivo de texto sin formato de cada lnea representa un ejemplo
individual y las caractersticas separados por espacios. Los valores nulos son representados por el valor
de "NaN" segn MatLab.
Fuente:
Maa, gorzata Charytanowicz, Jerzy Niewczas
Instituto de Matemticas y Ciencias de la Computacin,
La Universidad Catlica Juan Pablo II de Lublin, Konstantyn w 1 H,
PL 20-708 Lublin, Polonia
e-mail: {mchmat, jniewczas} @ kul.lublin.pl
El conjunto de datos se puede utilizar para las tareas de clasificacin y anlisis de conglomerados.
Atributo de la informacin:
Para construir los datos, se midieron siete parmetros geomtricos de los granos de trigo:
1. rea A,
2. permetro P,
3. compacidad C = 4 * pi * A / P ^ 2,
4. longitud del ncleo,
5. anchura del ncleo,
6. coeficiente de asimetra
7. la longitud de la ranura del ncleo.
Todos estos parmetros eran reales-valorado continuo.
Documentos pertinentes:
M. Charytanowicz, J. Niewczas, P. Kulczycki, PA Kowalski, S. Lukasik, S. Zak, "un algoritmo de
agrupamiento Gradient completo para funciones de anlisis de imgenes de rayos X", en: Tecnologas de
la Informacin en Biomedicina, Ewa Pietka, Jacek Kawa (eds.), Springer-Verlag, Berlin-Heidelberg, 2010,
pp 15-24.
Cita de pedidos:
Colaboradores agradecen el apoyo de su trabajo por el Instituto de Agrophysics de la Academia Polaca
de Ciencias en Lublin.
ssmicas de gallina Data Set
Resumen: Los datos describen el problema de la alta energa (mayor que 10 ^ 4 J) golpes ssmicos
previsin en una mina de carbn. Los datos provienen de dos de tajos largos situados en una mina de
carbn de Polonia.
Fuente:
Proporcionar los nombres, direcciones de correo electrnico, las instituciones, y otra informacin de
contacto de los donantes y los creadores de la serie de datos.
Marek Sikora ^ {1,2} (marek.sikora '@' polsl.pl), Lukasz Wrobel ^ {1} (lukasz.wrobel '@' polsl.pl)
(1) Instituto de Ciencias de la Computacin, Universidad Tecnolgica de Silesia, 44-100 Gliwice, Polonia
(2) Instituto de Innovative Technologies EMAG, 40-189 Katowice, Polonia
Atributo de la informacin:
Atributo informacin:
1. ssmica: resultado del cambio de la evaluacin del peligro ssmico en la mina de trabajo obtenido por la
ssmica
mtodo (a - la falta de peligro, b - peligro bajo, c - alta peligrosidad, d - estado de peligro);
2. seismoacoustic: resultado del cambio de la evaluacin del peligro ssmico en la mina de trabajo
obtenido por el
mtodo seismoacoustic;
3. Turno: informacin sobre el tipo de cambio (W - carbn-que consigue, cambio de N-preparacin);
4. Genergy: energa ssmica registrada en turno anterior por el gefono ms activo (GMax) de
gefonos monitoreo del tajo largo;
5. gpuls: un nmero de impulsos registrados en turno anterior por GMax;
6. gdenergy: una desviacin de la energa registrada en turno anterior por GMax de energa promedio
registrado
durante ocho turnos anteriores;
7. gdpuls: una desviacin de un nmero de impulsos registrados dentro de turno anterior por GMax de
nmero promedio
de pulsos registrados durante ocho cambios anteriores;
8. ghazard: resultado del cambio de la evaluacin del peligro ssmico en la mina de trabajo obtenido por
el
mtodo seismoacoustic basado en formulario de inscripcin que viene slo GMax;
9. nbumps: el nmero de golpes ssmicos registrados en turno anterior;
10. nbumps2: el nmero de golpes ssmicos (en el rango de energa [10 ^ 2,10 ^ 3)) registrado en turno
anterior;
11. nbumps3: el nmero de golpes ssmicos (en el rango de energa [10 ^ 3,10 ^ 4)) registrado en turno
anterior;
12. nbumps4: el nmero de golpes ssmicos (en el rango de energa [10 ^ 4,10 ^ 5)) registrado en turno
anterior;
13. nbumps5: el nmero de golpes ssmicos (en el rango de energa [10 ^ 5,10 ^ 6)) registrada en el
ltimo turno;
14. nbumps6: el nmero de golpes ssmicos (en el rango de energa [10 ^ 6,10 ^ 7)) registrado en turno
anterior;
15. nbumps7: el nmero de golpes ssmicos (en el rango de energa [10 ^ 7,10 ^ 8)) registrado en turno
anterior;
16. nbumps89: el nmero de golpes ssmicos (en el rango de energa [10 ^ 8,10 ^ 10)) registrado en turno
anterior;
17. energa: la energa total de golpes ssmicos registrados en turno anterior;
18. maxenergy: la energa mxima de los golpes ssmicos registrados en turno anterior;
19. clase: el atributo de decisin - '1 'significa que la alta energa golpe ssmico se produjo en el siguiente
turno
("Estado peligroso"), '0 'significa que no hay golpes ssmicos de alta energa se produjeron en el siguiente
turno
("Estado no peligrosos).
Cita de pedidos:
Solicitud de cita
Sikora M., Wrobel L.: La aplicacin de algoritmos de induccin de reglas para el anlisis de los datos
recogidos por ssmica
sistemas de vigilancia de los peligros de las minas de carbn. Archivos de Ciencias de la Minera, 55 (1),
2010, 91-114.
Semeion Digit manuscritas de la serie de
datos
Resumen: 1.593 dgitos escritos a mano de alrededor de 80 personas fueron escaneados, se
extenda en una caja rectangular de 16x16 en una escala de grises de 256 valores.
Fuente:
El conjunto de datos fue creada por Tactile Srl, Brescia, Italia ( http://www.tattile.it ) y don en 1994 al
Centro de Investigacin Semeion de Ciencias de la Comunicacin, Roma, Italia ( http://www.semeion.it ),
para la investigacin de aprendizaje automtico.
Para cualquier duda, e-mail Massimo Buscema (m.buscema '@' semeion.it) o Stefano
Terzi (s.terzi '@' semeion.it)
Cada persona escribe en un papel todos los dgitos del 0 al 9, en dos ocasiones. El compromiso era
escribir el dgito de la primera vez en la forma normal (intentar escribir cada dgito con precisin) y el
segundo tiempo de una manera rpida (con ninguna precisin).
El mejor protocolo de validacin para este conjunto de datos parece ser un 5x2CV, 50% Tune (Tren +
Test) y completamente ciego 50% Validacin
Atributo de la informacin:
Este conjunto de datos consta de 1593 registros (filas) y 256 atributos (columnas).
Cada registro representa un dgito manuscrito, originalmente digitalizada con una resolucin de 256
escala de grises (28).
Cada pxel de la imagen de cada original escaneado se estir primero, y despus a escala entre 0 y 1
(puesta a 0 todos los pxeles cuyo valor estaba bajo tha valor 127 de la escala de grises (127 incluido) y
ajustando en 1 cada pxel cuyo valor orinal en la escala de grises estaba sobre 127).
Por ltimo, cada imagen binaria se redujo de nuevo en una caja cuadrada de 16x16 (los ltimos 256
atributos binarios).
Documentos pertinentes:
M Buscema, Metanet: La Teora de jueces independientes, en el uso de sustancias y mal uso 33 (2)
1998, pp 439-461.
Cita de pedidos:
Centro de Investigacin Semeion de Ciencias de la Comunicacin, a travs de Sersale 117, 00128 Roma,
Italia
Tattile Via Gaetano Donizetti, 1-3-5,25030 Mairano (Brescia), Italia.
Fuente:
- Creadores: Hamdi Tolga Kahraman, Ilhami Colak, Seref Sagiroglu
- Institucin: Facultad de Tecnologa, Departamento de Ingeniera de Software de la Universidad Tcnica
de Karadeniz, Trabzon, Turkiye
- Donantes: Estudiantes del Departamento de Educacin Elctrica de la Universidad de Gazi
- Fecha: octubre de 2009
Kahraman, HT (2009). Diseo y Aplicacin de la adaptacin del Sistema Educativo Inteligente basado en
Web. Universidad Gazi Tesis Doctoral, Turqua, 1-156.
Kahraman, HT, Sagiroglu, S., Colak, I., Desarrollo clasificador conocimiento intuitivo y el modelado de
datos dependientes de dominio de los usuarios en la web,
Sistemas basados en el conocimiento, vol. 37, pp 283-295, 2013.
Kahraman, HT (2009). Diseo y Aplicacin de la adaptacin del Sistema Educativo Inteligente basado en
Web. Universidad Gazi Tesis Doctoral, Turqua, 1-156.
Atributo de la informacin:
STG (El grado de tiempo de estudio para materails objeto gol), (valor de entrada)
SCG (El grado de repeticin de nmero de usuario para materails objeto meta) (valor de entrada)
STR (El grado de tiempo de estudio de usuario para los objetos relacionados con el objeto meta) (valor
de entrada)
LPR (El rendimiento en los exmenes de usuario para los objetos relacionados con el objeto meta) (valor
de entrada)
PEG (El rendimiento en los exmenes de usuario para los objetos meta) (valor de entrada)
UNS (el nivel de conocimiento del usuario) (valor objetivo)
Documentos pertinentes:
Kahraman, HT, Sagiroglu, S., Colak, I., Desarrollo clasificador conocimiento intuitivo y el modelado de
datos dependientes de dominio de los usuarios en la web,
Sistemas basados en el conocimiento, vol. 37, pp 283-295, 2013.
Cita de pedidos:
NOTA: La reutilizacin de esta base de datos es ilimitada con la citacin para
Dr. Hamdi Tolga KAHRAMAN y et. otros, el siguiente artculo publicado:
Kahraman, HT, Sagiroglu, S., Colak, I., Desarrollo clasificador conocimiento intuitivo y el modelado de
datos dependientes de dominio de los usuarios en la web,
Sistemas basados en el conocimiento, vol. 37, pp 283-295, 2013.
Fuente:
Creador:
Donante:
Ross Quinlan
Esta informacin fue dada a m por Karl Ulrich en el MIT en 1986. Yo no grabo su descripcin en el
momento, pero aqu est su posterior (1992) recuerdo:
"Creo recordar que los datos eran de una simulacin de un sistema servo implica un servoamplificador,
un motor, un tornillo de avance / tuerca, y un carro deslizante de algn tipo. Puede haber sido el de los
ejes de traslacin de un robot en el noveno piso del laboratorio de IA. En cualquier caso, el valor de
salida es casi seguro que un tiempo de subida, o el tiempo necesario para que el sistema responda a un
cambio de paso en un punto de referencia de la posicin ".
(Quinlan, ML'93)
"Se trata de una interesante coleccin de los datos proporcionados por Karl Ulrich Cubre un fenmeno
extremadamente no lineal -. Predecir el tiempo de subida de un servomecanismo en trminos de dos
ajustes (continuos) de ganancia y dos (discretas) opciones de conexiones mecnicas."
Atributo de la informacin:
1. del motor: A, B, C, D, E
2. tornillo: A, B, C, D, E
3. PGain: 3,4,5,6
4. vgain: 1,2,3,4,5
5. clase: 0,13-7,10
Documentos pertinentes:
Quinlan, JR, "Aprender con clases continuas", Proc. 5 Conferencia Conjunta de Australia el AI (eds A.
Adams y L. Sterling), Singapore: World Scientific, 1992
[Web Link]
Quinlan, JR, "La combinacin de aprendizaje y basado en modelos basados en instancia", Proc. ML'93
(ed. PE Utgoff), San Mateo: Morgan Kaufmann 1993
[Web Link]
Shuttle Landing Configuracin de
Control de Datos
Resumen: base de datos de Tiny; todos los valores nominales
Fuente:
Fuente original:
desconocido
NASA: equipo de diseo autolander del Sr. Roger Burke
Donante:
Bojan Cestnik
Jozef Stefan Institute
Jamova 39
61000 Ljubljana
Yugoslavia (tel.: (38) (61) 214-399 ext.287)
Atributo de la informacin:
1. Clase: noauto, auto
- Es decir, aconsejar el uso de control manual / automtico
2. ESTABILIDAD: pualada, xstab
3. ERROR: XL, LX, MM, SS
4. SIGN: pp, nn
5. VIENTO: cabeza, cola
6. MAGNITUD: Bajo, Medio, Fuerte, OutOfRange
7. VISIBILIDAD: s, no
Documentos pertinentes:
Michie, D. (1988). Gap Unbridged del Quinta Generacin. En Rolf Herken (Ed.) La mquina universal de
Turing: A mitad del siglo Survey, 466-489, Oxford University Press.
Fuente:
- Creadores: Mark Blair, Joe Thompson, Andrew Henrey, Bill Chen
- Marcos Blair: Departamento de Psicologa; Simon Fraser University; Burnaby;
8888 University Drive; mblair '@' sfu.ca)
- Fecha: Septiembre 20, 2013
Atributo de la informacin:
1. GameID: nmero de identificacin nico para cada juego (entero)
2. LeagueIndex: Bronce, Plata, Oro, Platino, Diamante, Maestro, el Gran Maestro, y las ligas
profesionales codificado 1-8 (ordinal)
3. Edad: Edad de cada jugador (entero)
4. HoursPerWeek: Reportado horas dedicado a jugar a la semana (entero)
5. Totalhours: Notificado el total de horas dedicado a jugar (entero)
6. APM: Accin por minuto (continua)
7. SelectByHotkeys: Nmero de unidad o edificio selecciones hechas usando teclas de acceso rpido por
marca de tiempo (continuo)
8. AssignToHotkeys: Nmero de unidades o edificios asignados a teclas de acceso rpido por marca de
tiempo (continuo)
9. UniqueHotkeys: Nmero de teclas de acceso rpido nicos utilizados por marca de tiempo (continuo)
10. MinimapAttacks: Nmero de acciones de ataque sobre el minimapa por marca de tiempo (continuo)
11. MinimapRightClicks: nmero de clic derecho en el minimapa por marca de tiempo (continuo)
12. NumberOfPACs: Nmero de PACs por marca de tiempo (continuo)
13. GapBetweenPACs: La duracin media en milisegundos entre PACs (continua)
14. ActionLatency: latencia promedio desde el inicio de un PACS a su primera accin en milisegundos
(continua)
15. ActionsInPAC: La media de nmero de acciones dentro de cada PAC (continua)
16. TotalMapExplored: El nmero de juego de 24x24 cuadrculas de coordenadas vistos por el jugador
por marca de tiempo (continuo)
17. WorkersMade: Nmero de SCV, aviones teledirigidos, y sondas entrenados por marca de tiempo
(continuo)
18. UniqueUnitsMade: une nicas hechas por marca de tiempo (continuo)
19. ComplexUnitsMade: Nmero de fantasmas, Infestors y altos templarios entrenados por marca de
tiempo (continuo)
20. ComplexAbilitiesUsed: Capacidades que requieran instrucciones de focalizacin especficos utilizados
por marca de tiempo (continuo)
Documentos pertinentes:
1. Thompson JJ, Blair MR, Chen L, Henrey AJ (2013) Videojuego de telemetra como una herramienta
fundamental en el estudio del aprendizaje Habilidad Complex. PLoS ONE 8 (9):. E75129 [Web Link]
- Resultados:
- Liga Saltar clasificacin forestal inferencia condicional (Bronce-Gold, Silver-Platino, Oro-Diamond,
Platinum-Masters; Diamond-Profesional) mostraron cambios en los patrones de importancia variable con
habilidad.
- Atributo del preparado: Liga (ordinal)
Cita de pedidos:
Usted es libre de copiar, distribuir y comunicar pblicamente esta obra bajo las siguientes condiciones:
Deben conceder la atribucin de la obra (pero no de una manera que sugiere que el autor que usted o su
uso de la obra refrenda); Usted no puede utilizar esta obra para fines comerciales; No se puede alterar,
transformar o ampliar este trabajo. Cualquier uso adicionales requieren el permiso del titular de los
derechos (o el autor si no titular de los derechos est en la lista). Estos derechos se basan en el
reconocimiento-NoComercial-NoDerivatives licencia de Creative Commons.
Fuente:
Rajen Bhatt, Abhinav Dhall, rajen.bhatt '@' gmail.com, IIT Delhi.
Atributo de la informacin:
Este conjunto de datos es de la dimensin 245057 * 4, donde las tres primeras columnas son los valores
B, G, R (x1, x2, x3 y caractersticas) y la cuarta columna es una de las etiquetas de clase (variable de
decisin y).
Documentos pertinentes:
1. Rajen B. Bhatt, Gaurav Sharma, Abhinav Dhall, Santanu Chaudhury, Efficient regin de la piel
mediante la segmentacin de baja complejidad borrosa rbol de decisin MODELA , IEEE-Indicon 2009,
16 al 18 diciembre, Ahmedabad, India, pp 1-4.
2. Abhinav Dhall, Gaurav Sharma, Rajen Bhatt, Ghulam Mohiuddin Khan, Adaptive digital Makeup
, en Proc. del Simposio Internacional de Computacin Visual (ISVC) 2009, 30 de noviembre "02 de
diciembre de Las Vegas, Nevada, EE.UU., Lecture Notes in Computer Science, vol. 5876, pp 728-736.
Multivariante,
Conjunto de datos Nmero de
Secuencial, Time- 4137 rea: Ordenador
Caractersticas: instancias:
Series, Texto
Nmero de
Valores
Tareas asociadas: Regresin S Web 5001
perdidos?
Accesos:
Fuente:
Dr. Francisco Zamora-Martnez, Pablo Romeu-Guallart, el Dr. Juan Pardo.
francisco.zamora "@" uch.ceu.es
Sistemas Embebidos y de Inteligencia Artificial (ESAI) grupo de investigacin
Dep. de Ciencias Fsicas, Matema ticas y de la Computacin n
Universidad CEU Cardenal Herrera
Atributo de la informacin:
Los atributos son:
1. Fecha: UTC.
2. Tiempo: UTC.
3. Temperatura interior (sala-comedor), en C.
4. Temperatura interior (habitacin), en C.
5. Tiempo temperatura pronstico, en A C.
6. El dixido de carbono en ppm (comedor).
7. El dixido de carbono en ppm (habitacin).
8. Humedad relativa (comedor), en%.
9. Humedad relativa (habitacin), en%.
10. Iluminacin (comedor), en Lux.
11. Iluminacin (habitacin), en Lux.
12. La lluvia, la proporcin de los ltimos 15 minutos donde se detect la lluvia (un valor en el rango
[0,1]).
13. Atardecer dom.
14. Viento, en m / s.
15. La luz del sol en la fachada oeste, en Lux.
16. La luz del sol en el este de la fachada, en Lux.
17. La luz del sol en la fachada sur, en Lux.
18. Sun irradiancia en W/m2.
19. Entlpico motor 1, 0 o 1 (on-off).
20. Motor entlpico 2, 0 o 1 (on-off).
21. Turbo motor entlpico, 0 o 1 (on-off).
22. Temperatura exterior, en A C.
23. Humedad relativa en el exterior, en%.
24. Da de la semana (calculado a partir de la fecha), 1 = lunes, 7 = Domingo.
SMS Spam Coleccin de conjunto de datos
Resumen: El spam Coleccin SMS es un sistema pblico de mensajes SMS marcados que se han
recogido para la investigacin de spam mvil.
Fuente:
Tiago A. Almeida (talmeida ufscar.br)
Departamento de Ciencias de la Computacin
Universidad Federal de Sao Carlos (UFSCar)
Sorocaba, Sao Paulo - Brasil
-> Una coleccin de 425 mensajes de spam de SMS se extrajo manualmente desde el sitio Web
Grumbletext. Este es un foro de Reino Unido en la que los usuarios de telfonos celulares hacen
declaraciones pblicas acerca de los mensajes de spam de SMS, la mayora de ellos sin reportar el
mensaje muy Spam recibidas. La identificacin del texto de los mensajes de spam en las reivindicaciones
es una tarea muy difcil y requiere mucho tiempo, y se trataba con cuidado escanear cientos de pginas
web. El sitio Web es Grumbletext: [Web Link] .
-> Un subconjunto de 3.375 SMS elegido al azar mensajes de jamn de la NUS SMS Corpus (NSC), que
es un conjunto de datos de cerca de 10.000 mensajes legtimos recogidos para la investigacin en el
Departamento de Ciencias de la Computacin en la Universidad Nacional de Singapur. Los mensajes se
originan en gran parte de los habitantes de Singapur, y la mayora de los estudiantes que asisten a la
Universidad. Estos mensajes fueron recogidos de los voluntarios que se hicieron conscientes de que sus
contribuciones iban a ser puestos a disposicin del pblico. El NUS SMS Corpus similares Libre en: [Web
Link] .
- A lista de 450 mensajes SMS jamn recogidos de la tesis doctoral de Caroline Tag disponible en [Web
Link] .
-> Por ltimo, hemos incorporado el SMS Spam Corpus v.0.1 Grande. Cuenta con 1.002 mensajes SMS
de jamn y 322 mensajes de spam y es pblico disponible en:[Web Link] . Este corpus se ha utilizado en
las siguientes investigaciones acadmicas:
[1] Gmez Hidalgo, JM, Cajigas Bringas, G., Puertas Sanz, E. Carrero Garca, SMS F. Content Based
filtrado de spam. Actas del Simposio ACM 2006 en Ingeniera de documentos (ACM DOCENG'06),
Amsterdam, Pases Bajos, 10-13, 2006.
[2] Cormack, GV, Gmez Hidalgo, JM, y Puertas S nz, E. Caracterstica de ingeniera para (SMS) de
filtrado de spam mvil. Actas de la 30 Conferencia Anual Internacional ACM sobre Investigacin y
Desarrollo en Recuperacin de Informacin (ACM SIGIR'07), Nueva York, NY, 871-872, 2007.
[3] Cormack, GV, Gmez Hidalgo, JM, y Puertas S nz, filtrado de spam E. para los mensajes
cortos. Actas de la 16 Conferencia ACM sobre la Informacin y la Gestin del Conocimiento (ACM
CIKM'07). Lisboa, Portugal, 313-320, 2007.
Atributo de la informacin:
La coleccin est compuesta por un solo archivo de texto, donde cada lnea tiene la clase correcta
seguido del mensaje de crudo. Ofrecemos algunos ejemplos a continuacin:
Documentos pertinentes:
Ofrecemos un amplio estudio de este corpus en el siguiente documento. Este trabajo presenta una serie
de estadsticas, estudios y resultados de lnea de base para varios mtodos de aprendizaje automtico.
Almeida, TA, Gmez Hidalgo, JM, Yamakami, A. Contribuciones al estudio de los SMS Spam Filtrado:
Nueva Coleccin y Resultados. Actas de la ACM Symposium 2011 en Ingeniera de documentos
(DOCENG'11), Mountain View, CA, EE.UU., 2011.
Fuente:
Donante:
- La base de datos consta de 3 clases posibles, una para el nmero de veces que un determinado tipo de
erupcin solar se produjo en un perodo de 24 horas.
- Cada instancia representa caractersticas capturadas durante 1 regin activa en el sol.
- Los datos se dividen en dos secciones. La segunda seccin (flare.data2) ha tenido mucho ms la
correccin de error aplicada a la que, en consecuencia, se ha tratado como ms fiables.
Atributo de la informacin:
1. Cdigo para la clase (clase Zurich modificada) (A, B, C, D, E, F, H)
2. Cdigo para el mayor tamao de punto (X, R, S, A, H, K)
3. Cdigo para la distribucin puntual (X, O, I, C)
4. Actividad (1 = reducida, 2 = sin cambios)
5. Evolucin (1 = decaimiento, 2 = sin crecimiento, 3 = crecimiento)
6. Anterior 24 horas cdigo de actividad de la antorcha (1 = nada tan grande como un M1, 2 = un M1, 3 =
ms actividad que uno M1)
7. Histricamente complejo (1 = S, 2 = No)
8. Hizo regin se convierta histricamente compleja en este paso a travs del disco solar (1 = s, 2 = no)
9. Superficie (1 = pequeo, 2 = grande)
10. rea de la mancha ms grande (1 = <= 5, 2 => 5)
De todos estos predictores tres clases de bengalas se predicen, que estn representados en las tres
ltimas columnas.
11. Llamaradas de clase C la produccin en esta regin en las 24 horas siguientes (brotes
comunes); Nmero
12. Llamaradas de clase M de produccin en esta regin en las 24 horas siguientes (brotes
moderados); Nmero
13. Llamaradas de clase X de produccin en esta regin en las siguientes 24 horas (brotes
graves); Nmero
Documentos pertinentes:
N/A
Jinyan Li y Guozhu Dong y Kotagiri Ramamohanarao. Clasificacin basada en instancia por los patrones
emergentes . PKDD. 2000. [ Ver Contexto ].
Sally A. Goldman y Yan Zhou. Mejora de aprendizaje supervisado con datos sin
etiqueta . ICML. 2000. [ Ver Contexto ].
Nir Friedman y Daphne Koller. Ser bayesiano sobre Estructura de red . UAI. 2000. [ Ver Contexto ].
. C. Tito Brown y Harry W. Bullen y Sean P. Kelly y Robert K. Xiao y Steven G. Satterfield y John G.
Hagedorn y Judith E. Devaney Visualizacin y Minera de Datos en un inmersivo entorno 3D: Proyecto de
Verano 2003 . [ Ver Contexto ].
Nir Friedman y Daphne Koller (Koller @ cs. Stanford. Edu. Un enfoque bayesiano para Estructurar
Discovery en redes bayesianas . Facultad de Ciencias de la Computacin y de Ingeniera Universidad
Hebrea. [ Ver Contexto ].
Fuente:
Origen:
RS Michalski y RL Chilausky
"Aprender de que nos dijeron y Aprender de ejemplos: Una Comparacin experimental de los Mtodos
Dos de Adquisicin de Conocimiento en el contexto del desarrollo de un sistema experto para la
enfermedad de la soja Diagnstico",
Revista Internacional de Anlisis de Polticas y Sistemas de Informacin, vol. 4, N 2, 1980.
Donante:
Atributo de la informacin:
- 19 clases
Diaporthe-tallo-cancro, carbn-rot, rhizoctonia-root-rot,
phytophthora-rot, marrn-madre-rot, polvo-moho,
velloso-moho, marrn terreno, bacteriana-tizn,
bacteriana-pstula, prpura de la semilla-la mancha, la antracnosis,
Phyllosticta hojas terreno, alternarialeaf terreno,
-ojo de rana hoja terreno, Diaporthe-pod-&-tallo-tizn,
quiste-nematodo, 2-4-D-lesin, los herbicidas de la lesin.
Documentos pertinentes:
Tan, M., y Eshelman, L. (1988). El uso de redes ponderados para representar el conocimiento
clasificacin en dominios ruidosos. Actas de la Quinta Conferencia Internacional sobre Aprendizaje
Automtico (pp. 121-134). Ann Arbor, Michigan: Morgan Kaufmann.
[Web Link]
Fuente:
Origen:
Michalski, RS
El aprendizaje por ser dicho y el aprendizaje a partir de ejemplos: una comparacin experimental de los
dos metodos de adquisicin de conocimientos en el contexto del desarrollo de un sistema experto para
diagnoiss desease soja ",
Revista Internacional de Anlisis de Polticas y Sistemas de Informacin, 1980, 4 (2), 125-161.
Donante:
Yo no tengo ese papel, pero he encontrado lo que probablemente es una variacin ms tarde de esa cifra
en la disertacin de Stepp, que muestra el valor "normal" para los primeros 2 clases y "irrelevante" para
los ltimos 2 clases. Creo que "irrelevante" se utiliza aqu como sinnimo de "no-aplicable", "dna", y "no-
no-se aplican". Yo creo que hay una impresin errnea en la figura que ley en su artculo PAMI-83.
He comprobado sobre cada valor del atributo en esta base de datos. Esto corresponde exactamente a los
ejemplares que figuran en las tesis tanto de Stepp y Fisher de.
Atributo de la informacin:
1. Fecha: abril, mayo, junio, julio, agosto, septiembre, octubre,?.
2. planta de stand: normal,-lt normal?.
3. precipitacin: lt-norma, norma, gt-norma,?.
4. temp: lt-norma, norma, gt-norma,?.
5. granizo: s, no,?.
6. crop-hist:-diff-lst aos, mismo lst-ao, del mismo lst y dos aos,
misma-lst-sev-aos,?.
7. dispersas, bajas, zonas de reas superiores, todo-terreno,: Superficie daada?.
8. severidad: leve, severa-pot, grave?.
9. semillas TMT: ninguno, fungicidas, otros,?.
10. germinacin: 90 a 100% ,80-89%, lt-80%,?.
11. crecimiento de las plantas: norma, abnorm,?.
12. Hojas: norma, abnorm.
13. manchas foliares-halo:, amarillo-halos ausentes, no hay-amarillo-halos,?.
14. manchas foliares-marg: ws-marg, no-ws-marg, dna,?.
15. mancha foliar-size: lt-1/8, gt-1/8, dna,?.
16. leaf-shread: ausente, presente?.
17. leaf-malf: ausente, presente?.
18. hoja de leve: ausente,-surf superior, inferior-surf,?.
19. madre: norma, abnorm,?.
20. Alojamiento: s, no,?.
21. madre-chancros: ausentes, por debajo del suelo, por encima del suelo, por encima de la sec-nde,?.
22. cancro de la lesin: dna, marrn,-dk marrn-negro, marrn,?.
23. fructificacin-cuerpos: ausente, presente?.
24. decaimiento externa: ausente, firme y seco, acuosa,?.
25. micelio: ausente, presente?.
26. int-discolor: ninguno, marrn, negro,?.
27. esclerocios: ausente, presente?.
28. frutas-pods: norma, enferma,-pocos presentes, dna,?.
29. manchas de fruta: brown-w/blk-specks ausentes, colores,, distorsionar, dna,?.
30. semilla: norma, abnorm,?.
31. molde de crecimiento: ausente, presente?.
32. semillas discolor: ausente, presente?.
33. semilla-size: norma, lt-norma,?.
34. shriveling: ausente, presente?.
35. races: norma, se pudran, agallas-quistes,?.
Documentos pertinentes:
Tan, M., y Eshelman, L. (1988). El uso de redes ponderados para representar el conocimiento
clasificacin en dominios ruidosos. Actas de la Quinta Conferencia Internacional sobre Aprendizaje
Automtico (pp. 121-134). Ann Arbor, Michigan: Morgan Kaufmann.
[Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 26776
perdidos?
Web:
Fuente:
Origen:
Michalski, R.S. Aprendizaje por que se le diga y aprendizaje de ejemplos: una comparacin experimental de
los dos mtodos de adquisicin de conocimientos en el contexto del desarrollo de un sistema experto para el
diagnstico de enfermedades de soya, la revista internacional de anlisis de polticas y sistemas de
informacin, 1980, 4.
Donador:
Doug Fisher (dfisher%vuse@unnet.uucp)
Documentos relevantes:
Tan, M., & Eshelman, L. (1988). Usando redes ponderadas para representar conocimiento de clasificacin
en dominios ruidosos. Procede de las quinta conferencia internacional sobre Aprendizaje de Mquinas (pp.
121-134). Ann Arbor, Michigan: Morgan Kauffman.
Fisher,D.H. & Schlimmer,J.C. (1988). Simplificacin de conceptos y Presicin predictiva. Procedente de la
quinta conferencia internacional sobre Aprendizaje de Mquinas (pp. 22-28). Ann Arbor, Michigan: Morgan
Kauffman.
Citas:
Yuan Jiang and Zhi-Hua Zhou. Editing Training Data for kNN Classifiers with Neural Network Ensemble.
ISNN (1). 2004.
Rich Caruana and Alexandru Niculescu-Mizil. An Empirical Evaluation of Supervised Learning for ROC Area.
ROCAI. 2004.
Prem Melville and Raymond J. Mooney. Diverse ensembles for active learning. ICML. 2004.
Rich Caruana and Alexandru Niculescu-Mizil and Geoff Crew and Alex Ksikes. Ensemble selection from
libraries of models. ICML. 2004.
Rich Caruana and Alexandru Niculescu-Mizil. Data Mining in Metric Space: An Empirical Analysis of
Supervised Learning Performance Criteria. ROCAI. 2004.
Vassilis Athitsos and Stan Sclaroff. Boosting Nearest Neighbor Classifiers for Multiclass Recognition. Boston
University Computer Science Tech. Report No, 2004-006. 2004.
Geoffrey Holmes and Bernhard Pfahringer and Richard Kirkby and Eibe Frank and Mark A. Hall. Multiclass
Alternating Decision Trees. ECML. 2002.
Subramani Mani and Marco Porta and Suzanne McDermott. Building Bayesian Network Models in Medicine:
the MENTOR Experience. Center for Biomedical Informatics University of Pittsburgh. 2002.
Marco Porta and Subramani Mani and Suzanne McDermott. MENTOR: Building Bayesian Network Models in
Medicine CSCE Technical Report TR-2002-016. Department of Computer Science and Engineering
University of South Carolina. 2002.
Bianca Zadrozny. Reducing multiclass to binary by coupling probability estimates. NIPS. 2001.
Rudy Setiono. Feedforward Neural Network Construction Using Cross Validation. Neural Computation, 13.
2001.
Nikunj C. Oza and Stuart J. Russell. Experimental comparisons of online and batch versions of bagging and
boosting. KDD. 2001.
Kiri Wagstaff and Claire Cardie. Clustering with Instance-level Constraints. ICML. 2000.
Kai Ming Ting and Ian H. Witten. Issues in Stacked Generalization. J. Artif. Intell. Res. (JAIR, 10. 1999.
Mark A. Hall. Department of Computer Science Hamilton, NewZealand Correlation-based Feature Selection
for Machine Learning. Doctor of Philosophy at The University of Waikato. 1999.
Manoranjan Dash and Huan Liu. Hybrid Search of Feature Subsets. PRICAI. 1998.
Huan Liu and Rudy Setiono. Incremental Feature Selection. Appl. Intell, 9. 1998.
Hendrik Blockeel and Luc De Raedt and Jan Ramon. Top-Down Induction of Clustering Trees. ICML. 1998.
Igor Kononenko and Edvard Simec and Marko Robnik-Sikonja. Overcoming the Myopia of Inductive Learning
Algorithms with RELIEFF. Appl. Intell, 7. 1997.
Nir Friedman and Dan Geiger and Moiss Goldszmidt. Bayesian Network Classifiers. Machine Learning, 29.
1997.
Prototype Selection for Composite Nearest Neighbor Classifiers. Department of Computer Science University
of Massachusetts. 1997.
Guszti Bartfai. VICTORIA UNIVERSITY OF WELLINGTON Te Whare Wananga o te Upoko o te Ika a Maui.
Department of Computer Science PO Box 600. 1996.
Kamal Ali and Michael J. Pazzani. Error Reduction through Learning Multiple Descriptions. Machine
Learning, 24. 1996.
Christophe Giraud and Tony Martinez and Christophe G. Giraud-Carrier. University of Bristol Department of
Computer Science ILA: Combining Inductive Learning with Prior Knowledge and Reasoning. 1995.
Jitender S. Deogun and Vijay V. Raghavan and Hayri Sever. Exploiting Upper Approximation in the Rough
Set Methodology. KDD. 1995.
Geoffrey I. Webb. OPUS: An Efficient Admissible Algorithm for Unordered Search. J. Artif. Intell. Res. (JAIR,
3. 1995.
Ron Kohavi. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. IJCAI.
1995.
Thomas G. Dietterich and Ghulum Bakiri. Solving Multiclass Learning Problems via Error-Correcting Output
Codes. CoRR, csAI/9501101. 1995.
Geoffrey I. Webb. OPUS: A systematic search algorithm and its application to categorical attribute-value
datadriven machine learning. School of Computing and Mathematics, Deakin University. 1993.
Perry Moerland. Mixtures of latent variable models for density estimation and classification. E S E A R C H R
E P R O R T I D I A P D a l l e M o l l e I n s t i t u t e f o r Pe r cep t ua l A r t i f i c i a l Intelligence.
Suresh K. Choubey and Jitender S. Deogun and Vijay V. Raghavan and Hayri Sever. A comparison of
feature selection algorithms in the context of rough classifiers.
Takao Mohri and Hidehiko Tanaka. An Optimal Weighting Criterion of Case Indexing for Both Numeric and
Symbolic Attributes. Information Engineering Course, Faculty of Engineering The University of Tokyo.
Nikunj C. Oza and Stuart J. Russell. Online Bagging and Boosting. Computer Science Division University of
California.
Zhi-Hua Zhou and Yang Yu. Ensembling Local Learners Through Multimodal Perturbation.
Geoffrey I Webb. Generality is more significant than complexity: Toward an alternative to Occam's Razor.
School of Computing and Mathematics Deakin University.
Sherrie L. W and Zijian Zheng. A BENCHMARK FOR CLASSIFIER LEARNING. Basser Department of
Computer Science The University of Sydney.
Alexander K. Seewald. Dissertation Towards Understanding Stacking Studies of a General Ensemble
Learning Scheme ausgefuhrt zum Zwecke der Erlangung des akademischen Grades eines Doktors der
technischen Naturwissenschaften.
Chotirat Ann and Dimitrios Gunopulos. Scaling up the Naive Bayesian Classifier: Using Decision Trees for
Feature Selection. Computer Science Department University of California.
Zhi-Hua Zhou and Xu-Ying Liu. Training Cost-Sensitive Neural Networks with Methods Addressing the Class
Imbalance Problem.
Prem Melville and Raymond J. Mooney. Proceedings of the 21st International Conference on Machine
Learning. Department of Computer Sciences.
Jarinee Chattratichart and John Darlington and Moustafa Ghanem and Yang Guo and Harold Huning and
Martin Kohler and Janjao Sutiwaraphun and Hing Wing and Dan Yang. Large Scale Data Mining: The
Challenges and The Solutions. Department of Computing.
Daichi Mochihashi and Gen-ichiro Kikui and Kenji Kita. Learning Nonstructural Distance Metric by Minimum
Cluster Distortions. ATR Spoken Language Translation research laboratories.
Miguel Moreira and Alain Hertz and Eddy Mayoraz. Data binarization by discriminant elimination.
Proceedings of the ICML-99 Workshop: From Machine Learning to.
Igor Kononenko and Edvard Simec. Induction of decision trees using RELIEFF. University of Ljubljana,
Faculty of electrical engineering & computer science.
BayesianClassifi552 Pat Langley and Wayne Iba. In Proceedings of the Tenth National
ConferenceonArtifi256 Intelligence (42840. Lambda Kevin Thompson.
YongSeog Kim and W. Nick Street and Filippo Menczer. Optimal Ensemble Construction via Meta-
Evolutionary Ensembles. Business Information Systems, Utah State University.
Iaki Inza and Pedro Larraaga and Basilio Sierra. Bayesian networks for feature subset selection.
Department of Computer Sciences and Artificial Intelligence.
Soybean (Small) Data Set 1999-07-01
Resumen: Clasificacin de e-mail como Spam o No
Caractersticas del
Nmero de
Conjunto de Multivariante 4601 rea: Computacin
instancias:
datos:
Nmero
Valores de
Tareas asociadas: Clasificacin S 99840
perdidos? accesos
Web:
Fuente:
Creadores:
Mark Hopkings, Erik Reeber, George Forman, Jaap Suermondt.
Hewlett-Packard Labs, 1501 Page Mill Rd., Palo Palto, CA 94304
Donador:
George Forman (gforman en nospam hpl.hp.com) 650-857-7835
Documentos relevantes:
N/A
Citas:
Don R. Hush and Clint Scovel and Ingo Steinwart. Los Alamos National Laboratory
Stability of Unstable Learning Algorithms. Modeling, Algorithms and Informatics Group,
CCS-3. 2003.
Yongmei Wang and Ian H. Witten. Modeling for Optimal Probability Prediction. ICML. 2002.
Christos Dimitrakakis and Samy Bengioy. Online Policy Adaptation for Ensemble
Classifiers. IDIAP.
C. Titus Brown and Harry W. Bullen and Sean P. Kelly and Robert K. Xiao and Steven G.
Satterfield and John G. Hagedorn and Judith E. Devaney. Visualization and Data Mining in
an 3D Immersive Environment: Summer Project 2003.
SPECT Heart Data Set 2001-10-01
Resumen: Los datos sobre imgenes de Tomografa cardiaca Computarizada por
Emisin de Protn (SPECT). Cada paciente clasificado dentro de dos categoras: normal y
anormal.
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 98012
perdidos?
Web:
Fuente:
Dueos originales:
Krzysztof J. Cios, Lukasz A. Kurgan
Universidad de Colorado en Denver, Denver, CO 80217, E.U.A.
Krys.Cios @ cudenver.edu
Lucy S. Goodenday
Colegio Mdico de Ohio, OH, E.U.A.
Donantes:
Lukasz A. Kurgan Krzysztof J. Cios
Documentos relevantes:
Kurgan, L.A., Cios, K.J., Tadeusiewicz, R., Ogiela, M. & Goodenday, L.S. "Knowledge
Discovery Approach to Automated Cardiac SPECT Diagnosis" Artificial Intelligence in
Medicine, vol. 23:2, pp 149-169, Oct 2001.
Cios, K.J., Wedding, D.K. & Liu, N. CLIP3: cover learning using integer programming.
Kybernetes, 26:4-5, pp 513-536, 1997.
Citas:
Lukasz A. Kurgan and Waldemar Swiercz and Krzysztof J. Cios. Semantic Mapping of
XML Tags Using Inductive Machine Learning. ICMLA. 2002.
Multivariante,
Caractersticas del Nmero de
Seties de 8800 rea: N/A
Conjunto de datos: instancias:
tiempo
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 27513
perdidos?
Web:
Fuente:
Datos recolectados por el laboratorio de automtizacin y seales.
Universidad de Badji-Mokhtar
Annaba, Algeria
Documentos relevantes:
[1] N. Hammami, M. Bedda ,"Improved Tree model for Arabic Speech Recognition", Proc.
IEEE ICCSIT10 Conference, 2010.
[2] N. Hammami, M. Sellami ,"Tree distribution classifier for automatic spoken Arabic digit
recognition", Proc. IEEE ICITST09 Conference, 2009 , PP 1-4.
Sponge Data Set N/A
Resumen: Datos sobre esponjas; atributos en espaol
Nmero de
Valores
Tareas asociadas: Agrupamiento S accesos 32525
perdidos?
Web:
Fuente:
Creadores:
Iosune Uriz y Marta Domingo
CSIC
Donador:
Javier Bjar y Ulises Corts (bejar@lsi.upc.es)
Departamento de lenguajes y sistemas informticos
Universidad Politcnica de Catalunya, Barcelona, Espaa
Documentos relevantes:
Domingo, M. "Aplicaci\'o de t\`ecniques de I.A. (LINNEO) a la classificaci\'o sistem\`atica:
O.Hadromerida (Demospongiae.Porifera). Master Thesis. Departament d'ecologia.
Universitat de Barcelona.
Martin, M and Sanguesa, R. and Cor\'es "Biasing induction with previous knowledge for
knowledge acquisition in imprecise domains''. Les syst\`emes experts et leus applications.
Onzi\'emes Journ\'ees Internationales. Avignon'91. Vol 1. pp. 359-370. Avignon, France.
1991.
Nmero de
Valores
Tareas asociadas: Clasificacin S accesos 46158
perdidos?
Web:
Fuente:
(Confidencial)
Enviado por quinlan@cs.su.oz.au
Documentos relevantes:
Ross Quinlan. "Simplifying decision trees", Int J Man-Machine Studies 27, Dec 1987, pp.
221-234.
Ross Quinlan. "C4.5: Programs for Machine Learning", Morgan Kaufmann, Oct 1992.
Citas:
Jeroen Eggermont and Joost N. Kok and Walter A. Kosters. Genetic Programming for data
classification: partitioning the search space. SAC. 2004.
Xiaoming Huo. FBP: A Frontier-Based Tree-Pruning Algorithm. Seoung Bum Kim. 2002.
Endre Boros and Peter Hammer and Toshihide Ibaraki and Alexander Kogan and Eddy
Mayoraz and Ilya B. Muchnik. An Implementation of Logical Analysis of Data. IEEE Trans.
Knowl. Data Eng, 12. 2000.
Rudy Setiono and Huan Liu. NeuroLinear: From neural networks to oblique decision rules.
Neurocomputing, 17. 1997.
Bart Baesens and Stijn Viaene and Tony Van Gestel and J. A. K Suykens and Guido
Dedene and Bart De Moor and Jan Vanthienen and Katholieke Universiteit Leuven. An
Empirical Assessment of Kernel Type Performance for Least Squares Support Vector
Machine Classifiers. Dept. Applied Economic Sciences.
Adil M. Bagirov and Alex Rubinov and A. N. Soukhojak and John Yearwood. Unsupervised
and supervised data classification via nonsmooth and global optimization. School of
Information Technology and Mathematical Sciences, The University of Ballarat.
Wl/odzisl/aw Duch and Karol Grudzi nski and Grzegorz Stawski. SYMBOLIC FEATURES
IN NEURAL NETWORKS. Department of Computer Methods, Nicolaus Copernicus
University.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 100122
perdidos?
Web:
Fuente:
Profesor Dr. Hans Hofmann
Instituto de Estadsticas y Econometra
Universidad de Hamburgo
Departamento de Economa
Von-Melle-Park 5
2000 Hamburg 13
(1 = bien, 2 = malo)
Es peor para clasificar un cliente como bueno cuando son malos (5), tanto lo es para
clasificar un cliente como malo cuando son buenos (1).
Atributo 1: (cualitativo)
Estado de cuenta de cheques existente
A11: ... <0 DM
A12: 0 <= ... <200 DM
A13: ...> = 200 asignaciones de DM / a salarios de al menos 1 ao
A14: no cuenta de cheques
Atributo 2: (numrico)
Duracin en meses
Atributo 3: (cualitativo)
Historial de crdito
A30: no hay crditos tomados / todos los crditos pagados de vuelta debidamente
A31: los crditos de este banco pagados debidamente
A32: crditos existentes pagados debidamente hasta ahora
A33 : retraso en el pago de en el pasado
A34: cuentas crticas / otros crditos existentes (no en este banco)
Atributo 4: (cualitativo)
Propsito
A40: coche (nuevo)
A41: Coche (utilizado)
A42: muebles / equipos
A43: Radio / televisin
A44: electrodomsticos
A45: reparaciones
A46: educacin
A47: (vacaciones - no existe?)
A48: reconversin
A49: business
A410: otros
Atributo 5: (numrico)
Monto del crdito
Atributo 6: (cualitativo)
Cuenta de ahorros / bonos
A61: ... <100 DM
A62: 100 <= ... <500 DM
A63: 500 <= ... <1.000 DM
A64: ..> = 1.000 DM
A65: desconocido / ninguna cuenta de ahorro
Atributo 7: (cualitativo)
Presente empleo desde
A71: desempleados
A72: ... <1 ao
A73: 1 <= ... <4 aos
A74: 4 <= ... <7 aos
A75: ..> = 7 aos
8 Atributo: (numrico)
Tasa en porcentaje de la renta disponible
Atributo 9: (cualitativo)
El estatuto personal y del sexo
A91: masculino: divorciado / separado
A92: femenino: divorciado / separado / casado
A93: masculino: soltero
A94: masculino: Casado / viudo
A95: femenino: soltero
Documentos relevantes:
N/A
Citas:
Jeroen Eggermont and Joost N. Kok and Walter A. Kosters. Genetic Programming for data
classification: partitioning the search space. SAC. 2004.
Ke Wang and Shiyu Zhou and Ada Wai-Chee Fu and Jeffrey Xu Yu. Mining Changes of
Classification by Correspondence Tracing. SDM. 2003.
Avelino J. Gonzalez and Lawrence B. Holder and Diane J. Cook. Graph-Based Concept
Learning. FLAIRS Conference. 2001.
Oya Ekin and Peter L. Hammer and Alexander Kogan and Pawel Winter. Distance-Based
Classification Methods. e p o r t RUTCOR ffl Rutgers Center for Operations Research ffl
Rutgers University. 1996.
Paul O' Dea and Josephine Griffith and Colm O' Riordan. Combining Feature Selection and
Neural Networks for Solving Classification Problems. Information Technology Department,
National University of Ireland.
Chotirat Ann and Dimitrios Gunopulos. Scaling up the Naive Bayesian Classifier: Using
Decision Trees for Feature Selection. Computer Science Department University of California.
Paul O' Dea and David Griffith and Colm O' Riordan. DEPARTMENT OF INFORMATION
TECHNOLOGY. P. O'Dea (NUI).
Statlog (Heart) Data Set N/A
Resumen: Este dataset es una BD de enfermedades del corazn similar a una BD ya
presente en el repositorio (Heart Disease databases), pero en una forma ligeramente
diferente.
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 49281
perdidos?
Web:
Fuente:
N/A
Donde las filas representan los valores reales y las columnas los predecidos.
Tipos de atributos
-----------------
Real: 1,4,5,8,10,12
Ordenado: 11,
Binarop: 2,6,9
Nominal:7,3,13
Citas:
Gavin Brown. Diversity in Neural Network Ensembles. The University of Birmingham. 2004.
Igor Kononenko and Edvard Simec and Marko Robnik-Sikonja. Overcoming the Myopia of
Inductive Learning Algorithms with RELIEFF. Appl. Intell, 7. 1997.
Elena Smirnova and Ida G. Sprinkhuizen-Kuyper and I. Nalbantis and b. ERIM and
Universiteit Rotterdam. Unanimous Voting using Support Vector Machines. IKAT,
Universiteit Maastricht.
Nmero de
Valores
Tareas asociadas: Clasificacin No accesos 23399
perdidos?
Web:
Fuente:
Creadores:
Vision Group, Universidad de Massachusetts
Donante:
Vision Group (Carla Brodley@cs.umass.edu)
Documentos relevantes:
N/A
Citas:
Anthony K H Tung and Xin Xu and Beng Chin Ooi. CURLER: Finding and Visualizing
Nonlinear Correlated Clusters. SIGMOD Conference. 2005.
Xiaoli Z. Fern and Carla Brodley. Cluster Ensembles for High Dimensional Clustering: An
Empirical Study. Journal of Machine Learning Research n, a. 2004.
Aristidis Likas and Nikos A. Vlassis and Jakob J. Verbeek. The global k-means clustering
algorithm. Pattern Recognition, 36. 2003.
Manoranjan Dash and Huan Liu and Peter Scheuermann and Kian-Lee Tan. Fast
hierarchical clustering and its validation. Data Knowl. Eng, 44.
Amund Tveit. Empirical Comparison of Accuracy and Performance for the MIPSVM classifier
with Existing Classifiers. Division of Intelligent Systems Department of Computer and
Information Science, Norwegian University of Science and Technology.
Je Scott and Mahesan Niranjan and Richard W. Prager. Realisable Classifiers: Improving
Operating Performance on Variable Cost Problems. Cambridge University Department of
Engineering.
C. Titus Brown and Harry W. Bullen and Sean P. Kelly and Robert K. Xiao and Steven G.
Satterfield and John G. Hagedorn and Judith E. Devaney. Visualization and Data Mining in
an 3D Immersive Environment: Summer Project 2003.
Adil M. Bagirov and Alex Rubinov and A. N. Soukhojak and John Yearwood. Unsupervised
and supervised data classification via nonsmooth and global optimization. School of
Information Technology and Mathematical Sciences, The University of Ballarat.
K. A. J Doherty and Rolf Adams and Neil Davey. Unsupervised Learning with Normalised
Data and Non-Euclidean Norms. University of Hertfordshire.
Adil M. Bagirov and John Yearwood. A new nonsmooth optimization algorithm for clustering.
Centre for Informatics and Applied Optimization, School of Information Technology and
Mathematical Sciences, University of Ballarat.
K. A. J Doherty and Rolf Adams and Neil Davey. Non-Euclidean Norms and Data
Normalisation. Department of Computer Science, University of Hertfordshire, College Lane.
Michael Lindenbaum and Shaul Markovitch and Dmitry Rusakov. Selective Sampling Using
Random Field Modelling.
James Tin and Yau Kwok. Moderating the Outputs of Support Vector Machine Classifiers.
Department of Computer Science Hong Kong Baptist University Hong Kong.
Nikos A. Vlassis and Aristidis Likas. A greedy EM algorithm for Gaussian mixture. Intelligent
Autonomous Systems, IAS.
Statlog (Landsat Satellite) Data Set 1993-02-13
Resumen: Valores multi-espectrales de pxeles en sectores de 3x3 en una imagen de
satlite, y la clasificacin asociada con el pxel central en cada sector
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 39739
perdidos?
Web:
Fuente:
Ashwin Srinivasan
Direccin general de estadstica y modelado de datos
Universidad de Stratchlyde
Glasgow, Escocia, Reino Unido
Ross@uk.ac.turing
Los datos de Landsat originales para esta base de datos se ha generado a partir de datos
adquiridos de la NASA por el Centro Australiano de Percepcin Remota, y se utilizan para la
investigacin en: El Centro de Teledeteccin de la Universidad de Nueva Gales del
Sur, Kensington, PO Box 1 NSW 2.033 Australia.
La base de datos de muestra se gener tomando una pequea seccin (82 filas y 100
columnas) de los datos originales. Los valores binarios se convirtieron a su forma ASCII por
Ashwin Srinivasan. La clasificacin para cada pxel se realiz a base de una visita al lugar
real por la Sra. Karen Hall, cuando trabajaba para el profesor John A. Richards, en el Centro
de Percepcin Remota en la Universidad de New South Wales, Australia. La conversin a
sectores de 3x3 y la divisin en unidades de prueba y de capacitacin se llev a cabo por
Alistair Sutherland.
Nmero de clase
1 red soil
2 cotton crop
3 grey soil
4 damp grey soil
5 soil with vegetation stubble
6 mixture class (all types present)
7 very damp grey soil
Los datos se dan en orden aleatorio y ciertas lneas de datos se han eliminado de manera
que no se puede reconstruir la imagen original de este conjunto de datos.
En cada lnea de datos de los cuatro valores espectrales de la parte superior- pixel izquierdo
se da primero, seguido de los cuatro valores espectrales para el pxel superior central y
luego los del pixel superior derecha, y as sucesivamente con los pxeles ledos en
secuencia de izquierda a derecha y de arriba a abajo. Por lo tanto, los cuatro valores
espectrales para el pxel central se dan por atributos 17, 18, 19 y 20. Si lo desea, puede
utilizar slo estos cuatro atributos, haciendo caso omiso de los dems. Esto evita el
problema que surge cuando un sector 3x3 extiende a ambos lados de un lmite.
Documentos relevantes:
N/A
Citas:
Ken Tang and Ponnuthurai N. Suganthan and Xi Yao and A. Kai Qin. Linear
dimensionalityreduction using relevance weighted LDA. School of Electrical and Electronic
Engineering Nanyang Technological University. 2005.
Jaakko Peltonen and Arto Klami and Samuel Kaski. Improved Learning of Riemannian
Metrics for Exploratory Analysis. Improved Learning of Riemannian Metrics for Exploratory
Analysis. Neural Networks. 2004.
Fabian Hoti and Lasse Holmstrm. A semiparametric density estimation approach to pattern
classification. Pattern Recognition, 37. 2004.
Xiaoli Z. Fern and Carla Brodley. Cluster Ensembles for High Dimensional Clustering: An
Empirical Study. Journal of Machine Learning Research n, a. 2004.
Jaakko Peltonen and Samuel Kaski. Discriminative Components of Data. IEEE. 2004.
Giorgio Valentini and Thomas G. Dietterich. Low Bias Bagged Support Vector Machines.
ICML. 2003.
Giorgio Valentini. Ensemble methods based on bias--variance analysis Theses Series DISI-
TH-2003. Dipartimento di Informatica e Scienze dell'Informazione. 2003.
Igor V. Tetko. Associative Neural Network. Neural Processing Letters, 16. 2002.
Jaakko Peltonen and Arto Klami and Samuel Kaski. Learning More Accurate Metrics for Self-
Organizing Maps. ICANN. 2002.
Stephen D. Bay. Multivariate Discretization for Set Mining. Knowl. Inf. Syst, 3. 2001.
Kagan Tumer and Joydeep Ghosh. Robust Combining of Disparate Classifiers through Order
Statistics. CoRR, csLG/9905013. 1999.
Kagan Tumer and Nikunj C. Oza. Decimated Input Ensembles for Improved Generalization.
NASA Ames Research Center. 1999.
Xavier Giannakopoulos and Juha Karhunen and Erkki Oja. An Experimental Comparison of
Neural Algorithms for Independent Component Analysis and Blind Separation. Int. J. Neural
Syst, 9. 1999.
Cesar Guerra-Salcedo and L. Darrell Whitley. Genetic Approach to Feature Selection for
Ensemble Creation. GECCO. 1999.
Robert E. Schapire and Yoav Freund and Peter Bartlett and Wee Sun Lee. The Annals of
Statistics, to appear. Boosting the Margin: A New Explanation for the Effectiveness of Voting
Methods. AT&T Labs. 1998.
Je Scott and Mahesan Niranjan and Richard W. Prager. Realisable Classifiers: Improving
Operating Performance on Variable Cost Problems. Cambridge University Department of
Engineering.
Vikas Sindhwani and P. Bhattacharya and Subrata Rakshit. Information Theoretic Feature
Crediting in Multiclass Support Vector Machines.
Jaakko Peltonen and Arto Klami and Samuel Kaski. Learning Metrics for Information
Visualization. Neural Networks Research Centre Helsinki University of Technology.
C. esar and Cesar Guerra-Salcedo and Darrell Whitley. Feature Selection Mechanisms for
Ensemble Creation: A Genetic Search Perspective. Department of Computer Science
Colorado State University.
Adil M. Bagirov and Julien Ugon. An algorithm for computation of piecewise linear function
separating two sets. CIAO, School of Information Technology and Mathematical Sciences,
The University of Ballarat.
Cesar Guerra-Salcedo and Stephen Chen and Darrell Whitley and Sarah Smith. Fast and
Accurate Feature Selection Using Hybrid Genetic Strategies. Department of Computer
Science Colorado State University.
Statlog (Shuttle) Data Set N/A
Resumen: El conjunto de datos de transporte contiene 9 atributos todos los cuales son de
tipo numrico. Aproximadamente el 80% de los datos pertenecen a la clase 1
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 41355
perdidos?
Web:
Fuente:
Jason Catlett
Departamento de Ciencias de la Computacin de Basser
Universidad de Sydney, N.S.W., Australia
Documentos relevantes:
N/A
Citas:
Ira Cohen and Fabio Gagliardi Cozman and Nicu Sebe and Marcelo Cesar Cirelo and
Thomas S. Huang.Semisupervised Learning of Classifiers: Theory, Algorithms, and Their
Application to Human-Computer Interaction. IEEE Trans. Pattern Anal. Mach. Intell, 26. 2004.
Richard Nock. Inducing Interpretable Voting Classifiers without Trading Accuracy for
Simplicity: Theoretical Results, Approximation Algorithms, and Experiments. J. Artif. Intell.
Res. (JAIR, 17. 2002.
Grigorios Tsoumakas and Ioannis P. Vlahavas. Effective Stacking of Distributed Classifiers.
ECAI. 2002.
Jun Wang and Bin Yu and Les Gasser. Concept Tree Based Clustering Visualization with
Shaded Similarity Matrices. ICDM. 2002.
Jochen Garcke and Michael Griebel and Michael Thess. Data Mining with Sparse Grids.
Computing, 67. 2001.
Stephen D. Bay. Multivariate Discretization for Set Mining. Knowl. Inf. Syst, 3. 2001.
Haixun Wang and Carlo Zaniolo. CMP: A Fast Decision Tree Classifier Using Multivariate
Predictions. ICDE. 2000.
Khaled A. Alsabti and Sanjay Ranka and Vineet Singh. CLOUDS: A Decision Tree Classifier
for Large Datasets. KDD. 1998.
Nir Friedman and Moiss Goldszmidt. Discretizing Continuous Attributes While Learning
Bayesian Networks. ICML. 1996.
Ron Kohavi. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model
Selection. IJCAI. 1995.
Wl odzisl and Rafal Adamczak and Krzysztof Grabczewski. Optimization of Logical Rules
Derived by Neural Procedures. Department of Computer Methods, Nicholas Copernicus
University.
Chih-Wei Hsu and Cheng-Ru Lin. A Comparison of Methods for Multi-class Support Vector
Machines. Department of Computer Science and Information Engineering National Taiwan
University.
Jeffrey P. Bradford and Clayton Kunz and Ron Kohavi and Clifford Brunk and Carla
Brodley. Appears in ECML-98 as a research note Pruning Decision Trees with
Misclassification Costs. School of Electrical Engineering.
Jun Wang. Classification Visualization with Shaded Similarity Matrix. Bei Yu Les Gasser
Graduate School of Library and Information Science University of Illinois at Urbana-
Champaign.
Mohammed Waleed Kadous and Claude Sammut. The University of New South Wales
School of Computer Science and Engineering Temporal Classification: Extending the
Classification Paradigm to Multivariate Time Series.
Adil M. Bagirov and Julien Ugon. An algorithm for computation of piecewise linear function
separating two sets. CIAO, School of Information Technology and Mathematical Sciences,
The University of Ballarat.
Ron Kohavi and George H. John. Automatic Parameter Selection by Minimizing Estimated
Error. Computer Science Dept. Stanford University.
Wl odzisl/aw Duch and Rudy Setiono and Jacek M. Zurada. Computational intelligence
methods for rule-based data understanding.
Chris Giannella and Bassem Sayrafi. An Information Theoretic Histogram for Single
Dimensional Selectivity Estimation. Department of Computer Science, Indiana University
Bloomington.
Christophe Giraud and Tony Martinez. ADYNAMIC INCREMENTAL NETWORK THAT
LEARNS BY DISCRIMINATION. AA.
Statlog (Vehicle Silhouettes) Data Set N/A
Resumen: objetos 3D dentro de una imagen 2D mediante la aplicacin de un conjunto de
extractores de caractersticas de formas para las siluetas 2D de los objetos.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 39938
perdidos?
Web:
Fuente:
Drs.Pete Mowforth y Barry Shepherd
Instituto Turing
George House
36 North Hanover St.
Glasgow G1 2AD
Alistair Sutherland
Departamento de Estadsticas
Universidad Strathclyde
Livingstone Tower
26 Richmond St
GLASGOW G1 1XH
Gran Bretaa
Tel.: 041 552 4400 x3033
Fax: 041 552 4711
e-mail: Alistair"@" uk.ac.strathclyde.stams
NMERO DE CLASES
4 OPEL, SAAB, BUS, VAN
Documentos relevantes:
Turing Institute Research Memorandum TIRM-87-018 "Vehicle Recognition Using Rule
Based Methods" by Siebert,JP (March 1987)
Citas:
Ping Zhong and Masao Fukushima. A Regularized Nonsmooth Newton Method for Multi-
class Support Vector Machines. 2005.
Ken Tang and Ponnuthurai N. Suganthan and Xi Yao and A. Kai Qin. Linear
dimensionalityreduction using relevance weighted LDA. School of Electrical and Electronic
Engineering Nanyang Technological University. 2005.
Remco R. Bouckaert and Eibe Frank. Evaluating the Replicability of Significance Tests for
Comparing Learning Algorithms. PAKDD. 2004.
Dmitry Pavlov and Alexandrin Popescul and David M. Pennock and Lyle H. Ungar. Mixtures
of Conditional Maximum Entropy Models. ICML. 2003.
James Bailey and Thomas Manoukian and Kotagiri Ramamohanarao. Fast Algorithms for
Mining Emerging Patterns. PKDD. 2002.
Gisele L. Pappa and Alex Alves Freitas and Celso A A Kaestner. Attribute Selection with a
Multi-objective Genetic Algorithm. SBIA. 2002.
Robi Polikar and L. Upda and S. S. Upda and Vasant Honavar. Learn++: an incremental
learning algorithm for supervised neural networks. IEEE Transactions on Systems, Man, and
Cybernetics, Part C, 31. 2001.
Robert E. Schapire and Yoav Freund and Peter Bartlett and Wee Sun Lee. The Annals of
Statistics, to appear. Boosting the Margin: A New Explanation for the Effectiveness of Voting
Methods. AT&T Labs. 1998.
Ron Kohavi. A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model
Selection. IJCAI. 1995.
Maria Salamo and Elisabet Golobardes. Analysing Rough Sets weighting methods for Case-
Based Reasoning Systems. Enginyeria i Arquitectura La Salle.
Ronaldo C. Prati and Peter A. Flach. ROCCER: an Algorithm for Rule Learning Based on
ROC Analysis. Institute of Mathematics and Computer Science University of S~ ao Paulo.
Jeffrey P. Bradford and Clayton Kunz and Ron Kohavi and Clifford Brunk and Carla
Brodley. Appears in ECML-98 as a research note Pruning Decision Trees with
Misclassification Costs. School of Electrical Engineering.
Gisele L. Pappa and Alex Alves Freitas and Celso A A Kaestner. AMultiobjective Genetic
Algorithm for Attribute Selection. Computing Laboratory Pontificia Universidade Catolica do
Parana University of Kent at Canterbury.
Chih-Wei Hsu and Cheng-Ru Lin. A Comparison of Methods for Multi-class Support Vector
Machines. Department of Computer Science and Information Engineering National Taiwan
University.
Yin Zhang and W. Nick Street. Bagging with Adaptive Costs. Management Sciences
Department University of Iowa Iowa City.
Adil M. Bagirov and Alex Rubinov and A. N. Soukhojak and John Yearwood. Unsupervised
and supervised data classification via nonsmooth and global optimization. School of
Information Technology and Mathematical Sciences, The University of Ballarat.
Ron Kohavi and George H. John. Automatic Parameter Selection by Minimizing Estimated
Error. Computer Science Dept. Stanford University.
Rajesh Parekh and Jihoon Yang and Vasant Honavar. Constructive Neural-Network Learning
Algorithms for Pattern Classification.
Vikas Sindhwani and P. Bhattacharya and Subrata Rakshit. Information Theoretic Feature
Crediting in Multiclass Support Vector Machines.
Statlog Project Data Set 1992-10-01
Resumen: Varias bases de datos: Vehicle silhouttes, Landsat Sattelite, Shuttle, Australian
Credit Approval, Heart Disease, Image Segmentation, German Credit
Nmero de
Valores
Tareas asociadas: N/A N/A accesos N/A
perdidos?
Web:
Fuente:
Las bases de datos de Statlog son un subconjunto de los conjuntos de datos utilizados en el
proyecto europeo de Statlog.
Donante:
Ross D. King
Departamento de Estadstica y modelado de Ciencias
Universidad de Strathclyde
Glasgow G1 1XH
Escocia, Reino Unido
+44 41 552-4400 x 3033
Fax +44 41 552-4711
ross '@' turing.uk.ac
Bases de datos:
Documentos relevantes:
Feng,C., Sutherland,A., King,S., Muggleton,S. & Henery,R. (1993). Comparison of Machine
Learning Classifiers to Statistics and Neural Networks. AI & Stats Conf. 93.
Citas:
Jeroen Eggermont and Joost N. Kok and Walter A. Kosters. Genetic Programming for data
classification: partitioning the search space. SAC. 2004.
Wei-Chun Kao and Kai-Min Chung and Lucas Assun and Chih-Jen Lin. Decomposition
Methods for Linear Support Vector Machines. Neural Computation, 16. 2004.
Xiaoli Z. Fern and Carla Brodley. Cluster Ensembles for High Dimensional Clustering: An
Empirical Study. Journal of Machine Learning Research n, a. 2004.
Gavin Brown. Diversity in Neural Network Ensembles. The University of Birmingham. 2004.
Jun Wang and Bin Yu and Les Gasser. Concept Tree Based Clustering Visualization with
Shaded Similarity Matrices. ICDM. 2002.
Ramesh Natarajan and Edwin P D Pednault. Segmented Regression Estimators for Massive
Data Sets. SDM. 2002.
Avelino J. Gonzalez and Lawrence B. Holder and Diane J. Cook. Graph-Based Concept
Learning. FLAIRS Conference. 2001.
Jochen Garcke and Michael Griebel and Michael Thess. Data Mining with Sparse Grids.
Computing, 67. 2001.
Edgar Acuna and Alex Rojas. Ensembles of classifiers based on Kernel density estimators.
Department of Mathematics University of Puerto Rico. 2000.
Haixun Wang and Carlo Zaniolo. CMP: A Fast Decision Tree Classifier Using Multivariate
Predictions. ICDE. 2000.
Cesar Guerra-Salcedo and L. Darrell Whitley. Genetic Approach to Feature Selection for
Ensemble Creation. GECCO. 1999.
Guido Lindner and Rudi Studer. AST: Support for Algorithm Selection with a CBR Approach.
PKDD. 1999.
Ljupco Todorovski and Saso Dzeroski. Experiments in Meta-level Learning with ILP. PKDD.
1999.
Art B. Owen. Tubular neighbors for regression and classification. Stanford University. 1999.
Robert E. Schapire and Yoav Freund and Peter Bartlett and Wee Sun Lee. The Annals of
Statistics, to appear. Boosting the Margin: A New Explanation for the Effectiveness of Voting
Methods. AT&T Labs. 1998.
Khaled A. Alsabti and Sanjay Ranka and Vineet Singh. CLOUDS: A Decision Tree Classifier
for Large Datasets. KDD. 1998.
Igor Kononenko and Edvard Simec and Marko Robnik-Sikonja. Overcoming the Myopia of
Inductive Learning Algorithms with RELIEFF. Appl. Intell, 7. 1997.
Oya Ekin and Peter L. Hammer and Alexander Kogan and Pawel Winter. Distance-Based
Classification Methods. e p o r t RUTCOR ffl Rutgers Center for Operations Research ffl
Rutgers University. 1996.
Georgios Paliouras and David S. Bre. The Effect of Numeric Features on the Scalability of
Inductive Learning Programs. ECML. 1995.
Ron Kohavi and George H. John and Richard Long and David Manley and Karl
Pfleger. MLC++: A Machine Learning Library in C. ICTAI. 1994.
Ron Kohavi and George John and Richard Long and David Manley and Karl
Pfleger. Appears in Tools with AI '94. Computer Science Department Stanford University.
H. -T Lin and C. -J Lin. A Study on Sigmoid Kernels for SVM and the Training of non-PSD
Kernels by SMO-type Methods. Department of Computer Science and Information
Engineering National Taiwan University.
Jun Wang. Classification Visualization with Shaded Similarity Matrix. Bei Yu Les Gasser
Graduate School of Library and Information Science University of Illinois at Urbana-
Champaign.
Rong-En Fan and P. -H Chen and C. -J Lin. Working Set Selection Using the Second Order
Information for Training SVM. Department of Computer Science and Information Engineering
National Taiwan University.
Wl odzisl/aw Duch and Karol Grudzinski. Search and global minimization in similarity-based
methods. Department of Computer Methods, Nicholas Copernicus University.
C. esar and Cesar Guerra-Salcedo and Darrell Whitley. Feature Selection Mechanisms for
Ensemble Creation : A Genetic Search Perspective. Department of Computer Science
Colorado State University.
Elena Smirnova and Ida G. Sprinkhuizen-Kuyper and I. Nalbantis and b. ERIM and
Universiteit Rotterdam.Unanimous Voting using Support Vector Machines. IKAT, Universiteit
Maastricht.
Ron Kohavi and Barry G. Becker and Dan Sommerfield. Improving Simple Bayes. Data
Mining and Visualization Group Silicon Graphics, Inc.
Wl odzisl/aw Duch and Rudy Setiono and Jacek M. Zurada. Computational intelligence
methods for rule-based data understanding.
Wl/odzisl/aw Duch and Rafal/ Adamczak Email:duchraad@phys. uni. torun. pl. Statistical
methods for construction of neural networks. Department of Computer Methods, Nicholas
Copernicus University.
Chih-Wei Hsu and Cheng-Ru Lin. A Comparison of Methods for Multi-class Support Vector
Machines. Department of Computer Science and Information Engineering National Taiwan
University.
Wl/odzisl/aw Duch and Karol Grudzinski. Meta-learning: searching in the model space.
Department of Computer Methods, Nicholas Copernicus University.
Kuan-ming Lin and Chih-Jen Lin. A Study on Reduced Support Vector Machines. Department
of Computer Science and Information Engineering National Taiwan University.
Je Scott and Mahesan Niranjan and Richard W. Prager. Realisable Classifiers: Improving
Operating Performance on Variable Cost Problems. Cambridge University Department of
Engineering.
Yishay Mansour. Pessimistic decision tree pruning based on tree size. Computer Science
Dept. Tel-Aviv University.
Guido Lindner and Rudi Studer. Algorithm Selection Support for Classification.
DaimlerChrysler AG, Research & Technology FT3/KL.
Ron Kohavi and George H. John. Automatic Parameter Selection by Minimizing Estimated
Error. Computer Science Dept. Stanford University.
Steel Plates Faults Data Set 2010-10-26
Resumen: Un conjunto de datos de defectos en placas de acero, que se clasifica en 7 tipos
diferentes. El objetivo era formar a la mquina de aprendizaje para el reconocimiento
automtico de patrones.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 23963
perdidos?
Web:
Fuente:
Semeion, Centro de Investigacin de Ciencias de la Comunicacin, Via Sersale 117, 00128,
Roma, Italia.
www.semeion.it
1.Pastry
2.Z_Scratch
3.K_Scatch
4.Stains
5.Dirtiness
6.Bumps
7.Other_Faults
Documentos relevantes:
1.M Buscema, S Terzi, W Tastle, A New Meta-Classifier,in NAFIPS 2010, Toronto
(CANADA),26-28 July 2010, 978-1-4244-7858-6/10 2010 IEEE
2.M Buscema, MetaNet: The Theory of Independent Judges, in Substance Use & Misuse,
33(2), 439-461,1998
Student Loan Relational Data Set 1993-01-01
Resumen: Prstamos Estudiantiles dominio relacional
Nmero de
Valores
Tareas asociadas: N/A N/A accesos 19338
perdidos?
Web:
Fuente:
Michael J. Pazzani
Universitdad de California, Irvine
Irvine, CA EUA
Documentos relevantes:
Pazzani, M., & Brunk, C. (1991). Detecting and correcting errors in rule-based expert
systems: an integration of empirical and explanation-based learning. Knowledge Acquisition,
3, 157-173.
SUSY Data Set 2014-02-12
Resumen: Este es un problema de clasificacin para distinguir entre un proceso de seal
que produce partculas supersimtricas y un proceso en segundo plano que no lo hace.
Caractersticas del
Nmero de
Conjunto de N/A 5000000 rea: Fsica
instancias:
datos:
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 3436
perdidos?
Web:
Fuente:
Daniel Whiteson daniel '@' uci.edu, Profesor assistente, Fsica y Astronoma, Universidad de
California Irvine
Documentos relevantes:
Baldi, Sadowski, Whiteson, Improved Searches for Exotic Particles with Deep Learning
Techniques, (in submission).
Synthetic Control Chart Time Series Data Set 1999-06-08
Resumen: Esta informacin consta de los grficos de control generados sintticamente.
Nmero de
Clasificacin, Valores
Tareas asociadas: No accesos 31979
Agrupamiento perdidos?
Web:
Fuente:
Dr. Robert Alcock rob '@' skyblue.csd.auth.gr
La siguiente imagen muestra diez ejemplos de cada clase: data.jpeg, donde (A) Tendencia a
la baja. (B) cclico. (C) normal. (D) de desplazamiento hacia arriba. (E) Tendencia al alza. (F)
desplazamiento a la baja.
Documentos relevantes:
Alcock R.J. and Manolopoulos Y. Time-Series Similarity Queries Employing a Feature-Based
Approach. 7th Hellenic Conference on Informatics. August 27-29. Ioannina,Greece 1999.
D.T. Pham and A.B. Chan "Control Chart Pattern Recognition using a New Type of Self
Organizing Neural Network" Proc. Instn, Mech, Engrs. Vol 212, No 1, pp 115-127 1998.
Syskill and Webert Web Page Ratings Data Set 1998-10-20
Resumen: Esta informacin consta de los grficos de control generados sintticamente.
Nmero de
Valores
Tareas asociadas: Clasificacin N/A accesos 24083
perdidos?
Web:
Fuente:
Michael Pazzani
Departamento de informacin y ciencias de la computacin
Universidad de California, Irvine
Irvine, CA 92697-3425
pazzani '@' ics.uci.edu
http://www.ics.uci.edu/~pazzani
donde file-name es el nombre de un archivo (por lo general un nmero entero), est caliente,
medio o fro. Los otros campos no se utilizan en el aprendizaje, sino que son recogidos por
la interfaz para otros fines. Son la url de la fuente del HTML, la fecha de clasificacin y el
ttulo de la OAGE web.
Documentos relevantes:
Pazzani M., Billsus, D. (1997). Learning and Revising User Profiles: The identification of
interesting web sites. Machine Learning 27, 313-331
Pazzani, M., Muramatsu J., Billsus, D. (1996). Syskill & Webert: Identifying interesting web
sites. Proceedings of the National Conference on Artificial Intelligence, Portland, OR. PDF
Citas:
Stephen D. Bay and Dennis F. Kibler and Michael J. Pazzani and Padhraic Smyth. The UCI
KDD Archive of Large Data Sets for Data Mining Research and Experimentation. SIGKDD
Explorations, 2. 2000.
Electrificacin Tamilnadu por Horas Lecturas Data Set 22/12/2013
Resumen: Estos datos se pueden producir con eficacia el resultado a menos de
parmetros del perfil de carga se puede reducir en la base de datos
Conjunto de datos Nmero de
Multivariante 45781 rea: Vida
Caractersticas: instancias:
La
Nmero
clasificacin, Valores
Tareas asociadas: N/A de Web 257
regresin, perdidos?
Accesos:
clustering
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Si usted no tiene ninguna peticin de citas especiales, por favor, deje este campo en
blanco.
Ayudante de Evaluacin Conjunto de Datos 07/06/1997
Resumen: Los datos consisten en evaluaciones de desempeo docente, las
puntuaciones son de "bajo", "medio" o "alto"
Conjunto de datos Nmero de
Multivariante 151 rea: N/A
Caractersticas: instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 42337
perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Loh, W.-Y. Y Shih, Y.-S. (1997). Dividir Mtodos de seleccin de rboles de clasificacin,
Statistica Snica 7:. 815-840 [Web Link] Lim, T.-S., Loh, W.-Y. Y Shih, Y.-S.(1999). Una
comparacin de la exactitud de prediccin, complejidad y tiempo de formacin de los
Treinta y tres del Antiguo y Nuevo Clasificacin Algoritmos. Aprendizaje
Automtico. ( [Web Link] o [Web Link] ) [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Ciruga Torcica de datos Conjunto de datos 11/13/2013
Resumen: Los datos se dedica a la clasificacin relativa a la esperanza de vida despus
de la operacin en los pacientes con cncer de pulmn problema: Clase 1 - muerte
dentro de un ao despus de la ciruga, clase 2 - supervivencia.
Conjunto de datos Nmero de
Multivariante 470 rea: Vida
Caractersticas: instancias:
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 4931
perdidos? A
Accesos:
Fuente:
Creadores: Marek Lubicz (1), Konrad Pawelczyk (2), Adam Rzechonek (2), Jerzy Kolodziej
(2)
- (1) Universidad Tecnolgica de Wroclaw, Wybrzeze Wyspianskiego 27, 50-370,
Breslavia, Polonia
- (2 ) Mdico de la Universidad de Wroclaw, Wybrzeze L. Pasteura 1, 50-367 Wroclaw,
Polonia Donante: Maciej Zieba ( maciej.zieba '@' pwr.wroc.pl ), Jakub M. Tomczak
( jakub.tomczak '@' pwr.wroc. j ), (48) 71 320 44 53 Fecha: noviembre de 2013
Atributo de la informacin:
Documentos pertinentes:
Ba Zia , M., Tomczak, JM, Lubicz, M., y wi ... tek, J. (2013). Impulsado SVM para la
extraccin de reglas a partir de los datos de desequilibrio en la aplicacin a la prediccin
de la esperanza de vida despus de la operacin en los pacientes con cncer de
pulmn. Applied Soft Computing. [Web Link]
- Resultados:
- Impulsado por SVM para datos desequilibrados obtuvo el valor Gmean igual 0.657,
- Las reglas de decisin inducidas utilizando Impulsado SVM como orculo ganaron el
valor Gmean igual 0,648.
Cita de pedidos:
Ba Zia , M., Tomczak, JM, Lubicz, M., y wi ... tek, J. (2013). Impulsado SVM para la
extraccin de reglas a partir de los datos de desequilibrio en la aplicacin a la prediccin
de la esperanza de vida despus de la operacin en los pacientes con cncer de pulmn. .
Applied Soft Computing [Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin N / A Web 54696
perdidos?
Accesos:
Fuente:
Ross Quinlan
# De Garavan Instituto
# Documentacin: segn lo dado por Ross Quinlan
# 6 bases de datos del Instituto Garavan en Sydney, Australia
# Aproximadamente lo siguiente para cada base de datos: ** 2800 la formacin (datos)
casos y 972 casos de prueba ** Un montn de datos que faltan * * 29 o ms atributos, ya
sea de Boole o continuamente valorada # 2 bases de datos adicionales, tambin de Ross
Quinlan, estn tambin aqu ** Hypothyroid.data y enfermo-euthyroid.data ** Quinlan
considera que estas bases de datos se han corrompido ** Su formato es muy similar a la
de otras bases de datos # 1 ms base de datos de 9.172 casos que cubren 20 clases y
una relacionada con la teora de dominio # Otra base de datos de la tiroides de Stefan
Aeberhard ** 3 clases, 215 casos, 5 atributos** No hay valores perdidos # base de datos
Una tiroides adecuado para formacin RNAs ** 3 clases ** 3772 instancias de
capacitacin, 3.428 instancias de prueba ** Incluye los datos de costes (donado por Peter
Turney)
Atributo de la informacin:
N/A
Documentos pertinentes:
Quinlan, JR, Compton, PJ, Horn, KA, y Lazurus, L. (1986). Adquisicin de conocimiento
inductivo: Un estudio de caso. En Actas de la Segunda Conferencia Australiana sobre
Aplicaciones de Sistemas Expertos. Sydney, Australia. [Web Link] Quinlan, JR (1986). La
induccin de rboles de decisin. Aprendizaje Automtico, 1, 81 -. 106[Web Link]
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 67978
perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Trenes Conjunto de Datos 1994-06-24
Resumen : 2 formatos de datos (estructurados, de una sola
instancia por lnea)
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 38976
perdidos? A
Accesos:
Fuente:
Notas: - "fondo" conocimiento adicional se facilita esta proporciona una ordenacin parcial
de algunos de los valores de los atributos. - Estamos ofreciendo este conjunto de datos,
tanto en su forma original y en una forma similar a los conjuntos de datos proposicionales
ms tpicos en nuestro repositorio. Dado que el conjunto de datos trenes registra las
relaciones entre atributos, esta transformacin fue algo difcil. Sin embargo, puede arrojar
un poco de conocimiento sobre este problema para las personas que estn ms
familiarizados con el formato simple de una sola instancia por lnea de datos. Jerarqua de
valores: if (cshape es uno de {openrect, opentrap, en forma de U, dblopnrect} entonces
cshape es tragante abierto if (cshape es uno de {hexgono, elipse, closedrect, jaggedtop,
slopetop, motor} entonces cshape closedtoptarea Prediccin: Determinar las reglas de
decisin concisas que distinguen los trenes que viajan hacia el este desde los que viajan
al oeste.
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Evaluacin Turkiye Student Data Set 2013-09-01
Nmero de
Clasificacin, Valores
Tareas asociadas: N/A Web 7614
Clustering perdidos?
Accesos:
Fuente:
Ernest Fokoue
Centro de Calidad y Estadstica Aplicada
del Instituto de Tecnologa de Rochester
98 Lomb Memorial Drive
Rochester, NY 14623, EE.UU.
EmaA l: epfeqa '@' rit.edu
Necla Gunduz
Departamento de Estadstica
de la Facultad de Ciencias, Universidad de Gazi
Teknikokullar, 06500 Ankara, Turqua
eMail: ngunduz '@' gazi.edu.tr
gunduznecla '@' yahoo.com
N/A
Atributo de la informacin:
Documentos pertinentes:
N/A
Cita de pedidos:
Valores Nmero de
Tareas asociadas: N/A No 22499
perdidos? Web Accesos:
Fuente:
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
Cita de pedidos:
Usted puede utilizar este material de forma gratuita para cualquier propsito educativo,
siempre y atribucin se da en cualquier conferencias o publicaciones que hacen uso de
este material.
Personajes UJI Pen Set Data 2007-06-01
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 32048
perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
UJI Pen Personajes (Versin 2) Conjunto de datos 2009-01-22
Nmero
Valores
Tareas asociadas: Clasificacin N/A de Web 26991
perdidos?
Accesos:
Fuente:
F. Prat (*), MJ Castro (+), D. Llorens (*), A. Marzal (*), y JM Vilar (*) * Departamento de
Lenguajes y Sistemas Informticos de la Universitat Jaume I (UJI), 12071 Castelln,
ESPAA + Departamento de Sistemas Informticos y Computacin de la Universidad
Politcnica de Valencia (UPV), 46071 Valencia, ESPAA fprat '@' lsi.uji.es diciembre
2008
Cada escritor contribuy con letras, dgitos y otros caracteres y se recogieron dos
muestras para cada par escritor / personaje. El lxico completo es el siguiente:
Este 'uji2.names'.
El archivo 'ujipenchars2.txt' contiene todas las muestras en un formato que se
describe ms adelante.
Atributo de la informacin:
/ / Char ASCII: U
Para los caracteres no ASCII (por ejemplo, una o minscula con acento agudo), la
identidad de caracteres se representan a travs de su nombre de la entidad
HTML:
WORD; trn_UJI_W03-01
NUMSTROKES 2
PUNTOS 9 541 1.001 541 1.001 540 987 540 987 530
977 530 977 530 977 530 977 530 977
PUNTOS 8 # 518 1227 500 1257 480 1291 470 1309 465
1318 458 1330 458 1330 471 1312
Documentos pertinentes:
D. Llorens et al, "El UJIpenchars Base de datos: una base de datos basada en el lpiz de
aislados caracteres escritos a mano.
Proc. de la 6 Conferencia Internacional sobre Recursos Lingsticos y Evaluacin. 2008.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Indocumentado Data Set N/A
Resumen: Varios conjuntos de datos sin la documentacin (no dude en explorar!)
Conjunto de datos N/ Nmero de N/
rea: N/A
Caractersticas: A instancias: A
Fuente:
N/A
N/A
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Universidad Data Set 1988-07-01
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 57130
perdidos?
Accesos:
Fuente:
Propietario original: desconocido Donante: Steve Souders < souders de '@' ads.com >
Atributo de la informacin:
1. Universidad-nombre
2. Estado
3. ubicacin
4. Control de
5. nmero-de-alumnos
6. masculino: femenino (ratio)
7. estudiante: profesores (ratio)
8. sb verbal
9. sat-matemticas
10. gastos
11. ciento-de ayuda financiera
12. nmero-de-solicitantes
13. ciento-entrada
14. ciento a inscribir
15. acadmicos
16. sociales
17. la calidad de vida
18. acadmico-nfasis
Documentos pertinentes:
Lebowitz M. "Concepto de aprendizaje en un rico dominio de entrada: memoria basada en
la generalizacin." Aprendizaje Automtico, Vol. 2, n 2, septiembre de 1987. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
UNIX datos de usuario Conjunto de Datos N/A
N
Caractersticas del Nmero de Fecha
N/A / N/A
atributo: atributos: Donado
A
N Nmero de
Valores
Tareas asociadas: N/A / Web 19461
perdidos?
A Accesos:
Fuente:
# Iniciar sesin 1
cd ~ / private / docs
ls-LAF | ms
de salida
de sesin # 1 End
sesin # Start 2
cd ~ / juegos /
xquake y
fg
vi scores.txt
mailx john_doe '@' somewhere.com salida
sesin # 2 Fin
SOF ** **
cd
ls
-LAF
ms
gato
>
<1>
exit
** EOF **
** ** SOF
cd
<1>
xquake
fg
vi
<1>
mailx
<1>
exit
** EOF **
Atributo de la informacin:
N/A
Documentos pertinentes:
N/A
Cita de pedidos:
Estos datos estn disponibles en condiciones de anonimato para los usuarios que
contribuyen y puede ser utilizado slo para fines de investigacin. Los resmenes y
resultados de investigacin que emplean estos datos pueden ser publicados, pero tokens
literales o secuencias simblicas de los datos no pueden ser publicados, excepto con el
consentimiento expreso de los autores de los datos. Ninguna parte de esta informacin
puede ser divulgada con o incluido en un producto comercial, ni ninguna parte de estos
datos puede vender o redistribuir con fines de lucro o como parte de un esfuerzo de lucro.
URL Reputacin Data Set 2009-10-15
Resumen: annimos de 120 das
subconjunto de los datos de URL
ICML-09 que contienen 2,4 millones
de ejemplos y 3,2 millones de
caractersticas.
Conjunto de
Multivariado, Nmero de
datos 2396130 rea: Ordenador
Time-Series instancias:
Caractersticas:
Nmero
Tareas Valores
Clasificacin N/A de Web 52357
asociadas: perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Los atributos son annimos, sino que corresponden al lxico y caractersticas basadas
en host recopilados para cada URL.
Documentos pertinentes:
N/A
Cita de pedidos: Si utiliza este conjunto de trabajos publicados de datos, por favor, cite
el documento ICML-09 en el que se introdujo por primera vez y describi: Justin Ma,
Lawrence K. Sal, Stefan Savage, y Geoffrey M. Voelker, Identificar URLs sospechosas:
una aplicacin de a gran escala de aprendizaje en lnea Actas de la Conferencia
Internacional sobre Aprendizaje Automtico (ICML), pginas 681 a 688, Montreal,
Quebec, junio de 2009.
Los datos del Censo de EE.UU. (1990) Conjunto de datos N/A
Nmero de
Valores
Tareas asociadas: Clustering N/A Web 47163
perdidos?
Accesos:
Fuente:
Los datos fueron recolectados como parte del censo de 1990. Hay 68 atributos
categricos. Este conjunto de datos se obtuvo a partir del conjunto de datos
USCensus1990raw. Los atributos se enumeran en la USCensus1990.attributes.txt
archivo (repetido a continuacin) y la codificacin de los valores se describen a
continuacin. Muchos de los atributos menos tiles en el conjunto de datos original se
han cado, las pocas variables continuas se han discretizado y las pocas variables
discretas que tienen un gran nmero de posibles valores se han derrumbado a tener
menos valores posibles. Ms especficamente, el conjunto de datos USCensus1990 se
obtuvo a partir de los datos USCensus1990raw fijados por la siguiente secuencia de
operaciones; - La asignacin al azar:. El orden de los casos en los datos originales
USCensus1990raw establecidos fueron permutada al azar - Seleccin de atributos: Los
68 atributos incluidos en el conjunto de datos se dan a continuacin. En el conjunto de
datos USCensus1990 hemos aadido una sola letra prefijo al nombre original. Aadimos
la letra i para indicar que los valores de los atributos originales se utilizan y 'd' para
indicar que los valores de los atributos originales para cada caso han sido asignadas a
los nuevos valores (el mapeo preciso se describe ms adelante).Jerarquas de los
valores estn dentro de la USCensus1990raw.coding.htm archivo y las funciones de
asignacin utilizado para transformar la USCensus1990raw a los conjuntos de datos
USCensus1990 estn dando en el archivo USCensus1990.mapping.sql. Los datos estn
contenidos en un archivo llamado USCensus1990.data.txt. La primera fila contiene la
lista de atributos. El primer atributo es un caseID y debera ser ignorado durante el
anlisis. Los datos estn delimitados por comas con un caso por cada fila.
Atributo de la informacin:
-------------------------------------------------- ------------
Antigua Nueva Variable Variable
---------------------------------- ----------------------------
Edad dage
Ancstry1 dAncstry1
Ancstry2 dAncstry2
Disponibilidad iAvail
Citizen iCitizen
Clase iClass
Salir dDepart
Disabl1 iDisabl1
Disabl2 iDisabl2
Ingls iEnglish
Feb55 iFeb55
Fertil iFertil
hispana dHispanic
Hour89 dHour89
Horas dHours
inmigr iImmigr
renta1 dIncome1
ingresos2 dIncome2
ingresos3 dIncome3
Income4 dIncome4
Income5 dIncome5
Income6 dIncome6
Income7 dIncome7
Income8 dIncome8
Industria dIndustry
Corea iKorean
Lang1 iLang1
Looking iLooking
civil iMarital
May75880 iMay75880
Medios iMeans
Militar iMilitary
Movilidad iMobility
Mobillim iMobillim
Occup dOccup
Othrserv iOthrserv
Perscare iPerscare
POB dPOB
Pobreza dPoverty
Pwgt1 dPwgt1
Ragechld iRagechld
Rearning dRearning
Relat1 iRelat1
Relat2 iRelat2
Remplpar iRemplpar
Riders iRiders
Rlabor iRlabor
Rownchld iRownchld
Rpincome dRpincome
rpoB iRPOB
Rrelchld iRrelchld
Rspouse iRspouse
Rvetserv iRvetserv
School iSchool
Sept80 iSept80
Sexo ISEX
Subfam1 iSubfam1
Subfam2 iSubfam2
Tmpabsnt iTmpabsnt
Travtime dTravtime
Vietnam iVietnam
Week89 dWeek89
Work89 iWork89
Worklwk iWorklwk
WWII iWWII
Yearsch iYearsch
Yearwrk iYearwrk
Yrsserv dYrsserv Mapping: En este paso hacemos un mapa de todos los viejos valores
para las variables con el prefijo 'd' a los nuevos valores. Las asignaciones para las
variables dAncstry1, dAncstry2, dHispanic, dIndustry, dOccup, dPOB fueron diseados
para corresponder a un engrosamiento natural de los valores originales, basadas en la
informacin en el coding.htm archivo. El resto de variables son variables valoradas
continuos y la asignacin para estas variables fue elegido para hacer que las variables
que fueron distribuidos de manera bastante uniforme a travs de los Estados
(cuantiles). Las asignaciones precisas se especifican en el archivo
USCensus1990.mapping.sql. Este archivo contiene todos los procedimientos de T-SQL
que se utilizan para asignar las variables. Estos procedimientos se pueden utilizar
directamente en SQL Server para asignar los valores originales o traducida a otra
lengua. ------------------------------ -------------------------------- Procedimiento Variable ------------
---- ---------------------------------------------- dage discAge dAncstry1 discAncstry1 dAncstry2
discAncstry2 dHispanic discHispanic dHour89 discHour89 dHours discHours dIncome1
discIncome1 dIncome2 discIncome2to8 dIncome3 discIncome2to8 dIncome4
discIncome2to8 dIncome5 discIncome2to8 dIncome6 discIncome2to8 dIncome7
discIncome2to8 dIncome8 discIncome2to8 dIndustry discIndustry dOccup
discOccup dPOB discPOB dPoverty discPoverty dPwgt1 discPwgt1 dRearning
discRearning dRpincome discRpincome dTravtime discTravtime dWeek89
discWeek89 dYrsserv discYrsserv
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Identificacin del usuario de caminar Actividad Data Set 02/03/2014
Resumen: El conjunto de datos recoge datos de un smartphone Android colocado en
el bolsillo del pecho de 22 participantes que caminan en la naturaleza a travs de una
ruta predefinida.
Univariante, N
Conjunto de datos Nmero de
Secuencial, / rea: N/A
Caractersticas: instancias:
Time-Series A
N
Caractersticas del Nmero de Fecha
Real / 02/03/2014
atributo: atributos: Donado
A
N Nmero de
Clasificacin, Valores
Tareas asociadas: / Web 629
Clustering perdidos?
A Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Nmero de
Clasificacin, Valores N/
Tareas asociadas: Web 12883
Clustering perdidos? A
Accesos:
Fuente:
Atributo de la informacin:
STG (El grado de tiempo de estudio para materails objeto gol), (valor de entrada)
SCG (El grado de repeticin de nmero de usuario para materails objeto meta) (valor de
entrada)
STR (El grado de tiempo de estudio de usuario para los objetos relacionados con el
objeto meta ) (valor de entrada)
LPR (El rendimiento en los exmenes de usuario para los objetos relacionados con el
objeto meta) (valor de entrada)
PEG (El rendimiento en los exmenes de usuario para los objetos meta) (valor de
entrada)
UNS (el nivel de conocimiento del usuario) (valor objetivo)
Muy baja: 50
Baja: 129
Media: 122
Alto 130
Documentos pertinentes:
Cita de pedidos:
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 4059
perdidos? A
Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Ninguno
Cita de pedidos:
Christoph Riedl, Richard Zanibbi, Mart A. Hearst, Siyu Zhu, Michael Minetti, Kevin J.
Boudreau, Jason Crusan, Ivan Metelsky, y Karim R. Lakhani, "Deteccin de figuras y
etiquetas de la parte de Patentes: Una
Competencia Desarrollo Basado de Imagen Procesamiento de Algoritmos, papel 'de
trabajo.
Columna vertebral del conjunto de datos 2011-08-09
Resumen: El conjunto de datos que contiene los valores de seis caractersticas
biomecnicas utilizadas para clasificar a los pacientes ortopdicos en 3 clases (, hernia
de disco normal o spondilolysthesis) o 2 clases (normal o anormal).
Conjunto de datos Nmero de
Multivariante 310 rea: N/A
Caractersticas: instancias:
Nmero de
Valores N/
Tareas asociadas: Clasificacin Web 41874
perdidos? A
Accesos:
Fuente:
Conjunto de datos biomdica integrada por el Dr. Henrique da Mota, durante un perodo
de residencia mdica en el Grupo de Investigacin Aplicada en Ortopedia (GARO) del
Centro M dico-Quirrgica de R adaptacin des Massues, Lyon, Francia. Los
datos se han organizado en dos tareas de clasificacin diferentes, pero relacionados. La
primera tarea consiste en clasificar a los pacientes como pertenecientes a una de tres
categoras: Normal (100 pacientes), Hernia de Disco (60 pacientes) o espondilolistesis
(150 pacientes).Para la segunda tarea, las categoras de disco Hernia y
Espondilolistesis se fusionaron en una sola categora denominada como "anormal". Por
lo tanto, la segunda tarea consiste en clasificar a los pacientes como pertenecientes a
una de dos categoras: Normal (100 pacientes) o anormales (210
pacientes). Proporcionamos archivos tambin para su uso en el entorno WEKA.
Atributo de la informacin:
Documentos pertinentes:
(1) Berthonnaud, E., Dimnet, J., Roussouly, P. & Labelle, H. (2005). 'Anlisis del
equilibrio sagital de la columna y la pelvis utilizando parmetros de forma y orientacin',
Revista de Trastornos y Tcnicas de la Columna Vertebral, 18 (1): 40 "47. (2) Rocha
Neto, AR & Barreto, GA (2009). 'En la Aplicacin de Conjuntos de Clasificadores al
diagnstico de patologas de la columna vertebral: un anlisis comparativo ".,
Transacciones IEEE Amrica Latina, 7 (4) :487-496 (3) Rocha Neto, AR, Sousa, R.,
Barreto, GA y Cardoso, JS (2011)."Diagnstico de Patologa de la Columna Vertebral
con Embedded Rechazar Optiona ?, Actas de la quinta Conferencia Ibrica de
Reconocimiento de Formas y Anlisis de Imgenes (IbPRIA'2011), Gran Canaria,
Espaa, Lecture Notes en Ciencias de la Computacin, vol. 6669, p. 588-595.
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Vicon Set Datos de accin fsica Conjunto de Datos 2011-07-27
Resumen: El Conjunto de Datos accin fsica incluye 10 normales y 10 acciones
fsicas agresivas que miden la actividad humana. Los datos han sido recogidos por 10
sujetos usando el tracker Vicon 3D.
Conjunto de datos Series de Nmero de
3000 rea: Fsico
Caractersticas: Tiempo instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin N / A Web 18483
perdidos?
Accesos:
Fuente:
Theo Theodoridis
Facultad de Ciencias de la Computacin e Ingeniera Electrnica
de la Universidad de Essex
Wivenhoe Park, Colchester, 3SQ CO4, Reino
Unido ttheod '@' gmail.com http://sites.google.com/site/ttheod/
1. Protocolo:
Siete hombres y tres mujeres sujetos (de 25 aos y el 30), que han sufrido la agresin
en escenarios tales
como peleas fsicas, particip en el experimento. A lo largo de 20 experimentos
individuales, cada sujeto
tena que realizar diez normal y diez actividades agresivas. En cuanto a los derechos de
los sujetos involucrados,
regulaciones ticas se han seguido basndose en el cdigo de tica de la Sociedad
Britnica de Psicologa,
que explica las legislaciones ticas para llevar a cabo experimentos estadsticos
utilizando sujetos humanos. Para la seguridad
cuestiones de precaucin, abrigos de la mano del boxeo se han dado a los sujetos, y
para el calentamiento de los sujetos
fueron instruidos para familiarizarse con la bolsa por tener un nmero de ejecuciones de
prueba. Los sujetos eran conscientes de que
, ya que su participacin en esta serie de experimentos fue voluntaria, se dej en claro
que podan
retirarse en cualquier momento del estudio. 2. Instrumentacin: La arena robtico Essex
fue la principal sala experimental donde la recoleccin de datos se llev a cabo. Con
rea de 4x5.5m, los diez sujetos expresaron actividades fsicas normales y agresivos en
lugares al azar. Para las acciones normales, un compaero humano se ha utilizado
como un objetivo de enfoque atraer la atencin de los sujetos con el fin de realizar la
actividad ms realista. Para las acciones agresivas, los sujetos hicieron uso de un
profesional de la bolsa de pie kick-boxing, 1.75m de altura, con una figura humana
dibujada en su cuerpo. La bolsa tiene forma cilndrica hecha de material blando, lo que
podra rebotar cuando es golpeado. Todas las actividades se han registrado de
azar posiciones de partida de modo que para tener una variedad de datos 3D
espaciales. El rendimiento subjects ha sido registrado por nueve cmaras
omnipresentes del s Vicona, interfaces actividad humana con coordenadas
espaciales puntos. En base a este contexto, el proceso de adquisicin de datos implic
cuatro marcadores reflectable colocados en los antebrazos (codos y muecas), cuatro
en las patas delanteras (rodillas y tobillos), y uno en la parte superior de la
cabeza. 3. Configuracin de datos: Cada ensayo experimental se ha tomado por
separado para cada actividad fsica. La duracin de cada accin fue de
aproximadamente ~ 10 segundos por sujeto, lo que corresponde a una serie de tiempo
de ~ 3000 muestras, con frecuencia de muestreo de 200Hz. Dentro de este tiempo de
funcionamiento, aproximadamente 15 trayectorias de accin fueron extrados de conteo
en promedio 15 normal (ej: establecimiento de conexin), y 15 agresivos: acciones (ex
perforacin).
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Los volcanes en Venus - JARtool experimento Conjunto de datos N/A
Resumen: El proyecto JARtool fue un esfuerzo pionero para
desarrollar un sistema automtico para la catalogacin de los
pequeos volcanes en el amplio conjunto de imgenes Venus
devueltos por la nave espacial Magallanes.
Nmero de
Valores
Tareas asociadas: Clasificacin S Web 15093
perdidos?
Accesos:
Fuente:
Michael C. Burl
MS 126-347, JPL
4800 Oak Grove Drive
Pasadena, CA 91109
(818) 393-5345 Michael.C.Burl '@' jpl.nasa.gov http://www-aig.jpl.nasa.gov / mls / home
/ burl /
Los datos fueron recogidos por la nave espacial Magallanes durante un perodo de
aproximadamente cuatro anual de 1990 - 1994. El objetivo de la misin era obtener la
cartografa global de la superficie de Venus utilizando un radar de apertura sinttica
(SAR). Un anlisis ms detallado de la misin y objetivos se encuentra disponible en la
pgina web de Magellan del JPL. Existen algunas dependencias espaciales. Por
ejemplo, los parches de fondo con una imagen nica es probable que sean ms
similares que los parches de fondo tomadas a travs de diferentes imgenes. Adems
de las imgenes, hay archivos "verdad terreno" que especifican la ubicacin de los
volcanes en las imgenes. Las comillas en "verdad terreno" pretenden ser un
recordatorio de que no hay verdad absoluta del suelo para este conjunto de datos. Nadie
ha sido la de Venus y la calidad de la imagen no permite el 100%, la identificacin
inequvoca de los volcanes, incluso para los expertos humanos. Hay etiquetas que
proporcionan cierto grado de incertidumbre subjetiva (1 = definitivamente un volcn, 2 =
probablemente, 3 = posiblemente, 4 = slo un pozo es visible). Vase la referencia
[Smyth95] para ms informacin sobre el problema de la incertidumbre de
etiquetado. Tambin hay archivos que especifican el conjunto exacto de experimentos
utilizando en las evaluaciones publicadas del sistema JARtool. Los archivos de
imgenes se encuentran en un formato llamado VIEW. Este formato consta de dos
archivos, un archivo binario con la extensin. Sdt (los datos de imagen) y un archivo
ASCII con extensin. Spr (informacin de la cabecera). Hay una funcin de utilidad de
MATLAB incluido en el paquete de datos que se puede utilizar para leer los datos. Si
quieres usar algo distinto al Matlab, ests por tu cuenta, pero el formato es bastante
sencillo y pueda ser comprendido por mirar el cdigo Matlab. Los archivos de etiquetado
se presentan en dos formas. Los archivos lxyr. Son simples ASCII que contiene la
etiqueta separada por espacios, x-ubicacin del centro, y-ubicacin del centro y el radio.
Atributo de la informacin:
Las imgenes son 1024X1024 pxeles. Los valores de pxeles estn en el rango
[0255]. El valor de pxel est relacionada con la cantidad de energa retrodispersada al
radar desde una ubicacin espacial dada. Valores de los pxeles ms altos indican una
mayor retrodispersin. Valores de pxel ms bajos indican menor retrodispersin. Tanto
la topografa y la rugosidad de la superficie en relacin con la longitud de onda de radar
afectan la cantidad de retrodispersin.
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Wall-Tras Robot navegacin Conjunto de datos Datos 2010-08-04
Resumen: Los datos se recogieron como el robot G5 SCITOS navega a travs de la
sala siguiendo la pared hacia la derecha, para 4 rondas, con 24 sensores de
ultrasonidos dispuestas circularmente alrededor de su cintura.
Conjunto de datos Multivariante, Nmero de
5456 rea: Ordenador
Caractersticas: Secuencial instancias:
Nmero
Valores
Tareas asociadas: Clasificacin N/A de Web 20502
perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Nmero de Atributos
- sensor_readings_24.data: 24 atributos numricos y la clase.
- sensor_readings_4.data:. 4 atributos numricos y la clase
. - sensor_readings_2.data: 2 atributos numricos y la clase para cada atributo: -
sensor_readings_24 archivo . datos: 1. US1: sensor de ultrasonido en la parte delantera
del robot (ngulo de referencia: 180 ) - (numrico: real) 2. US2: Ecografa lectura
(ngulo de referencia:-165A ) - (numrico: real) 3. US3: Ecografa lectura (ngulo de
referencia:-150 ) - (numrico: real) 4. US4: Ecografa lectura (ngulo de referencia:-
135A ) - (numrico: real) 5. US5: Ecografa lectura (ngulo de referencia:-120A ) -
(numrico: real) 6. US6: Ecografa lectura (ngulo de referencia:-105 ) - (numrico:
real) 7. US7: (ngulo referencia: 90 ) ultrasonido leyendo - (numrico Bienes) 8. US8:
(ngulo de referencia:-75 ) ultrasonido lectura - (numrico: real) 9. US9: Ecografa
lectura (ngulo de referencia:-60 ) - (numrico: real) 10. US10: Ecografa lectura
(ngulo de referencia: -45 ) - (numrico: real) 11. US11: Ecografa lectura (ngulo de
Referencia:-30 ) - (numrico: real) 12. US12: Ecografa lectura (ngulo de referencia:-
15 ) - (numrico: real) 13. US13: lectura del sensor de ultrasonidos situados en la
parte trasera del robot (ngulo de referencia: 0 ) - (numrico: real) 14. US14: ecografa
lectura (ngulo de referencia: 15 ) - (numrico: real) 15. US15: Ecografa lectura
(ngulo de referencia: 30 ) - (numrico: real) 16. US16: Ecografa lectura (ngulo de
referencia: 45 ) - (numrico: real) 17. US17: Ecografa lectura (ngulo de referencia:
60 ) - (numrico: real) 18. US18: ecografa lectura (ngulo de referencia: 75 ) -
(numrico: real) 19. US19: Ecografa lectura (ngulo de referencia: 90 ) - (numrico:
real) 20. US20: Ecografa lectura (ngulo de referencia: 105 ) - (numrico:
real) 21. US21: Ecografa lectura (ngulo de referencia: visin 120 ) - (numrico:
real) 22. US22: Ecografa lectura (ngulo de referencia: 135A ) - (numrico:
real) 23. US23: Ecografa lectura (ngulo de referencia: 150 ) - (numrico:
real) 24. US24: Ecografa lectura (ngulo de referencia: 165A ) - (numrico:
real) 25. Clase: - Mover-Forward - Ligero-Derecha-Turn - Sharp-Derecha-Turn - Ligero-
Izquierda-Turn - sensor_readings_4.data archivo: 1. SD_front: Sensor mnima lectura
dentro de un arco de 60 grados en la parte delantera del robot - (numrico:
real) 2. SD_left: Sensor mnima lectura dentro de un arco de 60 grados situado a la
izquierda del robot - (numrico: real) 3. SD_right: Sensor mnima lectura dentro de un
arco de 60 grados situado a la derecha del robot - (numrico: real) 4. SD_back: Sensor
mnima lectura dentro de un arco de 60 grados en la parte posterior del robot -
(numrico: real) 5. Clase: - Mover-Forward - Ligero-Derecha-Turn - Sharp-Derecha-
Turn - Ligero-Izquierda-Turn - sensor_readings_2.data archivo: 1. SD_front: Sensor
mnima lectura dentro de un arco de 60 grados en la parte delantera del robot -
(numrico: real) 2. SD_left: Sensor mnima lectura dentro de un arco de 60 grados
situado a la izquierda del robot - (numrico: real) 3. Clase: - Mover-Forward - Ligero-
Derecha-Turn - Sharp-Derecha-Turn - Ligero-Izquierda-Turn
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Tratamiento de Aguas Planta de conjunto de datos 1993-06-01
Resumen : Varias clases predicen estado de la central
Conjunto de datos Nmero de
Multivariante 527 rea: Fsico
Caractersticas: instancias:
Nmero de
Valores N/
Tareas asociadas: Clustering Web 44121
perdidos? A
Accesos:
Fuente:
Creadores: Manel Poch ( igte2 '@' cc.uab.es ) Unitat d'Enginyeria Qumica Universitat
Autnoma de Barcelona. Bellaterra. De Barcelona; Espaa Donante: Javier Bjar y
Ulises Corts ( bejar '@' lsi.upc.es ) Dept. Llenguatges i Sistemes
Informatics, Universitat Politcnica de Catalunya. De Barcelona; Espaa
Este conjunto de datos proviene de las medidas diarias de sensores en una planta de
tratamiento de aguas residuales urbanas. El objetivo es clasificar el estado de
funcionamiento de la planta con el fin de predecir fallos a travs de las variables de
estado de la planta a cada una de las etapas del proceso de tratamiento. Este dominio
ha sido declarado como un dominio mal estructurado.
Atributo de la informacin:
Documentos pertinentes:
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Generador de forma de onda de base de datos (versin 1) 1988-11-10
Conjunto de datos
Resumen dominios de forma de onda del carro del libro:
Conjunto de datos Multivariante, Nmero de
5000 rea: Fsico
Caractersticas: Data-Generator instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 25621
perdidos?
Accesos:
Fuente:
Propietarios Original: . Breiman, L. Friedman, JH, Olshen, RA, y piedra, CJ (1984) Los
rboles de clasificacin y regresin. Wadsworth Internacional Grupo: Belmont,
California. . (Ver pginas 43-49) Donante: David Aja
Notas:
- 3 clases de ondas
- 21 atributos, todos los cuales incluyen el ruido
- Ver el libro para obtener ms informacin (49-55, 169)
- waveform.data.Z contiene 5.000 casos
Atributo de la informacin:
Documentos pertinentes:
Leo Breiman, Jerome H. Friedman, Adam Olshen, Jonathan Stone. "Los rboles de
clasificacin y regresin." De 1984. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Generador de forma de onda de base de datos (versin 2) 1988-11-10
Conjunto de datos
Resumen: dominios de forma de onda del carro del libro:
Conjunto de datos Multivariante, Nmero de
5000 rea: Fsico
Caractersticas: Data-Generator instancias:
Nmero de
Valores
Tareas asociadas: Clasificacin No Web 20408
perdidos?
Accesos:
Fuente:
Propietarios Original: . Breiman, L. Friedman, JH, Olshen, RA, y piedra, CJ (1984) Los
rboles de clasificacin y regresin. Wadsworth Internacional Grupo: Belmont,
California. . (Ver pginas 43-49) Donante: David Aja
Notas:
- 3 clases de ondas
- 40 atributos, todos los cuales incluyen el ruido
- Los ltimos 19 atributos son todos los atributos de ruido con media 0 y varianza 1
- Ver el libro para obtener ms informacin (49-55, 169)
- forma de onda-+ noise.data.Z contiene 5.000 casos
Atributo de la informacin:
Documentos pertinentes:
Leo Breiman, Jerome H. Friedman, Adam Olshen, Jonathan Stone. "Los rboles de
clasificacin y regresin." De 1984. [Web Link]
Cita de pedidos:
Por favor, consulte la Gua del Aprendizaje Repositorio mquina poltica de la citacin
Wearable Computing: Clasificacin de las posturas del cuerpo y 09/04/2013
los movimientos (PUC-Rio) Conjunto de datos
Resumen: Un conjunto de datos con 5 clases (sentado-abajo, de pie plano, pie,
caminar y sentarse) recolectadas en 8 horas de actividades de 4 sujetos
sanos. Tambin establecimos un ndice de rendimiento de referencia.
Conjunto de
Nmero de
datos Secuencial 165632 rea: Ordenador
instancias:
Caractersticas:
Nmero
Valores
Tareas asociadas: Clasificacin N/A de Web 5804
perdidos?
Accesos:
Fuente:
Atributo de la informacin:
Documentos pertinentes:
Ugulino, W.; Cardador, D.; Vega, K.; Velloso, E.; MILIDIU, R.; Fuks, H. Wearable
Computing: Clasificacin de Datos de posturas corporales y movimientos
acelermetros. Actas del Simposio Brasileo 21a en Inteligencia Artificial. Los avances
en inteligencia artificial - EISB 2012. En: Lecture Notes in Computer Science. , Pp 52-
61. Curitiba, PR: Springer Berlin / Heidelberg, 2012. ISBN 978-3-642-34458-9. DOI:
10.1007/978-3-642-34459-6_6.
Disponible en: [Web Link]
Cita de pedidos:
Si utiliza este conjunto de datos, por favor, cite el documento anterior (Wearable
Computing: Clasificacin de Datos Acelermetros "de las posturas del cuerpo y
movimientos). Tambin podemos ofrecer ms informacin si usted necesita, apenas nos
cae una lnea (wugulino 'a' "punto" PUC-Rio "punto" inf ancho).