Академический Документы
Профессиональный Документы
Культура Документы
Crespo Romero
Acadmico e Investigador
Universidad Bernardo OHiggins
11 de Agosto de 2017
La teora moderna de la comunicacin
nace en 1948 con el paper A
Mathematical Theory of
Communication de Claude Shannon.
De la termodinmica toma prestado el
concepto de Entropa, y lo define para la
comunicacin.
En ese paper acu el termin bit para
unidad bsica de informacin.
Una vez desarrollados los computadores
de propsito general comienzan los
lenguajes de programacin.
Y con ello en los aos 1960 la
construccin de las primeras bases de
datos
1962 John Tukey el futuro del anlisis de
datos a partir de los programas
almacenados en computadores.
1974, Peter Naur publica Concise Survey
of Computer Methods. Hace un vistazo
de aplicaciones, a partir de los datos
definidos en International Federation for
Information Processing
(http://www.ifip.org/):
Dato es una representacin de hechos o ideas en una
forma formalizada capaz de ser comunicada o
manipulada por algn proceso-
Datalogy.
Data Science: Es la ciencia en relacin con los datos
para lo que ellos representan delegados a otros
campos o ciencias.
En 1977, se establece una seccin en el
International Statistical Institute para la
computacin estadstica (IASC): Con la misin de
unir las metodologas tradicionales estadsticas, los
computadores modernos, y el conocimiento de los
expertos para convertir los datos en informacin y
conocimiento.
En 1989, se organiza el primer workshop the
Descubrimiento de Conocimiento en Bases de datos
(KDD).
1994, Septiembre. Businesss Week, publica el Database
Marketing donde las bases de datos son utilizadas para
predecir cuan verosmil es comprar un producto.
En 1996 se incluye el trmino data science en el ttulo
de la conferencia de la International Federation of
Classification Societies (IFCS).
En 1996 Usama Fayyad, Gregory Piatetsky-Shapiro y
Padhraic Smyth publican Del Data Mining al
Descubrimiento de Conocimiento en Bases de Datos.
En 1989, se organiza el primer workshop the
Descubrimiento de Conocimiento en Bases de datos
(KDD).
1994, Septiembre. Businesss Week, publica el Database
Marketing donde las bases de datos son utilizadas para
predecir cuan verosmil es comprar un producto.
En 1996 se incluye el trmino data science en el ttulo
de la conferencia de la International Federation of
Classification Societies (IFCS).
En 1996 Usama Fayyad, Gregory Piatetsky-Shapiro y
Padhraic Smyth publican Del Data Mining al
Descubrimiento de Conocimiento en Bases de Datos.
Jeff Wu en 1997 invita a renombrar los estadsticos
como cientficos de datos.
1997 el Data Mining se vuelve popular como
extraer informacin de grandes bases de datos.
Jacob Zahavi llama en 1999 a buscar nuevos
mtodos para analizar grandes cantidades de datos
ya que los mtodos clsicos trabajan bien con
nmeros pequeos de datos.
El 2001 William Cleveland plantea que debe haber
un cambio en la ciencia de datos. Propone una
nueva disciplina en el contexto de las ciencias
informticas y los resultados del data mining: ya
que los resultados han sido limitados, porque:
Los conocimientos de los estadsticos es limitado en
ambientes computacionales,
Y los expertos en computacin piensan abordan el anlisis
de datos desde una forma limitada.
El 2001 Breiman, muestra que la comunidad estadstica
est restringida, haciendo cosas irrelevantes. El logro es
usar datos para resolver problemas complejos.
2002 se inicia en Data Science Journal.
http://www.codata.org/ .
2003 inicio de Journal of Data Science: Cada cosa con
datos: colectar, analizar, modelar, y desarrollar
cualquier tipo de aplicaciones.
2005 Thomas Davenport, Don Cohen y Al Jacobson
Competencias en Analtica.
2005 National Science Board: public Long-lived
Digital Data Collections: Enabling Research and
Education in the 21st Century. Con el fin de
incrementar cientficos de datos de alta calidad, con el
fin de usar las colecciones de datos digitales.
2007 Se inaugura: http://www.dataology.fudan.edu.cn/
2008: The Skills, Role & Career Structure of Data
Scientists & Curators: Assessment of Current Practice &
Future Needs,: los cientficos de datos son capaces de
agregar analisis y consultas creativas.
2009 Harnessing the Power of Digital Data for Science
and Society: La necesidad de especialistas en datos.
2009: Hal Varian: Los cientficos de datos sern el
trabajo ms sexy en los prximos 10 aos. La habilidad
para tomar datos: Entenderlos, procesarlos, extraerlos,
accesarlos, comunicar sus logros, es extremadamente
importante.
2010: Se publica que es la ciencia de los datos?
por Mike Loukides: Los cientficos de datos
combinan emprendimiento, capacidad de construir
productos incrementalmente, la habilidad para
explorar, e iterar sobre una solucin.
Interdisciplinario.
Y pensar fuera de la caja e ir a nuevas vas para ver el
problema.
2010: Hilary Mason y Chris Wiggins: Taxonoma de
Ciencia de los Datos:
2010: Drew Conway el Diagrama de Venn de
Ciencias de los Datos:
El trabajo ms sexy del s. XXI:
https://hbr.org/2012/10/data-scientist-the-
sexiest-job-of-the-21st-century/ar/pr
Dato: Representacin comunicable.
Cada representacin agrega o quita mayor
informacin, por lo tanto, la entropa que entrega
no es equivalente.
De la ciencia de los datos a la analtica.
Se reconoce a la analtica como:
Un proceso completo para toma de
decisiones y resolver problemas de
negocios (Ms all de la Inteligencia de
Negocios).
Un amplio conjunto de metodologas
analticas que permiten la creacin de
valor en negocios.
Esta definida por tres categoras:
Analtica descriptiva:
Prepara y analiza datos histricos.
Identifica patrones desde muestras para reportar
tendencias.
Analtica Predictiva:
Predice probabilidades y tendencias futuras.
Encuentra relaciones en los datos que no son
aparentemente ledas con el anlisis descriptivo.
Analtica Preceptiva:
Evala y determina nuevas vas para operar.
Coloca objetivos de negocio alcanzables.
Balancea las restricciones.
Porque el surgimiento de sta rea
requiere de nuevas habilidades
tcnicas:
No basta con conocer las herramientas o
tecnologas (eso podra hacerlo un informtico).
Ni en usar las herramientas (Podra hacerlo un
estadstico, vimos el tema deanaltica
descriptiva).
Se requiere la habilidad de integrar las
herramientas con resultados futuros y la
competitividad de la organizacin (Visin
sistmica).
Jeffrey L. Whitten y Lonnie D. Bentley:
Analista
De TI
Tecnologas
Negocios de la
informacin