Вы находитесь на странице: 1из 5

En el año 2009, un nuevo virus de gripe fue descubierto.

Esta nueva enfermedad, denominada H1N1 se


expandió rápido. Los expertos del tema ya comentaban un brote de la misma escala del que se vivió en
1918, que contagió a casi quinientos millones de personas y mató a 10 millones. Sin embargo, unas
semanas antes de que el H1N1 fuera una noticia contundente, ingenieros de Google publicaron una
artículo en la revista nature que explicaba que el buscador Google podría anticipar el brote de otras
enfermedades, no solo a nivel nacional, sino estatal. Todo esto revisando lo que la gente está buscando en
internet.

Durante los últimos años, la cantidad de datos creados a aumentado exponencialmente. Aproximadamente
más de 30,000 GB de datos son generados cada segundo y el crecimiento de esta solo acelera. Muchas
veces se ha tratado de calcular la cantidad de información que nos rodea para predecir qué tan rápido
crece. Martin Hilbert de la Universidad del Sur de California Annenberg School for communication and
Journalism trató de ponerle una cifra a todo material producido, almacenado y comunicado. Esta
información abarca no solo libros, pinturas, correos y música, sino videojuegos, llamadas telefónicas y
hasta rutas de navegación. De acuerdo con su cálculo, en el 2007 había aproximadamente 300 exabytes de
información (un exabyte tiene alrededor de mil millones de gigabytes). Para saber aproximadamente de
cuanto material estamos hablando, hay que pensarlo de la siguiente manera: la gran Biblioteca de
Alejandría contenía, antes de su destrucción, aproximadamente 90,000 ejemplares. Entonces, la cantidad
de información con la que contamos hoy en día es equivalente a repartir 320 Bibliotecas de Alejandría a
cada ciudadano del mundo.

Big Data (macrodatos, por su traducción en español) en sí no cuenta con ninguna definición formal.
Cuando se desarrolló el término en la década de los 80-90 se refería a que el volumen de determinada
información había crecido tanto que la cantidad a examinar era tan grande que ya no era posible
almacenarla en una memoria normal. Sin embargo, hace 30 años no se lograba apreciar la mina de oro en
la que nos encontrábamos sentados. Caímos en la cuenta, como dice Mayer (2013) “la revolución de
verdad no son las máquinas que calculan la información, sino la información en sí y la manera de
ocuparla” (pag. 7). La cuestión es lo que uno puede hacer con la recopilación de información a gran
escala para producir ideas útiles o bienes y servicios de gran valor. Hoy en día esta nueva manera de ver
las cosas se considera como una parte de la ciencia computacional perteneciente a la inteligencia artificial.
En realidad, con la Big Data, no se pretende que el computador piense como un ser humano, sino que se
busca aplicar la probabilidad en grandes cantidades de datos para determinar si un libro te puede gustar
más que otro, si un correo en tu bandeja de entrada es spam, cuando es más probable que compres
determinado producto.

El objetivo del big data es convertir el dato en información que facilita la toma de decisiones. Las
empresas utilizan la Big data para entender el perfil, las necesidades y el sentir de sus clientes respecto a
los productos y/o servicios vendidos.

Big Data incluye cuatro conceptos: El volumen, que es el tipo y detalle de la data; la velocidad en que es
recolectada; la variedad de datos y su veracidad.
Existen diversos modelos computacionales para tratar con datos:
● Extracción de data: Utiliza información existente y analitica de datos para buscar por patrones
escondidos o emergentes para así explicar un fenómeno en particular.
● Redes neuronales artificiales: Crea sentido a la entrada de datos para así crear futuras
predicciones, reduce el ruido en los datos y clasifica eventos.
● Machine learning-: Usa algoritmos para construir modelos que aclaren las conexiones entre las
relaciones, hace supersticiones y aplica lo que ha aprendido para así hacer futuras predicciones.

Big Data se basa en la recolección de datos de las personas para obtener información, esto se logra a
través de sistemas especiales que tienen como principales características las siguientes:
1. Información: Es la colección de conocimientos relevantes para tu sistema.
2. Datos: Se refiere a la información que no se puede derivar de nada más
3. Consultas: Son preguntas que te haces para obtener tus datos
4. Vistas: Informacion que es derivada de tu base de datos.

La manera en la que todos estos datos son evaluados ha sido un verdadero problema entre la comunidad
científica. En un inicio, se cayó en la cuenta de que la aleatoriedad total era lo suficientemente exacta (una
varianza del 3%) al elegir una muestra del conjunto. Sin embargo, tiene sus desventajas. Supongamos que
eres un matemático que quiso predecir quién iba a gana las elecciones presidenciales en México. En un
inicio, mandabas encuestas vía Facebook para determinar el ganador, pero ahí caíste en la cuenta que el
70% de los usuarios mexicanos son jóvenes, dejando a la comunidad adulta a un lado. De aquí empezaste
a hacer encuestas de hogar a hogar, pero olvidas que la opinión de un municipio, es distinta a la de otro.
Que las necesidades de un estado son diferentes a las de otro.

La información utilizada solo puede ser Big Data cuando se ordena y estudia toda la información posible
y disponible, en vez de solo muestras, esta manera de pensar tiene grandes repercusiones tanto en la vida
individual como en la colectiva.

Un estudio reciente de CEBR (Centre of Economics and Business Research) identificar a los datos y la
tecnología de la información como factores importantes para la adopción de “Big Data” para incrementar
el potencial y productividad de una empresa o firma. Argumentado lo dicho anteriormente las compañías
e industrias con bajo nivel de TI son más propensas a tener dificultades en los negocios.

Consideremos el análisis de ADN. La compañía 23andMe se encarga de estudiar el ADN de una persona,
con el fin de encontrar anomalías en el código genético que nos haga más o menos perceptibles a
determinadas enfermedades o condiciones. El fallo está en que la compañía solo evalúa una pequeñísima
parte del ADN, partes donde las anomalías son más perceptibles de acuerdo al mercado que evalúa. Steve
Jobs, el fundador de Apple, en su lucha contra el cáncer hizo un acercamiento a Big Data: secuenció todo
su ADN, recibiendo a cambio no una muestra de su código genético, si no el 100% del mismo. Esto
ayudó a los doctores a determinar qué tratamientos o medicinas resultarían más eficaces basados en su
genética.

Walmart es, hoy en día, una de las empresas más rentables. Incluso antes de la Web, esta empresa trajo su
propia Big Data al registrar cada producto como un dato, permitiendo a sus proveedores analizar el
volumen y flujo de sus ventas. Lo que este cambio trajo fue un análisis de las compras de un cliente: que
llevaba en su carrito, el precio total de este, el día de la semana e incluso las condiciones climatológicas.

Con esto, la compañía cayó en la cuenta de que previo a un huracán, las ventas de artículos de
supervivencia y mantenimiento (lámparas, papel de baño, comida enlatada) iban al alza, igual que otro
producto muy peculiar: Pop-Tarts (un snack de desayuno). Gracias a esto, cuando se acercaba la
temporada de lluvias, los Pop-Tarts eran reubicados cerca de los suministros de huracanes. Como
seguramente ya esperaba, esto resultó en un incremento en las ventas. Aquí vemos una correlación entre
lo que el cliente vive y lo que el cliente quiere. Estas correlaciones son importantes en este nuevo mundo
de la información, porque cuantifica la relación estadística entre un evento A y un evento B. Una
correlación es fuerte cuando un cambio en el evento A significa un alta de probabilidad en el evento B.
Mientras más se acerca la temporada de huracanes, más ventas hay en los snacks del desayuno.

La información siempre ha sido, será y va a ser esencial para las transacciones del mercado. Nuestros
gustos que manifestamos mediante las redes sociales, nuestros contactos, opiniones y preferencias sirven,
de alguna u otra manera, a Big Data. A pesar de esto, el cambio actual radica en que incluso datos tan
“irrelevantes” como la temperatura en la que manejamos, el tiempo que nos toma llegar a un lugar
específico e incluso, nuestro helado de sabor favorito, pueden significar un cambio verdaderamente
significativo en la manera que vemos las cosas.
Por último caso de éxito traído gracias a Big Data, analizamos dos empresas, que si bien son muy
distintas, percibieron casos parecidos.

Amazon fue fundada el 5 de julio de 1994 por Jeff Bezos. En un inicio, la empresa se dedicaba
únicamente a la venta de libros a través de internet. Con el paso del tiempo, se contrataron críticos y
editores para que escribieran reseñas y sugerencias en nuevos títulos. Con el crecimiento de la compañía,
se le ocurrió una idea a Bezos: ¿Qué tal si la compañía pudiese recomendar libros específicos basados en
la preferencias de compra individuales?

Todo se basaba en la recopilación de información por parte de Amazon de los clientes: que compraban,
que libros observaban pero no compraban, por cuanto tiempo los observaban…
Al ingeniero Greg Linden se le ocurrió la idea de comparar todo la información con la que se contaba de
un cliente para hacer asociaciones entre los productos que adquiría/veía. Ahora, en vez de sólo
recomendar libros, podría sugerir películas o artículos del hogar.

La compañía se encontraba en una encrucijada: dejar que el contenido generados en computadora como
recomendaciones personales apareciera en la página principal o que se siguieran viendo las reseñas de
críticos y editores.

La película Moneyball, protagonizada por Brad Pitt, explica el cambio revolucionario que vivieron los
Atléticos de Oakland cuando el gerente general Billy Beane deshecha años de tradición en como elegir
jugadores rentables por un método matemático que apreciaba un juego desde una perspectiva nueva. Se
calculaba el “promedio de bateo” de un jugador, al igual que su “porcentaje en base”. Durante la película
aparece una escena, que si bien es parte de la dramatización para la trama, explica muy bien la situación
que se vive día a día.
Durante la escena se pueden apreciar a los contratadores discutiendo respecto a los jugadores. Se debate
con respecto a la apariencia física, su manera de batear, su actitud y la gente con la que se rodea,
determinando que socializar con cierta persona o no es un indicador de su autoestima. Este escena
describe las desventajas del juicio humano.

Ambas empresas decidieron reemplazar por completo los instintos encontrados en la toma de decisiones
millonarias por datos matemáticos fidedignos. Billy Beane fue altamente criticado por su “insolencia” y el
cuestionamiento al método que llevaba años en función. En el 2002 los Atléticos de Oakland rompieron el
récord de mayor victorias seguidas de los Yankees de Nueva York en una temporada de la MLB, llegando
a las 20 victorias con un equipo que era considerado erróneo y una abominación para el juego. Dos años
más tarde, los Medias Rojas de Boston ganaron la serie mundial basándose en el modelo de Beane.
De estos dos ejemplos podemos concluir que la información es el futuro de la economía.

Aun así, no todo es miel sobre hojuelas.

La gran recopilación de información en sí representa un peligro para el cliente. Aun sin desearlo, damos
una gran cantidad de información que es un potencialmente dañina para nosotros. Facebook fue partícipe
de grandes escándalos en los últimos dos años, pero el más relevante es el relacionado con la venta de
información de sus usuarios a distintas empresas como Cambridge Analytica, que intentó influir en los
votantes de Estados Unidos.

Con toda esta recopilación de datos personales de los usuarios, nuevos retos surgen para la humanidad.
Como se puede predecir la probabilidad de tener un ataque cardíaco, también es posible predecir,
estadísticamente, la probabilidad de que una persona cometa un delito. Este nueva época necesita nuevas
reglas que ayuden a garantizar la seguridad de los usuarios. Este nueva era de la información requiere
nuevas instituciones y leyes que ayuden a encontrar la manera y el balance en la que la probabilidad que
es Big Data no sea un daño para la sociedad, si no una herramienta útil que nos ayude a combatir los
grandes problemas sociales a los que nos enfrentamos. Big Data puede ser la solución a grandes
problemas como las contaminación. Analizando los datos de la polución para ubicar el lugar donde es
mejor direccionar nuestros esfuerzos. También podría ser la solución permanente en la lucha contra
distintas enfermedades como el cáncer, ayudándonos a descifrar los secretos que las enfermedades
esconden.

Si bien conlleva un gran peligro, la recopilación de datos de una manera segura y regulada es la llave de
la puerta a un mundo aún más globalizado, en paz, en fin, un mundo utópico
Referencias

Entrepeneur en Español. (12 de agosto 2015). Qué es Big Data y cómo usarlo en tu negocio. (Archivo de
video). Recuperado de: https://www.youtube.com/watch?v=CcDCqW88uNY.

Grable, J. E., & Lyons, A. C. (2018). An Introduction to Big Data. Journal Of Financial Service
Professionals, 72(5), 17-20. Recuperado de:
https://eds.a.ebscohost.com/eds/pdfviewer/pdfviewer?vid=1&sid=16f565c1-d280-43c4-9e61-
bc13b0652252%40sessionmgr4009

Lopéz, C. (2014). La moda del Big Data. Recuperado de:


http://www.eleconomista.es/tecnologia/noticias/5578707/02/14/La-moda-del-Big-Data-En-que-consiste-
en-realidad.html

Marz, N., Warren, J. (2015). Big Data. Shelter Island, NY: Manning.

Mayer-Schönberg. V, Cukier. K. (2013). A Revolution That Big Will Transform How We Data Live,
Work, and Think. Lugar: Houghton Mifflin Harcourt Publishing Company, Nueva York

MÜLLER, O., FAY, M., & VOM BROCKE, J. (2018). The Effect of Big Data and Analytics on Firm
Performance: An Econometric Analysis Considering Industry Characteristics. Journal Of Management
Information Systems, 35(2), 488-509. doi:10.1080/07421222.2018.1451955

Вам также может понравиться