Вы находитесь на странице: 1из 53

Capítulo I

Diseño y Manejo de Bases de Datos


a prueba de bala
© Wikimedia.org
Diseño y Manejo de Bases de Datos
© Wikimedia.org

A prueba de bala
Índice general

I. Diseño de Bases de Datos


1. Introducción
2. Estructura universal de BD
3. Errores comunes
4. Metadata
5. Tips para Excell
6. Bases RELACIONALES
Existe mucha información mal organizada
• Se pierde la información
• Sólo sirve para el proyecto en marcha
• Transferencia entre diversos personas se dificulta
• No se publica por perderse entre los datos

Aprenderán a organizar información


• Bases de datos complejos y relacionales en Access
• Programación básica (o por lo menos perder el miedo a la programación)
• Explorar/depurar/manipular grandes bases de datos en R

Una base de dato bien construida permite rápidamente


• Visualizar patrones
• Análisis estadística
• Retomarlo años después
Bases de
Bases de datos
datos en
en la
la vida
vida diaria
diaria

• Datos para analizar


Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear


Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear

• Datos para mantener información accesible


Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear

• Datos para mantener información accesible

• Datos para comunicar


Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear

• Datos para mantener información accesible

• Datos para comunicar

• Datos para identificar y asegurar


Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear

• Datos para mantener información accesible

• Datos para comunicar

• Datos para identificar y asegurar

• Información espacial
Bases de datos en la vida diaria

• Datos para analizar

• Datos para organizar y planear

• Datos para mantener información accesible

• Datos para comunicar

• Datos para identificar y asegurar

• Información espacial

• …
I. Diseño de Bases de datos:
1.1. Introducción
Introducción

SQL Espacial
Sistemas y programas de manejo de bases de datos:
SQL
• Sistemas rígidos  Open source

• Programación  Interfaz gráfica de usuario (GUI)


GUI
• Gratuitas  Licencias

• Servidor  Almacenamiento local

• Uso general  especializado


Visual Basics & SQL

SAS

R (derivado de S)
Visual Basics Oracle
I. Diseño de Bases de datos:
1. Introducción

Tablas con data:


Tabla con un conjunto de variables
• Tablas planas en dos dimensiones

• = bases longitudinales
• Poca flexibilidad para actualizar y depurar
• Mucha repetición
• Sólo para bases muy pequeñas
I. Diseño de Bases de datos:
1. Introducción

Tablas con data:


Conjunto de tablas interrelacionadas
• Bases planas mediante variables en común, llaves primarias
y llaves secundarias (> 2 dimensiones)
• Bases relacionales

• Flexible para actualizar y depurar


• Poca repetición
• bases muy pequeñas hasta muy grandes
• Requiere más planeación y diseño
I. Diseño de Bases de datos:
1. Introducción

Conjunto de diferentes archivos que no se abren


Tablas con data: directamente en excell o access

• Bases planas o longitudinales .shp - entidades geométricas de los objetos.


.shx - índice de las entidades geométricas.
• Bases relacionales .dbf – BD en formato dBASE, con información de los atributos de
los objetos, parecido a los BD clássicos.
.prj - información referida al sistema de coordenadas.
• Bases espaciales
.kml: Datos geográficos en 3D, a veces está en formato
comprimido (.kmz). Formato popular por su en Google
Earth.
I. Diseño de Bases de datos:
1. Introducción
Anotaciones sueltas

Tablas con data:

• = una sistematización estricta y ordenada de información

• ≠ un tabla en un documento de texto


• Colores, líneas, fuentes, etc…

• ≠ una visualización de información


• Sub-totales, ajustar al tamaño a la pantalla, colores de fondo

• ≠ hoja de cálculo (contadores)


• Fórmulas
Tabla de datos

• ≠ hoja de anotaciones sueltas


• Comentarios, cuadros de textos
I. Diseño de Bases de datos:
1. Introducción

BASE DE DATOS = Tablas con data + objetos relacionados con las tablas

• Informes

• Consultas

• Meta-data

• Scripts o códigos

• Proyección geográfica

• ….

Símbolo universal de bases de datos


I. Diseño de Bases de datos: BASES DE DATOS

1. Introducción
1. Nombra un problema que has tenido con datos almacenados en tablas

2. Cómo se pudo haber evitado este problema


I. Diseño de Bases de datos:
2. Estructura
2. Estructurauniversal
universaldedeBD
BD

Por qué un método estandarizado para almacenar información en tablas

 Para procesar la información (análisis, informes)

 Para exportar/importar a diferentes programas

 Para permitir un fácil entendimiento de la información


independientemente del autor de la base de datos

 Para construir bases de datos multi-propósito

 Para evitar errores

 Para ganar tiempo y eficiencia

 Para evitar que la información se pierda


I. Diseño de Bases de datos:
2. Estructura universal de tablas

Para mantener y diseñar buenas bases de datos

 No depende de inteligencia

 Tres características claves: orden, orden y .. Orden


(y un poco de consistencia y disciplina)

• Usa sistemas lógicas para nombrar los objetos


• Mantén un buen sistema de back-up
• Mantén un documento con tareas pendientes

 Incorpora sistemas de control y evaluación al actualizar la base


I. Diseño de Bases de datos:
2. Estructura universal de tablas

• Conjunto de líneas y columnas


Tabla: • Información sobre un proceso, proyecto, funcionamiento ambiental, etc…
• Puede ser la totalidad de la base de datos o una parte
• Contiene ÚNICAMENTE variables y registros

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• Dice algo muy específico de muchos elementos


Variable: • No se combina diferentes informaciones en un variable
• Características o unidades constantes (texto, número, fecha, grados, etc…)

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• Dice todo la información sobre un elemento (un caso, informe, animal, sitio, planta, persona, etc…)
Registro: • Combinación de diferentes pedazos de información
• Múltiples unidades (texto, número, fecha, grados, etc…)

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• Una sola característica de un elemento (un caso, informe, animal, sitio, planta, persona, etc…)
Campo: • La unidad más pequeño de la tabla

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• No es obligatoria (pero altanamente recomendado)


Nombres: • necesaria para un buen entendimiento de la base de datos
• Mantén los nombres sencillos y lógicos

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• No es obligatoria
Index: • Algún tipo de index o clave que permite (re-)ordenar y/o identificar
• Mantén lo sencillo

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos:
2. Estructura universal de tablas

• No es obligatoria en tablas classicas (BD planos)


Id o clave: • Obligatoria en bases de datos relacionales y geográficas
• Identifica cada registro
• Valores únicos

index id fecha pais depto municipio macrositio sitio LATITUD LONGITUD alt.min alt.max …
1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7562066 -92.6372695 2277 2305 …

2 mex.30-nov-06 30-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil 16.7579509 -92.6319369 2332 2367 …

3 mex.12-dic-06 12-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7224626 -92.6128306 2269 2280 …
4 mex.14-dic-06 14-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7313381 -92.6121185 2152 2252 …
5 mex.19-dic-06 19-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7333498 -92.6098817 2127 2207 …
6 mex.20-dic-06 20-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7246608 -92.6088768 2302 2409 …
7 mex.21-dic-06 21-dic-06 mexico chiapas san cristobal de las casas Huitepec huitepec 16.7497831 -92.6834232 2490 2524 …
8 mex.22-dic-06 22-dic-06 mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi 16.7271551 -92.6038060 2312 2359 …
9 mex.06-ene-07 06-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1271590 -91.7302851 1460 1488 …
10 mex.08-ene-07 08-ene-07 mexico chiapas la trinitaria Montebello montebello 16.1196239 -91.7384117 1469 1487 …
11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada 16.5355511 -92.4455844 1806 1889 …
12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada 16.5429300 -92.4465755 1832 1878 …

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada 16.5476929 -92.4394391 1992 2062 …

14 mex.01-feb-07 01-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1688885 -93.1419403 1860 1915 …
15 mex.02-feb-07 02-feb-07 mexico chiapas coapilla Coapilla coapilla 17.1347875 -93.1710587 1572 1600 …

… … … … … … … … … … … … …
I. Diseño de Bases de datos: Poca eficiencia
3. Errores
Errores comunes
comunes
Errores Proyecto Estudio de la Ecologia Invernal de Dendroica chrysoparia , Temporada 2009
Nombre de país: MEXICO
Total de individuos DENCHR registrados durante la temporada
Total de bandadas encontradas con DENCHR:
Indiv 1 Indiv 2 Indiv 3 Indiv 4 Indiv 5
CODIGO INDIVIDUAL
MX07DIC09-1 MX08DIC09-1 MX10DIC09-1 MX10DIC09-2 MX14DIC09-1
Fecha (dia-mes-año) 07-ene-10 08-ene-10 12-dic-09 12-dic-09 14-dic-09
Departamento: Chiapas Chiapas Chiapas Chiapas Chiapas
Municipio: San Cristobal de Las
SanCasas
Cristóbal de San
Las Cristóbal
Casas deSan Las Cristóbal
Casas de San
LasCristóbal
Casas de Las Cas
Nombre de Sitio: Moxviquil Moxviquil Moxviquil Moxviquil Moxviquil
Coordenadas X (latitud, en grados decimales): 16°75.522 16°45.201 16°45.33 16°45.331 16°45.392
Coordenadas Y (longitud, en grados decimales): 92°63.143 092°38.057 092°38.339 092°38.265 092°38.041
Altitud (promedio): 2164 2205 2326 2328 2348
Observadores (nombres) Javier Gómez, Efraín
Javier
Castillejos
Gómez,
Javier Efraín
Gómez, Castillejos
Efraín
JavierCastillejos
Gómez, Efraín
Javier Castillejos
Gómez, Efraín Casti
Código Parvada (según pestaña "datos de Parvadas") MX07DIC09 MX08DIC09 MX10DIC09 MX10DIC09 MX14DIC09
Tipo de plumaje (indicar con x)
Macho adulto x
Hembra adulta x x x
Macho Inmaduro
Hembra Inmadura x
Inmaduro o hembra
Anillos ausentes (indicar con x solo si es confirmado )
Presencia de anillos no se podría observar o confirmar x x x x x
Color anillos pata izquierda, de arriba hacia abajo (color Rojo,
Amarillo, Verde, Aluminum, etc)
Color anillos pata derecha, de arriba hacia abajo (color Rojo,
Amarillo, Verde, etc)
Vocalización
Silente x x
Llamado (describir "chip", "tseet", etc) chip chip chip
Canto
Especie de planta en que fue visto primera vez

Especie Quercus crassifoliaQuercus laurina Quercus laurinaQuercus crispipilis


Quercus laurina
Circunferencia (cm) hoja gruesa hoja delgada hoja delgada hoja gruesa hoja delgada
DAP (cm) (circunferencia entre 3) 23.00 23.00 20.00 12.00 70.00
Altura del árbol (en metros) 10 11 10 6 12
Ancho de copa del árbol (en metros) 7.5 5 5 5 10
Parte del árbol en donde el individuo fue detectado
Metros del suelo 9 11 10 2.5 11
Metros del tronco 2 0 1 2 2
Metros de la orilla del árbol 0 0 2 1 2
Quercus
Otras especies de plantas en que el individuo forrajeó (listar) Quercus sp. laurina
I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes
Errores

Proyecto Estudio de la Ecologia Invernal de Dendroica chrysoparia , Temporada 2009


Nombre de país: MEXICO
Total de individuos DENCHR registrados durante la temporada
Total de bandadas encontradas con DENCHR:
Indiv 1 Indiv 2 Indiv 3 Indiv 4 Indiv 5
CODIGO INDIVIDUAL
MX07DIC09-1 MX08DIC09-1 MX10DIC09-1 MX10DIC09-2 MX14DIC09-1
Fecha (dia-mes-año) 07-ene-10 08-ene-10 12-dic-09 12-dic-09 14-dic-09
Departamento: Chiapas Chiapas Chiapas Chiapas Chiapas
Municipio: San Cristobal de Las
SanCasas
Cristóbal de San
Las Cristóbal
Casas deSan Las Cristóbal
Casas de San
LasCristóbal
Casas de Las Cas
Nombre de Sitio: Moxviquil Moxviquil Moxviquil Moxviquil Moxviquil
Coordenadas X (latitud, en grados decimales): 16°75.522 16°45.201 16°45.33 16°45.331 16°45.392
Coordenadas Y (longitud, en grados decimales): 92°63.143 092°38.057 092°38.339 092°38.265 092°38.041
Altitud (promedio): 2164 2205 2326 2328 2348

Meta-data Observadores (nombres)


Código Parvada (según pestaña "datos de Parvadas")
Javier Gómez, Efraín
MX07DIC09
Javier
Castillejos
Gómez,
Javier Efraín
MX08DIC09
Gómez, Castillejos
Efraín
JavierCastillejos
MX10DIC09
Gómez, Efraín
Javier Castillejos
MX10DIC09
Gómez, Efraín Castil
MX14DIC09
Tipo de plumaje (indicar con x)
Macho adulto x
Hembra adulta x x x
Sitios de muestreo Macho Inmaduro
Hembra Inmadura x
Inmaduro o hembra
Anillos ausentes (indicar con x solo si es confirmado )
Presencia de anillos no se podría observar o confirmar x x x x x

Aves Color anillos pata izquierda, de arriba hacia abajo (color Rojo,
Amarillo, Verde, Aluminum, etc)
Color anillos pata derecha, de arriba hacia abajo (color Rojo,
Amarillo, Verde, etc)
Vocalización
Vegetación Silente x x
Llamado (describir "chip", "tseet", etc) chip chip chip
Canto
Especie de planta en que fue visto primera vez

Especie Quercus crassifoliaQuercus laurina Quercus laurinaQuercus crispipilis


Quercus laurina
Circunferencia (cm) hoja gruesa hoja delgada hoja delgada hoja gruesa hoja delgada
DAP (cm) (circunferencia entre 3) 23.00 23.00 20.00 12.00 70.00
Altura del árbol (en metros) 10 11 10 6 12
Ancho de copa del árbol (en metros) 7.5 5 5 5 10
Parte del árbol en donde el individuo fue detectado
Metros del suelo 9 11 10 2.5 11
Metros del tronco 2 0 1 2 2
Metros de la orilla del árbol 0 0 2 1 2
Quercus
Otras especies de plantas en que el individuo forrajeó (listar) Quercus sp. laurina
I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes • Efectos de redacción
• Colores de fondo
• Fuentes en negrita
Errores
• Información no organizada según registros y variables
• Celdas con información mixta y/o símbolos
• 092°38.057 (símbolos y números)
• Celdas con varios valores
• Javier Gómez, Efraín Castillejos Proyecto Estudio de la Ecologia Invernal de Dendroica chrysoparia , Temporada 2009
• Variables sin títulos Nombre de país: MEXICO
Total de individuos DENCHR registrados durante la temporada
Total de bandadas encontradas con DENCHR:
Indiv 1 Indiv 2 Indiv 3 Indiv 4 Indiv 5
CODIGO INDIVIDUAL
MX07DIC09-1 MX08DIC09-1 MX10DIC09-1 MX10DIC09-2 MX14DIC09-1
Fecha (dia-mes-año) 07-ene-10 08-ene-10 12-dic-09 12-dic-09 14-dic-09
Departamento: Chiapas Chiapas Chiapas Chiapas Chiapas
Municipio: San Cristobal de Las
SanCasas
Cristóbal de San
Las Cristóbal
Casas deSan Las Cristóbal
Casas de San
LasCristóbal
Casas de Las Cas
Nombre de Sitio: Moxviquil Moxviquil Moxviquil Moxviquil Moxviquil
Coordenadas X (latitud, en grados decimales): 16°75.522 16°45.201 16°45.33 16°45.331 16°45.392
Coordenadas Y (longitud, en grados decimales): 92°63.143 092°38.057 092°38.339 092°38.265 092°38.041
Altitud (promedio): 2164 2205 2326 2328 2348

Meta-data Observadores (nombres)


Código Parvada (según pestaña "datos de Parvadas")
Javier Gómez, Efraín
MX07DIC09
Javier
Castillejos
Gómez,
Javier Efraín
MX08DIC09
Gómez, Castillejos
Efraín
JavierCastillejos
MX10DIC09
Gómez, Efraín
Javier Castillejos
MX10DIC09
Gómez, Efraín Castil
MX14DIC09
Tipo de plumaje (indicar con x)
Macho adulto x
Hembra adulta x x x
Sitios de muestreo Macho Inmaduro
Hembra Inmadura x
Inmaduro o hembra
Anillos ausentes (indicar con x solo si es confirmado )
Presencia de anillos no se podría observar o confirmar x x x x x

Aves Color anillos pata izquierda, de arriba hacia abajo (color Rojo,
Amarillo, Verde, Aluminum, etc)
Color anillos pata derecha, de arriba hacia abajo (color Rojo,
Amarillo, Verde, etc)
Vocalización
Vegetación Silente x x
Llamado (describir "chip", "tseet", etc) chip chip chip
Canto
Especie de planta en que fue visto primera vez

Especie Quercus crassifoliaQuercus laurina Quercus laurinaQuercus crispipilis


Quercus laurina
Circunferencia (cm) hoja gruesa hoja delgada hoja delgada hoja gruesa hoja delgada
DAP (cm) (circunferencia entre 3) 23.00 23.00 20.00 12.00 70.00
Altura del árbol (en metros) 10 11 10 6 12
Ancho de copa del árbol (en metros) 7.5 5 5 5 10
Parte del árbol en donde el individuo fue detectado
Metros del suelo 9 11 10 2.5 11
Metros del tronco 2 0 1 2 2
Metros de la orilla del árbol 0 0 2 1 2
Quercus
Otras especies de plantas en que el individuo forrajeó (listar) Quercus sp. laurina
I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes • Efectos de redacción
• Nombres complicados
• Variables derivados
Errores • Abreviaciones, funciones matemáticas, etc.
• Información no organizada según registros y variables
• Celdas con información mixta y/o símbolos
• Celdas con varios valores
• Variables sin títulos
• Columnas vacías
• Registros vacíos
• Celdas vacías
• Usa NA (No Aplica) en R o NULL en SQL
• símbolos que algunos programas no reconocen
• Espacios, /, &., - , ó,á, ü, etc..

sin esp Acron distr


nom

Sinónimos/Pro Codigo de 6 NOM-059-


Nombre en español Distribución
tónimos letras 2001

Tinamú mayor TINMAJ Pr no endémica


Tinamú menor CRYSOU Pr no endémica
Tinamú canelo CRYCIN
Tinamú jamuey CRYBOU Pr no endémica
Pijije alablanca DENAUT
Pijije canelo DENBIC
Ganso careto mayor ANSALB
Ganso blanco CHECAE
Ganso de Ross CHEROS
Ganso de collar BRABER
I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes • Efectos de redacción
• Nombres complicados
• Variables derivados
Errores • Abreviaciones, funciones matemáticas, etc.
• Información no organizada según registros y variables
• Celdas con información mixta y/o símbolos
• Celdas con varios valores
• Variables sin títulos
• Columnas vacías
• Registros vacíos
• Celdas vacías
• símbolos que algunos programas no reconocen

1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil

2 mex.30-nov-06 30-nov-06 Mex chiapas San cristobal de las casas Moxviquil moxviquil

3 mex.12-dic-06 12-dic-06 mex chiapas san cristobal de las casas Laguna Cochi laguna del cochi

4 mex.14-dic-06 14-dic-06 mex. chiapas san cristobal de las casas lag. Cochi laguna del cochi

5 mex.19-dic-06 19-dic-14 Mex. chiapas san cristobal de las casas Laguna Cochi laguna del cochi

6 mex.20-dic-06 veinte de diciembre Mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi

17 mex.21-dic-06 21-dic-06 México chiapas san cristobal de las casas Huitepec huitepec

8 mex.22-dic-06 22-dic-06 Méx chiapas san cristobal de las casas Laguna Cochi laguna del cochi
mex.06-ene-07 06-ene-07 mex chiapas la trinitaria Montebello montebello

10 mex.06-ene-07 08-ene-07 mex chiapas la trinitaria montebello montebello

11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada

12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada


I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes • Efectos de redacción
• Nombres complicados
• Variables derivados
Errores • Abreviaciones, funciones matemáticas, etc.
• Información no organizada según registros y variables
• Celdas con información mixta y/o símbolos
• Celdas con varios valores
• Variables sin títulos
• Columnas vacías
• Registros vacíos
• Celdas vacías
• símbolos que algunos programas no reconocen
• Ortografía no constante
• Formato no constante
• Índex no completa
• Id con valores repetidas

1 mex.28-nov-06 28-nov-06 mexico chiapas san cristobal de las casas Moxviquil moxviquil

2 mex.30-nov-06 30-nov-06 Mex chiapas san cristobal de las casas Moxviquil moxviquil

3 mex.12-dic-06 12-dic-06 mex chiapas san cristobal de las casas Laguna Cochi laguna del cochi

4 mex.14-dic-06 14-dic-06 mex. chiapas san cristobal de las casas lag. Cochi laguna del cochi

5 mex.19-dic-06 19-dic-14 Mex. chiapas san cristobal de las casas Laguna Cochi laguna del cochi

6 mex.20-dic-06 veinte de diciembre Mexico chiapas san cristobal de las casas Laguna Cochi laguna del cochi

17 mex.21-dic-06 21-dic-06 México chiapas san cristóbal de las casas Huitepec huitepec

8 mex.22-dic-06 22-dic-06 Méx chiapas san cristobal de las casas Laguna Cochi laguna del cochi
mex.06-ene-07 06-ene-07 mex chiapas la trinitaria Montebello montebello

10 mex.06-ene-07 08-ene-07 mex chiapas la trinitaria montebello montebello

11 mex.25-ene-07 25-ene-07 mexico chiapas teopisca La Granada la granada

12 mex.26-ene-07 26-ene-07 mexico chiapas teopisca La Granada la granada

13 mex.27-ene-07 27-ene-07 mexico chiapas teopisca La Granada la granada


I. Diseño de Bases de datos:
3. Errores comunes

Tip para corregir errores de ortografía


1. Convertir los datos en «formato como tabla»
2. Picar la flecha en el encabezado genera una lista de los valores únicos

En R:
unique()

DEMO:
Tabla_dinamica.xlsx
I. Diseño de Bases de datos: Poca eficiencia
3. Errores comunes • Efectos de redacción
• Nombres complicados
• Variables derivados
Errores • Una tabla dividida entre diversas hojas
• Información no organizada según registros y variables
• Celdas con información mixta y/o símbolos
• Celdas con varios valores
• Variables sin títulos
• Columnas vacías
• Registros vacíos
• Celdas vacías
• símbolos que algunos programas no reconocen
• Ortografía no constante
• Formato no constante
• Índex no completa
• Id con valores repetidas
I. Diseño de Bases de datos:
3. Errores comunes

Mantener toda la información en una sola tabla


var 1 var 2 var 3 var 4 … var.indicador
x x x x …
a
x x x x …
a
x x x x …
a
x x x x …
a
x x x x …
b a
x x x x …
b
b
x x x x …
b
x x x x …
b c
x x x x …
c
x x x x …
c d
x x x x …
c
x x x x …
c
x x x x …
d
x x x x …
d
x x x x …
d
x x x x …
d
I. Diseño de Bases de datos:
3. Errores comunes en Coordenadas

Coordenadas geográficas
Coordenadas UTM
en decimas de grado
Decimas de grado

Decimas de minutos
Minutos Segundos

Grados, minutos y
segundos decimales

CONVERSIONES
Coordenadas
GRADOS MINUTOS SEGUNDOS
geográficas

16. 45/60 = 0.75 9.1/3600= 0.002527 Y 16.752527

-92. 40/60 = 0.666666 42.8/3600= 0.011888 X -92.678556.


I. Diseño de Bases de datos: Ejercicio
3. Errores comunes en Coordenadas Errores comunes

Con el archivo Errores_comunes.xlsx


DiplomadoR_2016_DRIVE\Modulo1_Manejo.de.bases\datasets\Errores_comunes.xlsx

Pestaña errores1: Corrige los errores e ineficiencias.

Pestana errores_2: Haz una lista de errores e ineficiencias


I. Diseño de Bases de datos:
4. Metadata
Metadata

La metadata =
• Un solo documento que acompaña la base de datos
• provee toda la información sobre la base, las tablas y los variables
• sirve para que la base de datos se independiza de su autor
• es igual de importante que los datos
• se hace al mismo tiempo o ANTES de construir la base de datos
(posponer no es una buena idea)

¿Que puedes decir sobre estos datos?

Daso_xls
index predio unm pred ha ac ex.ha.total ex.unm.total ex.ab.total pos.total pos.ha.pin_o …
bal.108 El Balance 108 bal 0.23 3 121.73 27.39 12.5 18.06 36.91 …
bal.109 El Balance 109 bal 0.4 3 221.65 88.22 19.9 62.86 78.31 …
bal.111 El Balance 111 bal 0.46 1 228.93 106 21.1 68.78 74.27 …
bal.112 El Balance 112 bal 0.68 1 129.2 88.25 12.75 59.7 43.71 …
bal.114 El Balance 114 bal 0.68 1 121.65 82.12 12.35 51.1 36.76 …
bal.115 El Balance 115 bal 2.7 1 132.33 357.14 14.23 226.64 40.26 …
bal.119 El Balance 119 bal 2.69 3 128.72 346.65 13.52 217.82 39.7 …
bal.122 El Balance 122 bal 0.43 3 105.47 45.45 11.6 26.04 28.84 …
bal.125 El Balance 125 bal 0.58 1 103.19 59.44 13.3 26.68 9.79 …
… … … … … … … … … … … …
I. Diseño de Bases de datos:
4. Metadata Usar el mismo título que el título de la base de dato

Responsable de la base de datos + datos de contacto

De qué se trata la información incluida en la Base de Datos

A qué proyecto corresponde?


(incluir información de contacto)

Información desglosada por tabla y variable


• Nombre completo de los variables y concepto que expresan
• Unidades
• Método usado
• Quién colectó el dato / quién capturó (+ datos de contacto)
• Fecha de la última modificación
• …
index predio unm pred ha ac ex.ha.total ex.unm.total ex.ab.total pos.total pos.ha.pin_o …
bal.108 El Balance 108 bal 0.23 3 121.73 27.39 12.5 18.06 36.91 …
bal.109 El Balance 109 bal 0.4 3 221.65 88.22 19.9 62.86 78.31 …
bal.111 El Balance 111 bal 0.46 1 228.93 106 21.1 68.78 74.27 …
bal.112 El Balance 112 bal 0.68 1 129.2 88.25 12.75 59.7 43.71 …
bal.114 El Balance 114 bal 0.68 1 121.65 82.12 12.35 51.1 36.76 …
bal.115 El Balance 115 bal 2.7 1 132.33 357.14 14.23 226.64 40.26 …
bal.119 El Balance 119 bal 2.69 3 128.72 346.65 13.52 217.82 39.7 …
bal.122 El Balance 122 bal 0.43 3 105.47 45.45 11.6 26.04 28.84 …
bal.125 El Balance 125 bal 0.58 1 103.19 59.44 13.3 26.68 9.79 …
… … … … … … … … … … … …
I. Diseño de Bases de datos:
5. Tips
Tips para
para Excell
Excell

Evite perder información y tiempo

Maneja un sistema de back-ups SIEMPRE!


• Una gran desventaja de Excell es la falta de un registro de cambios realizados
• En muchos casos no se nota los errores hasta en etapas avanzadas de análisis
I. Diseño de Bases de datos:
6. Bases
Bases RELACIONALES
RELACIONALES
a. Introducción

• Para tablas planas • Para tablas relacionales


• Calculadora • Manejo de Bases de Datos
• Gráficas • Formularios – consultas – informes - gráficas
• Máscaras y validación de datos
• Capacidad máxima • Capacidad máxima
• 1,048,576 líneas y 16,384 columnas • 2 GB por DB
• Maximo characteres en una celda 32,767

Cuando usar Excell y cuando usar Access

• Bases de datos planos • Bases de datos relacional


• Hojas de cálculo • Cd en el futuro necesite agregar más tablas
• Gran cantidad de datos
• Datos de texto larga.
• Dependa de datos externas
• Mantener conectividad constante con una base de datos
externa
• Consultas complejas.
• Muchos usuarios trabajando
• Evitar errores de ortografía
• Evitar repetición en la captura de datos
I. Diseño de Bases de datos:
6. Bases RELACIONALES ¿Qué son las bases relacionales?
a. Introducción

Mucha repetición Poca repetición

Captura de valores repetidos «Datos de campo»


• Errores de ortografía
• Errores de captura
• Tiempo para capturar
• Tiempo de computación
• Espacio de memoria
I. Diseño de Bases de datos:
6. Bases RELACIONALES ¿Qué son las bases relacionales?
a. Introducción

En realidad sólo tenemos 7 diferentes registros

REDUNDANCIA: Cuando la misma información se repite


en diferentes partes de la base de datos
I. Diseño de Bases de datos:
6. Bases RELACIONALES ¿Qué son las bases relacionales?
a. Introducción
Tabla plana:
1 dimensión

Tabla Relacional:
>1 dimensión

La parte que se repite La parte que NO se repite

Normalización : organizar los datos en una base de datos de tal manera que se
• Minimiza la redundancia
• Maximiza la integridad y flexibilidad para las actualizaciones
I. Diseño de Bases de datos:
6. Bases RELACIONALES ¿Qué son las bases relacionales?
a. Introducción
I. Diseño de Bases de datos:
6. Bases RELACIONALES ¿Qué son las bases relacionales?
a. Introducción
I. Diseño de Bases de datos:
6. Bases RELACIONALES
b. Dependencias

Tabla Independiente o Madre Tabla dependiente o Hija

 Un solo lugar tiene diversos registros  Diversos registros dependen


de conteo y de clima del mismo sitio
I. Diseño de Bases de datos:
6. Bases RELACIONALES
c. Llaves
Tabla dependiente o Hija
Tabla Independiente o Madre

Llave Primaria
• No se repite
• Identifica un registro único
en la tabla independiente
Llave Secundaria (o Foránea)
• Se permite repeticiones
• Identifica un registro
en la tabla dependiente
• No se permite valores que no están en la tabla dependiente

Nombre compartido

Las tablas se comunican mediante columnas en común o LLAVES


I. Diseño de Bases de datos:
6. Bases RELACIONALES
c. Llaves
Tabla dependiente o Hija
Tabla Independiente o Madre

Llave Primaria
• No se permite eliminar/cambiar valores cuando esta
genera registros huérfanos en la tabla Hija
Llave Secundaria (o Foránea)
• No se permite valores ausentes en la tabla Madre

INTEGRIDAD : la corrección y complementación de


los datos en una base de datos
I. Diseño de Bases de datos:
6. Bases RELACIONALES
c. Llaves

Tabla (in)dependiente?
Llave Primaria/Secundaria?
I. Diseño de Bases de datos:
6. Bases RELACIONALES
c. Llaves

Вам также может понравиться