Академический Документы
Профессиональный Документы
Культура Документы
Revisores tcnicos: Claude Lorenson, Susan Price, Ralph Kemperdick, Henk van der Valk,
Alexi Khalyako, Oliver Chiu
Copyright
Este documento se proporciona "tal cual". La informacin y los puntos de vista que
se proporcionan en este documento, incluidas las direcciones URL y otras
referencias a sitios web de Internet, pueden sufrir modificaciones sin previo aviso.
Usted acepta el riesgo de utilizarlo.
En este documento no se proporciona ningn derecho legal sobre ninguna
propiedad intelectual de ningn producto de Microsoft. Puede copiar y utilizar este
documento para su propia referencia.
2012 Microsoft. Todos los derechos reservados.
Contenido
Historial de cambios de FTDW.................................................................................... 6
Introduccin................................................................................................................ 6
Audiencia................................................................................................................ 6
Fast Track Data Warehouse......................................................................................... 6
Fast Track................................................................................................................ 7
Propuesta de valor.................................................................................................. 7
Metodologa................................................................................................................ 7
Arquitectura de componentes holstica...................................................................7
Enfoque optimizado de carga de trabajo.................................................................8
Configuraciones de referencia de SQL Server Fast Track validadas.........................9
Resumen................................................................................................................. 9
Carga de trabajo de FTDW.......................................................................................... 9
Patrones de cargas de trabajo de almacenamiento de datos..................................9
Evaluacin de las cargas de trabajo......................................................................10
Atributos cualitativos de cargas de trabajo de almacenamiento de datos............12
Elegir una configuracin de referencia de FTDW......................................................14
Opcin 1: evaluacin bsica.................................................................................. 14
Paso 1: evaluar el caso de uso del cliente.............................................................14
Paso 2: elegir una arquitectura de referencia de FTDW publicada.....................15
Opcin 2: evaluacin completa.............................................................................16
Informacin general acerca del proceso.............................................................16
Paso 1: evaluar el caso de uso del cliente..........................................................16
Paso 2: establecer mtricas de evaluacin........................................................17
Paso 3: elegir una arquitectura de referencia de Fast Track Data Warehouse....18
Opcin 3: arquitecturas de referencia definidas por el usuario.............................18
Paso 1: definir la carga de trabajo......................................................................18
Paso 2: establecer simulaciones de la arquitectura de componentes................18
Resumen de la eleccin de una FTRA....................................................................19
Apndice.................................................................................................................. 53
Herramienta de ajuste de tamao de FTDW..........................................................53
Validar una FTRA definida por el usuario...............................................................53
Prueba de E/S sinttica...................................................................................... 53
Generar archivos de prueba con SQLIO.............................................................53
Prueba de cargas de trabajo................................................................................. 56
Medir el valor MCR para el servidor (opcional)...................................................56
Medir el valor BCR para la carga de trabajo.......................................................56
Factores que afectan a la tasa de consumo de las consultas.............................61
Versin
Nuevo en SQL
Server 2012
4.0
Nuevo en SQL
Server 2012
Nuevo en SQL
Server 2012
Nuevo en SQL
Server 2012
Nota
Vnculos a otros documentos
de prcticas recomendadas de
SQL Server
Ubicacin
4.0
Simulaciones y validacin
Precaucin
4.0
Requisitos de memoria
RAM
4.0
Nuevo en SQL
4.0
Server 2012
Nuevo en SQL
4.0
Server 2012
Nuevo en SQL
4.0
Server 2012
Tabla 1: historial de cambios
ndices de almacn de
columnas optimizados en
memoria xVelocity
Almacenamiento de estado
slido
Validacin e ndices de
almacn de columnas
Validacin de E/S de lnea base
Importante
ndices de almacn de
columnas
Estado slido
Validacin
SQLIO
Introduccin
En este documento se definen la arquitectura de componentes y la metodologa empleadas
para el programa Fast Track Data Warehouse (FTDW) de SQL Server. El resultado de este
enfoque es la validacin de una arquitectura mnima del sistema de base de datos de Microsoft
SQL Server, incluido el software y el hardware, necesaria para lograr y mantener una lnea
base de rendimiento inmediato para muchas cargas de trabajo de almacenamiento de datos.
Audiencia
La audiencia objetivo de este documento abarca planeadores de TI, arquitectos, DBA y usuarios
de Business Intelligence (BI) interesados en elegir arquitecturas del sistema probadas estndar
para cargas de trabajo de SQL Server conformes a FTDW.
El equilibrio es una medida de los componentes clave del sistema de una instalacin de SQL
Server: almacenamiento, servidor, red de almacenamiento, base de datos y sistema operativo.
Cada uno de estos componentes tiene una configuracin optimizada. El objetivo es lograr un
equilibrio eficiente inmediato entre la capacidad de procesamiento de datos de SQL Server
y los recursos de los componentes de hardware. Idealmente, la configuracin debe incluir el
hardware del sistema mnimo para satisfacer los requisitos de almacenamiento y rendimiento
para una carga de trabajo de almacenamiento de datos.
Fast Track
La marca SQL Server Fast Track identifica una configuracin de hardware de componentes
conforme a los principios de la arquitectura de referencia FTDW (FTRA). Cada FTRA est
definida por una carga de trabajo y un conjunto bsico de prcticas recomendadas de
configuracin, validacin y base de datos. A continuacin se enumeran los principios clave del
programa Fast Track:
Propuesta de valor
Los principios siguientes constituyen la base de la propuesta de valor de FTDW:
Equilibrio predeterminado entre los componentes clave del sistema. Esto reduce el
riesgo de derrochar recursos de CPU o de almacenamiento que nunca se percibirn en
el nivel de aplicacin.
Rendimiento predecible inmediato. Las configuraciones de Fast Track ya coinciden
con las capacidades de la aplicacin de SQL Server para un servidor y una carga de
trabajo seleccionados.
Centrado en la carga de trabajo. En lugar de tratarse de un mtodo nico para la
configuracin de bases de datos, el enfoque de FTDW se alinea especficamente con
un caso de uso de almacenamiento de datos.
Metodologa
Arquitectura de componentes holstica
Las arquitecturas de referencia de FTDW de SQL Server proporcionan un marco prctico para
equilibrar las complejas relaciones existentes entre los componentes clave de la arquitectura
del sistema de base de datos. La arquitectura de componentes, que se denomina
genricamente pila, se muestra en la ilustracin 1.
Para estos casos de uso opuestos, las implicaciones de una pila de componentes equilibrada
son significativas. Los intervalos de exploracin aleatoria de E/S por disco promedio de las
unidades de disco SAS modernas pueden ser 10 veces ms lentos en comparacin con los
intervalos de exploracin secuencial para el mismo hardware. Con las cargas de trabajo de
Fast Track Data Warehouse se pone nfasis en conseguir intervalos de exploracin de E/S
coherentemente elevados (medidos en MB/s) en lugar del enfoque ms tradicional de las
operaciones por segundo (medidas en IOPS).
Para afrontar el desafo que suponen las cargas de trabajo muy diferentes se deben definir
claramente los atributos de las cargas de trabajo cliente. Las cargas de trabajo de SQL Server
Fast Track constan de una lista cualitativa de atributos que definen de forma nica un caso de
uso comn de la aplicacin de base de datos. Adems, cada carga de trabajo se representa
mediante medidas cuantitativas entre las que se incluyen consultas de simulacin estndar.
Se usan simulaciones especficas de la carga de trabajo para validar la configuracin de la base
de datos, las prcticas recomendadas y las recomendaciones de hardware de componentes.
Resumen
La especificacin FTDW de SQL Server descrita en esta gua de referencia est centrada en
las cargas de trabajo y el equilibrio de los componentes. Este enfoque confirma que el
aprovisionamiento nico puede resultar ineficiente y costoso para muchos casos de uso de
base de datos. Los requisitos empresariales cada vez ms complejos unidos a volmenes de
datos que cambian rpidamente exigen un enfoque ms realista. Al presentar una combinacin
de arquitecturas preceptivas de referencia, simulacin de componentes de hardware y
software, y cargas de trabajo claramente dirigidas, este documento proporciona un enfoque
prctico para lograr arquitecturas de componentes equilibradas.
Para superar las limitaciones de los sistemas de almacenamiento de datos tradicionales, las
organizaciones han recurrido a emplear tcnicas de optimizacin RDBMS tradicionales como
la generacin de ndices, el agregado previo de datos y la restriccin del acceso a los niveles
inferiores de datos. Las sobrecargas de mantenimiento asociadas a estos mtodos pueden
abrumar a menudo incluso a las ventanas de lotes generosas. A medida que un almacenamiento
de datos se vuelve ms maduro y crece la audiencia, cada vez resulta ms desafiante admitir
estas optimizaciones especficas del caso de uso, especialmente en el caso de datos o de
correcciones de datos a ltima hora.
Una solucin frecuente para este desafo consiste en agregar simplemente unidades; no es
raro ver centenares de discos para un almacenamiento de datos relativamente pequeo en un
intento por superar las limitaciones de rendimiento de E/S de asignar una infraestructura de E/S
basada en bsquedas a una carga de trabajo basada en recorridos. Esto se suele ver en grandes
entornos de red de rea de almacenamiento (SAN) compartidos que estn optimizados
tradicionalmente para las bsquedas. Muchos patrones y tcnicas de referencia de E/S de
almacenamiento que fomentan el acceso aleatorio de E/S introducen latencia de disco
y reducen el rendimiento total del subsistema de almacenamiento para una carga de trabajo
de almacenamiento de datos que realiza muchos recorridos.
Fast Track Data Warehouse es una forma diferente de optimizar cargas de trabajo de
almacenamiento de datos. Al alinear los archivos de base de datos y la configuracin con un
acceso eficiente de examen disco (en lugar de bsqueda), el rendimiento que se consigue en
los discos individuales puede ser muy superior. El aumento resultante del rendimiento por disco
reduce el nmero de discos necesarios para generar suficiente rendimiento de E/S como para
satisfacer la capacidad de SQL Server para procesar los datos de una carga de trabajo concreta.
Adems, puede evitar algunas tcnicas de optimizacin basadas en ndices empleadas para
mejorar las bsquedas en disco.
No voltil
Una vez escritos los datos, no suelen cambiar. Las operaciones DML, como la actualizacin de
SQL, que mueven pginas asociadas a la misma tabla de base de datos y hacen que no sean
contiguas deben administrarse con sumo cuidado. Las cargas de trabajo que presentan con
frecuencia esa volatilidad no suelen ser idneas para FTDW. Cuando se produce volatilidad,
se recomienda realizar un mantenimiento peridico para reducir al mnimo la fragmentacin.
Pocos ndices
Al agregar ndices no clster se suele agregar rendimiento en las bsquedas de uno o pocos
registros. Si se aplican ndices no clster a tablas en las que se van a recuperar un gran nmero
de filas, el aumento resultante de las operaciones aleatorias de bsqueda en disco puede reducir
el rendimiento global del sistema. El mantenimiento de ndices puede agregar tambin una
sobrecarga de administracin de datos significativa, lo que puede poner en riesgo el contrato
de nivel de servicio (SLA) y la posibilidad de cumplir las ventanas de carga de base de datos.
Por el contrario, los intervalos de exploracin secuencial pueden ser mucho mayores (10 veces
o ms) que las frecuencias de acceso aleatorio. Un sistema que reduce al mnimo el uso de
bsquedas aleatorias, induciendo ndices secundarios, suele tener unas velocidades de E/S
promedio sostenidas mucho mayores. Esto significa un uso ms eficiente de los recursos de
E/S de almacenamiento y un rendimiento ms predecible para las consultas grandes de tipo
recorrido.
La metodologa de FTDW prescribe tcnicas de optimizacin de base de datos que se alinean
con las caractersticas de la carga de trabajo de destino. El ndice clster y la creacin de
particiones por rangos son ejemplos de estructuras de datos que admiten E/S de disco eficiente
basada en examen, y se recomienda su uso como las herramientas principales para la optimizacin
basada en la arquitectura de datos para los entornos de FTDW.
Particiones alineadas
Una rasgo comn de las cargas de trabajo de FTDW es la capacidad de aprovechar la creacin
de particiones de SQL Server. Las particiones pueden simplificar la administracin del ciclo de
vida de los datos y ayudar a minimizar la fragmentacin con el tiempo. Adems, los patrones de
consulta para exmenes grandes pueden aprovechar la particin por rangos y reducir
considerablemente el tamao de los recorridos de tabla sin sacrificar la fragmentacin o el
rendimiento de E/S de disco.
11
Consideraciones adicionales
Se deben tener en cuenta las consideraciones adicionales siguientes durante la evaluacin de
una carga de trabajo de base de datos:
12
OLTP/ODS
Proporcin equilibrada de lectura
y actualizacin (60 %-40 %)
Rendimiento de consultas
simultneas caracterizado por
Atributo
Modelo de datos
Arquitectura de
datos
13
OLTP/ODS
las necesidades operativas
Inserciones y actualizaciones
especficas
Alto rendimiento de
transacciones (por ejemplo,
varias decenas de K/s)
Simultaneidad de usuario
global de media a alta; solicitud
mxima de consultas simultneas
de 50-100 o ms
Transacciones normalmente
muy cortas (por ejemplo,
bsquedas mnimas de filas
discretas)
Modelo de datos operativo muy
normalizado
Desnormalizacin frecuente
como ayuda para la toma de
decisiones; bsquedas
discretas de latencia baja y alta
simultaneidad
Retencin de datos histricos
limitada
Modelos de datos
desnormalizados extrados de
otros sistemas de origen como
apoyo a la toma de decisiones
de eventos operativos
Atributo
14
Las cargas de trabajo crticas presentan patrones de acceso a datos con muchos
recorridos (es decir, los que pueden beneficiarse de la colocacin secuencial de datos).
En general, las solicitudes de consulta individuales implican la lectura de decenas de
miles a millones (o ms) de filas.
Alta capacidad de datos y baja simultaneidad con respecto a las cargas de trabajo
OLTP comunes.
Baja volatilidad de los datos. Las actividades DML frecuentes de actualizacin y eliminacin
se deben restringir a un pequeo porcentaje del almacenamiento de datos total.
16
17
Presupuesto. El cliente elige adquirir el sistema con mayor capacidad y/o el sistema con
mayor rendimiento segn el presupuesto disponible.
Rendimiento. El cliente elige adquirir el sistema con mayor rendimiento disponible.
Anlisis interno. La decisin se basa en el anlisis de las cargas de trabajo que el
cliente ha ejecutado en el hardware existente.
Para obtener ms informacin acerca del clculo de estas mtricas, vea la seccin
Simulaciones y validacin de este documento.
MCR
Esta mtrica mide la tasa mxima de procesamiento de datos de SQL Server para una consulta
y un conjunto de datos estndar para una combinacin especfica de servidor y CPU. Se trata
de una tasa por ncleo y se mide como un examen basado en consulta desde la memoria
cach. MCR es el punto de partida inicial para el diseo de sistemas Fast Track. Representa un
mximo estimado del ancho de banda de E/S necesario para el servidor, la CPU y la carga de
trabajo. MCR es til como gua de diseo inicial porque solo necesita un almacenamiento local
y un esquema de la base de datos mnimos para calcular el rendimiento potencial de una CPU
determinada. Es importante resaltar que MCR se emplea como punto de partida para el diseo
de sistemas, no es una medida del rendimiento del sistema.
BCR
BCR se mide mediante una serie de consultas que se consideran definitivas de la carga de
trabajo de FTDW. BCR se calcula en trminos de ancho de banda total de lectura del disco
y de la memoria cach, en lugar de la memoria cach nicamente como ocurre con el clculo
de MCR. BCR puede permitir la optimizacin de la infraestructura para un caso concreto de uso
de cliente al realizar las medidas sobre una serie de consultas que coinciden con los patrones
de carga de trabajo del cliente. O bien, en el caso de una FTRA validada de un asociado, se emplea
una serie de consultas de simulacin que aseguran que los sistemas estn diseados para cargas
de trabajo elevadas. En resumen, BCR es una medida real del procesamiento de datos mediante
varias consultas en cargas de trabajo simultneas con volmenes significativos de datos.
Capacidad de datos de usuario
Se trata de la capacidad prevista para la base de datos de SQL Server. La capacidad de datos
de usuario de Fast Track tiene en cuenta la compresin de base de datos posterior a la carga
y representa una estimacin de la cantidad de archivos de datos de usuario o de flujos sin
comprimir que se pueden cargar en el sistema Fast Track. La proporcin de compresin
estndar empleada para FTDW es 3,5:1.
18
Evaluacin completa
Arquitectura de referencia
definida por el usuario
20
Ventajas
Configuracin y adquisicin
del sistema muy rpidas
(de das a semanas)
Costo mnimo de diseo
y evaluation
Menores requisitos de
conocimientos de la
infraestructura
Arquitectura de referencia
predefinida adaptada a la
carga de trabajo esperada
Posible ahorro de costos
en hardware
Mayor confianza en la
solucin
Posibilidad de reutilizar
hardware existente
Posibilidad de incorporar
el hardware ms reciente
Sistema muy optimizado
para su caso de uso
Inconvenientes
Posibilidad de
almacenamiento excesivo
o de menos capacidad de
CPU de la especificada
La evaluacin conlleva
esfuerzo y tiempo
(de semanas a meses)
Necesita informacin
detallada de la carga
de trabajo de destino
El proceso dura varios
meses
Necesita muchos
conocimientos de la
infraestructura
Necesita muchos
conocimientos de
SQL Server
Tabla 3: comparacin de las distintas opciones de evaluacin
con el tiempo) con el uso de la CPU. En la tabla 4 se muestran las asignaciones de memoria
recomendadas para las arquitecturas de referencia de SQL Server 2012. Los valores de
memoria mxima proporcionados no son lmites estrictos, sino que representan valores
promedio para sistemas validados correctamente.
Tamao del servidor
Memoria mnima
Memoria mxima
1 socket
64 GB
128 GB
2 sockets
128 GB
256 GB
4 sockets
256 GB
512 GB
8 sockets
512 GB
768 GB
Tabla 4: asignaciones de memoria recomendadas para SQL Server 2012
Tambin es importante tener en cuenta lo siguiente a la hora de evaluar los requisitos de
memoria del sistema:
asociados, ya que los equipos de ingeniera del asociado de FTDW identifican configuraciones
ms ptimas. Los DSM y/o los documentos especficos de los asociados suelen prescribir
valores diferentes y se deben revisar antes de la configuracin.
Almacenamiento
Disco local: una matriz RAID1 de 2 discos es la asignacin mnima para la instalacin de
Windows Server y SQL Server. Se debe asignar suficiente espacio en disco para los requisitos
de RAM virtual y paginacin. En general, el espacio de disco disponible debe ser 250 GB o 1,5
veces la RAM del sistema, lo que sea mayor. La configuracin de disco restante depende del
caso de uso y de la preferencia del cliente.
Sistema de archivos lgico: se prefiere el montaje de LUN en rutas de carpeta de punto de
montaje en Windows, en lugar de letras de unidad, debido al nmero de volmenes presentes
en muchos sistemas Fast Track.
Tambin puede ser til entender qu asignacin de unidad del sistema operativo Windows
representa cada LUN (volumen), grupo de discos RAID y punto de montaje de Windows Server
en los contenedores de almacenamiento. Puede adoptar un esquema de nomenclatura para los
puntos de montaje y los volmenes al montar LUN en carpetas de Windows. Para obtener ms
informacin acerca de los esquemas de nomenclatura de dispositivos, vea la Gua de
configuracin tcnica proporcionada por cada asociado de Fast Track.
Puede emplear herramientas especficas del proveedor para lograr el esquema de nomenclatura
de volumen recomendado. Si no existe ninguna herramienta adecuada, puede hacer que haya
un disco a disposicin de Windows cada vez de las matrices de almacenamiento mientras
asigna nombres de unidad para garantizar una correcta topologa fsico a lgico.
Sistema de archivos fsico: para obtener ms informacin, incluidas instrucciones detalladas,
vea la seccin Configuracin de la aplicacin de este documento.
Configuracin de los contenedores de almacenamiento: todas las configuraciones de los
contenedores conservan sus valores predeterminados a menos que se indique lo contrario en
la documentacin tcnica del asociado de Fast Track. Las especificaciones de FTDW para la
configuracin del sistema de archivos requieren contenedores de almacenamiento que
permitan la configuracin especfica de agrupaciones de RAID y asignaciones de LUN.
Es preciso tener esto en cuenta si se sustituye hardware de configuracin de referencia
de FTDW o se evala hardware personalizado.
Configuracin de la aplicacin
Windows Server 2008 R2
A menos que se indique lo contrario, se debe usar la configuracin predeterminada para el
sistema operativo Windows Server 2008 R2 Enterprise. Asegrese de que se han aplicado el
Service Pack ms reciente y todas las actualizaciones crticas. La caracterstica E/S de mltiples
rutas es necesaria para muchas arquitecturas de referencia. Para obtener ms informacin
sobre la configuracin detallada de MPIO, vea la Gua de configuracin tcnica del asociado de
Fast Track para la arquitectura de referencia dada. Confirme que Windows Server 2008 R2 est
23
instalado como un rol Servidor de aplicaciones para asegurar la correcta instalacin y los
valores predeterminados de .NET Framework.
SQL Server 2012 Enterprise
Opciones de inicio
Se debe agregar -E a las opciones de inicio. Esto aumenta el nmero de extensiones contiguas
de cada archivo que se asignan a una tabla de base de datos a medida que crece. De esta
forma se mejora el acceso secuencial al disco. Para obtener ms informacin sobre esta
opcin, vea el Artculo 329526 de Microsoft Knowledge Base
(http://support.microsoft.com/kb/329526). Es importante asegurarse de que la opcin -E ha
surtido efecto en el inicio de la base de datos. La opcin distingue maysculas de minsculas y
el formato. Un espacio en blanco antes
o despus de la opcin puede impedir la inicializacin.
Tambin se debe agregar -T1117 a las opciones de inicio. Esta marca de seguimiento asegura
un crecimiento uniforme de todos los archivos de un grupo de archivos en caso de que se
habilite el crecimiento automtico. La recomendacin estndar de FTDW para el crecimiento
del archivo de base de datos es la asignacin previa en lugar de usar el crecimiento automtico
(con la excepcin de tempdb). Para obtener ms informacin, vea la seccin Detalles de
configuracin del almacenamiento de este documento.
Habilite la opcin Bloquear pginas en memoria. Para obtener ms informacin,
vea Habilitar la opcin de bloqueo de pginas en memoria (Windows)
(http://go.microsoft.com/fwlink/?LinkId=141863).
-T834 se debe evaluar caso a caso. Esta marca de seguimiento puede mejorar las tasas de
rendimiento de muchas cargas de trabajo de almacenamiento de datos. Esta marca habilita
asignaciones de pginas grandes en memoria para el grupo de bferes de SQL Server. Para
obtener ms informacin sobre esta y otras marcas de seguimiento, vea el Artculo 920093 de
Microsoft Knowledge Base (http://support.microsoft.com/kb/920093).
Nota: actualmente, SQL Server 2012 no admite el uso deT834 si se usan ndices de almacn
de columnas en la base de datos. Si piensa usar ndices de almacn de columnas, no emplee
esta marca de seguimiento.
Memoria mxima de SQL
En SQL Server 2012 no se debe asignar ms del 92 por ciento de la RAM total del servidor
a SQL Server. Si otras aplicaciones van a compartir el servidor, se debe ajustar en consecuencia
la cantidad de RAM que queda disponible para el sistema operativo. Este valor se controla
mediante la opcin max server memory. Para obtener ms informacin acerca de la configuracin
de memoria para las arquitecturas de referencia validadas, vea la documentacin del asociado
de FTDW.
Regulador de recursos
Las cargas de trabajo de almacenamiento de datos suelen incluir consultas complejas que
funcionan sobre grandes volmenes de datos. Estas consultas pueden consumir mucha
24
25
RAID1 para contenedores con factor de forma grande (LFF) y (5) grupos de discos
RAID10 para contenedores con factor de forma pequeo (SFF).
Los volmenes totales usados como ubicaciones de grupos de archivos para los datos
principales no deben superar los 32. Si el nmero total de LUN del sistema de
almacenamiento supera este umbral, se pueden usar grupos de discos mayores para
reducir el nmero de LUN manteniendo un rendimiento similar de E/S. Por ejemplo,
use un grupo de 8 discos RAID 10 con 1 LUN en lugar un grupo de 4 discos RAID 10
con 1 LUN. En el caso de grupos de discos mayores se reducen el rendimiento y la
eficiencia. Esto vara segn la tecnologa de almacenamiento empleada.
2. Dedique todos los grupos de discos salvo uno a los datos de usuario principales (PRI).
Las ubicaciones de los datos de usuario principales son sinnimas de las ubicaciones
de grupos de archivos de la base de datos de SQL Server.
Todas las FTRA requieren uno o dos LUN por grupo de discos de PRI. Consulte las
instrucciones especficas del proveedor correspondientes a la arquitectura de referencia
elegida. Estos LUN se emplean para almacenar los archivos de base de datos de SQL
Server (archivos .mdf y .ndf).
3. Asegrese de que la asignacin del procesador de almacenamiento principal para cada
volumen de disco asignado a los datos principales dentro de un contenedor de
almacenamiento est equilibrada de manera uniforme. Por ejemplo, un contenedor de
almacenamiento con cuatro volmenes de disco asignados para los datos principales
tendr dos volmenes asignados al procesador de almacenamiento "A" y dos asignados
al procesador de almacenamiento "B".
4. Cree un LUN en el grupo de discos restante para hospedar los registros de
transacciones de la base de datos. En algunas configuraciones mayores de Fast Track,
las asignaciones de registros se limitan exclusivamente a los primeros contenedores de
almacenamiento del sistema. En este caso se usan los grupos de discos adicionales
para el almacenamiento provisional que no sean bases de datos o se dejan sin rellenar
para reducir el costo.
Para cada base de datos, haga lo siguiente:
1. Cree al menos un grupo de archivos que contenga un archivo de datos por LUN de PRI.
Asegrese de que todos los archivos tengan el mismo tamao. Si piensa usar varios
grupos de archivos dentro de una nica base de datos para segregar objetos (por
ejemplo, una base de datos de ensayo para admitir carga), asegrese de incluir todos
los LUN de PRI como ubicaciones para cada grupo de archivos.
2. Al crear los archivos de cada grupo de archivos, asgnelos previamente a su mayor tamao
previsto, con un tamao suficientemente grande como para contener los objetos
previstos.
3. Deshabilite la opcin de crecimiento automtico para los archivos de datos y aumente
manualmente el tamao de todos los archivos de datos cuando se est acercando al
lmite de tamao actual.
4. Para obtener ms informacin acerca de las recomendaciones para bases de datos de
usuario y grupos de archivos, vea la seccin Administrar la fragmentacin de datos de
este documento.
27
Capacidad valorada de FT
(terabytes)
<= 96
<=10
<= 128
>10
<=40
Asignacin mnima de
registro recomendada
Espacio disponible
reflejado en GB
300 GB X 1 volumen
300 GB X 2 volmenes
o bien
600 GB X 1 volumen
28
29
Arquitectura de datos
Estructura de tabla
El tipo de tabla que se emplea para almacenar datos en la base de datos tiene un efecto
significativo sobre el rendimiento del acceso secuencial. Es muy importante disear el esquema
fsico teniendo esto en cuenta para permitir que los planes de consulta induzcan E/S secuencial
en la medida de los posible.
La eleccin de un tipo de tabla desciende al modo en que se obtendr acceso a los datos de la
tabla la mayora de las veces. Se puede usar la siguiente informacin como ayuda para determinar
qu tipo de tabla es preciso considerar segn los detalles de los datos que se van a almacenar.
Tablas de montn
Las tablas de montn proporcionan E/S secuencial limpia para los recorridos de tabla y suelen
reducir la sobrecarga en relacin con la fragmentacin de las tablas. Intrnsecamente no
permiten recorridos basados en intervalos (acceso directo) optimizados como ocurre en las
tablas de ndices clster. En una situacin de recorrido de intervalos, una tabla de montn
recorre toda la tabla (o la particin por rangos adecuada, si se aplica la creacin de
particiones).
El recorrido de tablas de montn alcanza el rendimiento mximo a los 32 archivos, por lo que el
uso de montones para tablas de hechos grandes en sistemas con nmeros elevados de LUN
(ms de 32) o de ncleos (ms de 16) puede requerir el uso del Regulador de recursos, restricciones
de DOP o cambios en la asignacin de archivos de base de datos estndar de Fast Track.
Es mejor usar tablas de montn en los casos siguientes:
30
31
La tabla contiene columnas calificadas por rango que se emplean en las restricciones
de consulta para la mayora de los escenarios de carga de trabajo de consultas de alta
prioridad en la tabla. En las configuraciones de FTDW, la columna de fecha con
particiones de un ndice clster debe ser tambin la clave de ndice clster.
Nota: en algunos casos puede ser conveniente elegir una clave de ndice clster que no
sea la columna de particin de fecha para una tabla de ndices clster. Sin embargo, es
probable que esto provoque fragmentacin a menos que se carguen particiones completas,
ya que los datos nuevos que se superponen a intervalos existentes de clave de ndice
clster crean divisiones de pgina.
Particionamiento de tablas
El particionamiento de tablas puede ser una herramienta importante para administrar la
fragmentacin en bases de datos de FTDW. Por ejemplo, se puede usar el particionamiento
para actualizar o eliminar bloques grandes de datos de usuario basados en intervalos de una
tabla sin dirigirse a otras partes de la tabla. En cambio, la eliminacin fila a fila de un ndice
clster puede provocar una fragmentacin de extensin importante. Un escenario habitual es
volver a crear particiones nuevas despus de que envejezcan y la frecuencia de las operaciones
DML para el intervalo de datos disminuya. La particin es ahora estable con respecto a las
operaciones DML y tiene una fragmentacin de extensin mnima.
Adems, las tablas grandes que se emplean principalmente para rellenar cubos de SQL Server
Analysis Services se pueden crear como tablas de montn con particiones, estando el particionamiento
de las tablas alineado con el particionamiento de los cubos. Cuando se obtiene acceso, solo se
recorren las particiones pertinentes de la tabla grande. (Las particiones que admiten el modo
ROLAP de Analysis Services se pueden estructurar mejor como ndices clster).
Para obtener ms informacin sobre el particionamiento de tablas, vea las notas del producto
Estrategias de tablas e ndices con particiones con SQL Server 2008
(http://msdn.microsoft.com/es-es/library/dd578580(v=SQL.100).aspx).
32
Indizacin
Tenga en cuenta lo siguiente para la creacin de ndices de FTDW:
33
Si bien los modelos de datos normales no estn optimizados perfectamente para los ndices de
almacn de columnas en la versin actual, es importante destacar que las simulaciones de FTDW
se basan en una versin modificada de TPC-H, que es un modelo normalizado. Se siguieron
midiendo mejoras importantes para las cargas de trabajo simultneas que combinaban planes de
consulta con ndices de almacn de columnas y de otro tipo, incluido el rendimiento valorado de
FTDW que casi duplic el rendimiento global de las cargas de trabajo en algunos casos.
Crear ndices de almacn de columnas para modelos de datos
dimensionales
Siga las prcticas recomendadas de ndices de almacn de columnas estndar para los modelos
dimensionales como los esquemas de estrella. Esto se puede considerar un escenario del mejor
caso para el procesamiento de ndices de almacn de columnas.
Administracin de memoria para los ndices de almacn de columnas
Las FTRA validadas para SQL Server 2012 tienen normalmente ms RAM total del sistema que
las configuraciones similares para SQL Server 2008 R2. La razn principal es que las cargas de
trabajo mejoradas con ndices de almacn de columnas se ejecutan de manera ms eficiente
con bloques de memoria mayores. Siempre se debe usar el Regulador de recursos para
establecer la cantidad mxima de memoria por sesin para los entornos de FTDW en los que
piensa aprovechar los ndices de almacn de columnas. En las FTRA validadas se documentan
las configuraciones del Regulador de recursos empleadas para lograr un rendimiento
clasificado por FT y estos valores se pueden considerar un punto de partida para las cargas de
34
35
Use las opciones AUTO CREATE y AUTO UPDATE (sincrnicas o asincrnicas) para
las estadsticas (el valor predeterminado del sistema en SQL Server). El uso de esta
tcnica reduce al mnimo la necesidad de ejecutar estadsticas manualmente.
Si debe recopilar estadsticas manualmente, se deben recopilar idealmente para todas
las columnas de una tabla. Si no es posible ejecutar estadsticas para todas las
columnas, debe recopilar al menos estadsticas de todas las columnas que se usan en
la clusula WHERE o HAVING y en las claves de combinacin. La creacin de ndices
genera estadsticas sobre la clave de ndice, por lo que no tiene que hacerlo explcitamente.
Las estadsticas compuestas (de varias columnas) son fundamentales en muchos
escenarios de combinacin. Las combinaciones de dimensin de hechos que implican
claves de combinacin compuestas pueden producir planes de optimizacin de bucle
anidado poco ptimos en ausencia de estadsticas compuestas. Las estadsticas
automticas no crearn, actualizarn ni reemplazarn estadsticas compuestas.
Las estadsticas que incluyen un valor de clave que aumenta (como una fecha en una
tabla de hechos) deben actualizarse manualmente despus de cada operacin de carga
incremental. En todos los dems casos, se pueden actualizar las estadsticas con
menor frecuencia. Si determina que la opcin AUTO_UPDATE_STATISTICS no es
suficiente en su caso, ejecute estadsticas segn una programacin.
Compresin
Las configuraciones de FTDW estn diseadas con la compresin de pgina habilitada.
Se recomienda usar la compresin de pgina en todas las tablas de hechos. La compresin
de tablas de dimensiones pequeas (es decir, las que tienen menos de un milln de filas)
es opcional. En el caso de tablas de dimensiones mayores suele ser beneficioso usar la
compresin de pgina. En cualquier caso, la compresin de tablas de dimensiones se debe
evaluar para cada caso de uso. La compresin de fila es una opcin adicional que proporciona
tasas de compresin razonables para ciertos tipos de datos.
La compresin de pgina de SQL Server reduce los datos de tablas, ndices y particiones. Esto
reduce la cantidad de espacio fsico necesario para almacenar las tablas de usuario, lo que permite
que quepan ms datos en el grupo de bferes (memoria) de SQL Server. Una ventaja de esto es
la reduccin del nmero de solicitudes de E/S que se atienden desde el almacenamiento fsico.
La cantidad de compresin real que se puede observar vara segn los datos que se estn
almacenando y la frecuencia de campos de datos duplicados dentro de los datos. Si los datos
son muy aleatorios, las ventajas de la compresin son muy limitadas. Incluso en las mejores
condiciones, el uso de la compresin aumenta la demanda de la CPU para comprimir
y descomprimir los datos, pero tambin reduce los requisitos de espacio en disco fsico y en la
mayora de los casos mejora el tiempo de respuesta de las consultas al atender las solicitudes
de E/S desde el bfer de memoria. Generalmente, la compresin de pgina tiene una razn de
compresin (tamao original frente al tamao comprimido) de entre 2 y 7:1, siendo 3:1 una estimacin
conservadora tpica. Los resultados variarn en funcin de las caractersticas de los datos.
36
37
Fragmentacin de extensin
Dentro de SQL Server, todas las pginas de un archivo, independientemente de la asociacin
de tabla, pueden intercalarse hasta el tamao de extensin (2M) o hasta el nivel de pgina
(8K). Esto se debe normalmente a operaciones DML simultneas, actualizaciones excesivas de
nivel de fila o eliminaciones excesivas de nivel de fila.
La reescritura total de la tabla o las tablas en cuestin es la nica forma de garantizar la
asignacin de pginas ptima dentro de un archivo. No existe ningn mtodo alternativo para
resolver este tipo de fragmentacin de base de datos. Por esta razn, es importante seguir las
instrucciones para la configuracin de SQL Server y las prcticas recomendadas para cargar
datos y administrar DML.
La consulta siguiente proporciona informacin fundamental para evaluar la fragmentacin
lgica de una tabla de FTDW. La mtrica con mayor prioridad es Average Fragment Size
(tamao promedio de fragmento). Este valor proporciona un entero que representa el nmero
promedio de pginas de SQL Server que se agrupan en extensiones contiguas.
SELECT db_name(ps.database_id) as database_name
,object_name(ps.object_id) as table_name
,ps.index_id
,i.name
,cast (ps.avg_fragmentation_in_percent as int) as [Logical Fragmentation]
,cast (ps.avg_page_space_used_in_percent as int) as [Avg Page Space Used]
,cast (ps.avg_fragment_size_in_pages as int) as [Avg Fragment Size In Pages]
,ps.fragment_count as [Fragment Count]
,ps.page_count
,(ps.page_count * 8)/1024/1024 as [Size in GB]
FROM sys.dm_db_index_physical_stats (DB_ID() --NULL = All Databases
, OBJECT_ID('$(TABLENAME)')
,1
, NULL
, 'SAMPLED') AS ps
38
En la tabla siguiente se proporciona una regla general para interpretar los valores de tamao
promedio de fragmento.
Tamao promedio de fragmento
>400
Estado
Ideal
Accin
Es un valor ideal y puede ser difcil de
mantener para algunas estructuras de datos.
300-399
Verde
La tabla proporcionar un buen rendimiento
de E/S y no requiere el mantenimiento de la
fragmentacin lgica.
150-299
Amarillo
Es ms probable que la fragmentacin
lgica afecte a la eficacia de E/S. Se
recomienda realizar mantenimiento para
mejorar el nmero de fragmentos.
10-149
Rojo
Fragmentacin lgica importante. Las
solicitudes grandes de E/S en esta estructura
producirn un movimiento significativo de los
cabezales de disco y reducirn la eficacia de
E/S global del sistema.
<10
Rojo
Estos valores tan pequeos del tamao
promedio de fragmento suelen indicar que la
opcin de inicio E de SQL Server no se ha
establecido o no se ha reconocido en el inicio.
Tabla 6: valores del tamao promedio de fragmento
Por ltimo, es importante destacar que los resultados del tamao promedio de fragmento no se
deben evaluar para tablas o particiones menores de 500 MB. Las estructuras de datos pequeas
no tienen suficientes pginas en total para lograr cantidades de fragmento muy eficientes. Adems,
estas estructuras de datos menores suelen representar solicitudes de datos relativamente
pequeas y tienen un impacto limitado sobre la eficiencia de E/S global del sistema. Se suelen
conseguir mejores resultados cuando solo se administran las tablas mayores a las que se
obtiene acceso con ms frecuencia en un entorno de almacenamiento de datos.
Fragmentacin de ndices
Un ndice puede tener un orden fsico (pgina) y lgico (ndice) diferente.
No use el comando ALTER INDEX REORGANIZE para resolver este tipo de fragmentacin
porque su uso puede invalidar las ventajas de las asignaciones grandes. La regeneracin de un
ndice o el uso de INSERT... SELECT para insertar datos en una nueva copia del ndice (lo que
evita una reordenacin) puede resolver este problema. Todos los procesos ALTER INDEX
REBUILD deben especificar SORT_IN_TEMPDB=TRUE para evitar la fragmentacin del grupo
de archivos de destino. Un valor MAXDOP de 1 es ideal pero puede producir velocidades de
carga muy lentas. En algunos casos, es posible establecer los valores de MAXDOP hasta en 8.
Para obtener ms informacin, vea la seccin Cargar datos de este documento.
39
Tablas o ndices que se quitan y se vuelven a crear con frecuencia (dejando huecos en
el diseo de almacenamiento que otros objetos rellenan).
ndices para los que no hay otra opcin que admitir una fragmentacin elevada debido
a las divisiones de pgina, como ocurre cuando se cargan con frecuencia datos
incrementales que se superponen principalmente al intervalo existente de clave de
ndice clster.
Tablas menores (como tablas de dimensiones) que se cargan en incrementos
relativamente pequeos, que se pueden colocar en un grupo de archivos voltil para
evitar que esas filas se intercalen con tablas grandes de transacciones o de hechos.
Bases de datos provisionales desde las que se insertan datos en la tabla de destino final.
Otras tablas se pueden colocar en un grupo de archivos no voltil. Adems, las tablas de
hechos muy grandes tambin se pueden colocar en grupos de archivos diferentes.
Cargar datos
La arquitectura de componentes de Fast Track est equilibrada para los intervalos de
exploracin promedio ms elevados que se obtienen con el acceso a disco secuencial.
Para mantener estos intervalos de exploracin, se debe extremar la precaucin para garantizar
un diseo contiguo de los datos dentro del sistema de archivos de SQL Server.
Esta seccin est dividida en los dos mtodos siguientes: carga incremental y migracin de datos.
Estas instrucciones son especficas, pero no exclusivas, del almacenamiento de datos Fast Track.
Para obtener ms informacin sobre la carga masiva de SQL Server, vea Gua de rendimiento
de la carga de datos (http://msdn.microsoft.com/es-es/library/dd425070.aspx).
Otro recurso til es la Gua de prcticas recomendadas de carga de datos de Fast Track 3.0.
Esta presentacin de Microsoft PowerPoint se encuentra en el Portal de Fast Track DW de SQL
Server (http://msdn.microsoft.com/es-es/library/dd425070.aspx). Aunque este documento se
basaba inicialmente en SQL Server 2008 R2, sigue siendo aplicable a SQL Server 2012.
Cargas incrementales
En esta seccin se abordan los escenarios comunes de carga diaria de un entorno de
almacenamiento de datos. Esta seccin incluye escenarios de carga con uno o varios de los
atributos siguientes:
Se deben tener en cuenta las directrices siguientes cuando cargue tablas de montn y tablas
de ndices clster.
40
41
Opcin 3
Esta opcin requiere el uso de dos grupos de archivos y dos o ms tablas. El enfoque necesita
una tabla de ndices clster con particiones y es ms adecuado para las tablas que experimentan
niveles elevados de fragmentacin lgica en las particiones ms actuales con poca o ninguna
actividad de cambios en las particiones ms antiguas. El objetivo global es poner las particiones
voltiles en un grupo de archivos dedicado y envejecer o "mover" esas particiones al grupo de
archivos esttico cuando dejen de recibir registros nuevos o cambios a los registros existentes:
42
Cree dos grupos de archivos, segn las instrucciones de FTDW. Uno se destinar a las
particiones voltiles y el otro a las particiones estticas. Una particin voltil es aquella
en la que ms del 10 por ciento de las filas cambiar con el tiempo. Una particin
esttica es aquella que no es voltil.
Cree la tabla principal con particiones de ndices clster en el grupo de archivos
esttico.
Cree una tabla coherente con uno de los dos enfoques generales siguientes:
o Una nica tabla de montn con una restriccin que refleje el esquema de
particin de la tabla principal. Esta restriccin debe representar el intervalo voltil
del conjunto de datos principal y puede abarcar uno o varios intervalos de
particin del esquema de la tabla principal. Esto es ms til si el rendimiento de
carga inicial es el principal criterio de decisin porque las cargas en un montn
suelen ser ms eficientes que las cargas en un ndice clster.
o Una nica tabla de ndices clster con un esquema de particin que sea
coherente con la particin de la tabla principal. Esto permite realizar inserciones
directas con un bajo grado de paralelismo (DOP) en la tabla principal a medida
que las particiones voltiles envejecen. Una vez envejecidas mediante insercin
en la tabla principal, se quitan las particiones y se agregan nuevos intervalos.
Genere una vista que una ambas tablas. Esto presenta la combinacin de las dos tablas
como un nico objeto desde la perspectiva del usuario.
Una vez que los intervalos de datos voltiles se conviertan en estticos desde una
perspectiva de cambios de datos, use un proceso adecuado de envejecimiento como el
cambio de particiones:
o Si se usa una tabla de montn con restriccin, mueva los datos por intervalo de
particin al grupo de archivos esttico mediante la insercin en la tabla de ensayo.
Use CREATE INDEX y el cambio de particin para mover los datos a la tabla
principal. Para obtener ms informacin sobre este tipo de operacin para las
configuraciones de FTDW, vea la seccin Migracin de datos de este
documento.
o Si se usa un ndice clster con particiones, use un DOP que sea menor o igual
que 8. Despus, realice una operacin INSERT restringida por intervalo de
particin directamente en la tabla principal. Quizs tenga que establecer el DOP
en un valor tan bajo como 1 para evitar la fragmentacin, segn la simultaneidad
global del sistema.
Migracin de datos
Abarca escenarios de carga grande nica o poco frecuente en un entorno de almacenamiento
de datos. Estas situaciones pueden producirse durante la migracin de la plataforma o mientras
se cargan datos de prueba para la simulacin del sistema. Este tema incluye escenarios de
carga con uno o varios de los atributos siguientes:
44
Simulaciones y validacin
Esta seccin proporciona una descripcin bsica de los procesos empleados para disear y
calificar las arquitecturas de referencia de FTDW de SQL Server. El objetivo de proporcionar
esta informacin es sustentar las arquitecturas de referencia definidas por el usuario o
personalizadas basadas en la metodologa de FTDW. Para realizar simulaciones, solucionar
problemas o comprobar las arquitecturas de referencia de asociados publicadas y ya validadas,
pngase en contacto con el asociado de publicacin (H-P, Dell, EMC, IBM, Cisco, etc.).
El proceso para la validacin de FTDW se puede dividir en las dos categoras que se describen aqu.
Validacin de hardware de lnea base
El objetivo de la validacin de hardware es establecer mtricas de rendimiento reales, no
calificadas, de los componentes de hardware clave de la arquitectura de referencia de Fast
Track. Este proceso determina las caractersticas de rendimiento reales de lnea base de los
componentes de hardware clave en la pila de la base de datos.
Validacin de la base de datos de Fast Track
El establecimiento de caractersticas de rendimiento de SQL Server, en funcin de una carga
de trabajo de FTDW, permite la comparacin con los supuestos de rendimiento proporcionados
por el proceso de evaluacin de hardware de lnea base. En general, la mtrica de rendimiento
de carga de trabajo de la base de datos debe reflejar al menos el 80 por ciento de las tasas de
lnea base para las arquitecturas de referencia validadas de Fast Track. Las mtricas de
rendimiento calculadas en este proceso son la base de los valores de rendimiento de FTDW
publicados y se basan en cargas de trabajo de consulta SQL simultneas ejecutadas con la
herramienta de simulacin Reference Point de Fast Track.
Reference Point es una herramienta de software de Microsoft distribuida a los asociados de
hardware de Fast Track y es la nica infraestructura a travs de la cual Microsoft puede validar
y aprobar una arquitectura de referencia oficial de Fast Track. La herramienta crea una
instancia de un esquema de la base de datos de referencia y controla varias cargas de trabajo
de consulta simultneas diseadas para identificar cuellos y establecer medidas clave del
rendimiento del sistema.
Validacin de Fast Track con ndices de almacn de columnas optimizados en
memoria xVelocity
SQL Server 2012 implementa la tecnologa de ndice de almacn de columnas como opcin de
ndices no clster para las tablas ya existentes. Las consultas individuales pueden usar o no
planes de optimizacin de ndices de almacn de columnas en funcin de la estructura de la
consulta. Esto significa que no se puede predecir la combinacin de planes de consulta de fila
tradicionales y de columnas nuevos para un entorno FTDW en un momento dado.
Por estos motivos, el diseo y la validacin del sistema de FTDW para SQL Server 2012 se
basa en simulaciones de ndices que no son de almacn de columnas. Los sistemas FTDW
estn diseados para funcionar eficazmente en caso de que no se alcance ninguna optimizacin
de columnas en ningn perodo de tiempo dado. Se suelen conseguir mejoras significativas de
45
rendimiento cuando los planes de consulta de ndices de almacn de columnas estn activos
y este rendimiento se puede considerar incremental respecto al diseo del sistema bsico.
Las arquitecturas de referencia de Fast Track para SQL Server 2012 validadas por los asociados
publican una tasa de rendimiento lgico adicional para las simulaciones mejoradas de ndices
de almacn de columnas y estas cifras se pueden emplear para calcular aproximadamente el
impacto positivo en el rendimiento de las consultas que los clientes pueden esperar en una
carga de trabajo de consulta simultnea. Estas cifras se basan en las mismas simulaciones
y el mismo esquema de FTDW usados para todas las validaciones del sistema.
Server. El registro y el almacenamiento de los resultados de estas pruebas le aportar una lnea
base para el anlisis de rendimiento y la resolucin de problemas en el futuro.
Paso 1: validar el ancho de banda de E/S
El primer paso para validar una configuracin de FTDW consiste en determinar el rendimiento
agregado mximo que se puede observar entre la red de E/S de almacenamiento y el servidor.
Esto implica quitar el disco como cuello de botella y centrarse en los componentes que no son
de disco (es decir, los HBA, la infraestructura de conmutador y las controladoras de matriz).
Use los pasos siguientes para realizar esta tarea con SQLIO:
1. Genere un pequeo archivo de datos en cada LUN que se usar para los archivos de
base de datos. El tamao de estos archivos debe permitir que todos los archivos de
datos quepan en la memoria cach de lectura de las controladoras de matriz (por
ejemplo, 50 MB por archivo).
2. Use SQLIO para emitir lecturas secuenciales en el archivo de forma simultnea usando
tamaos de E/S de bloque grandes (512K) y al menos dos subprocesos de lectura por
archivo. Asegrese de calcular las lecturas pendientes agregadas. Por ejemplo,
2 subprocesos de lectura con 50 solicitudes pendientes daran un total de
100 solicitudes pendientes en el LUN de destino.
3. Empiece con un valor relativamente bajo para las operaciones de E/S pendientes (-o)
y repita las pruebas aumentando este valor hasta que no haya ninguna mejora en el
rendimiento agregado.
El objetivo de esta prueba es alcanzar un rendimiento agregado que sea razonable en comparacin
con los lmites tericos de los componentes de la ruta de acceso entre el servidor y el almacenamiento.
Esta prueba valida el ancho de banda entre el servidor y los procesadores de almacenamiento
SAN; es decir, las rutas de acceso de canal de fibra de mltiples rutas.
Paso 2: validar el ancho de banda de LUN/volumen
Esta prueba es similar a la anterior. Sin embargo, se emplea un archivo mayor para quitar
posibles beneficios de la memoria cach de matriz de la memoria cach de la controladora.
Estos archivos de prueba deben ser suficientemente grandes para simular el tamao del
archivo de base de datos de destino por volumen, por ejemplo 25 GB por volumen. Se deben
usar parmetros similares para SQLIO como se describe en el paso 1.
Se deben emitir lecturas secuenciales de bloques grandes (512 KB) en los archivos de prueba
de cada volumen. Se recomienda usar un nico subproceso por archivo con una profundidad
de solicitudes pendientes de entre 4 y 16 (empiece con un valor pequeo y vaya aumentndolo
hasta que se alcance el mximo rendimiento). En primer lugar, pruebe cada volumen individualmente
y pruebe despus los dos simultneamente. El rendimiento del grupo de discos vara segn el
proveedor y la configuracin de almacenamiento, pero siempre se puede hacer una comparacin
con las tasas de lectura de un solo HDD. Por ejemplo, un grupo de 4 discos RAID1+0 podra
alcanzar una tasa de lectura mxima de casi cuatro veces la tasa de lectura de un solo HDD
para este tipo de patrn bsico de lectura. El rendimiento de RAID 1 o 1+0 puede variar en
funcin del producto de almacenamiento, ya que la tecnologa de algunos proveedores permiten
47
la "lectura reflejada", que permite atender las operaciones de E/S desde ambos lados del par
reflejado cuando se reciben solicitudes contiguas.
Paso 3: validar el ancho de banda agregado
En esta prueba, se deben ejecutar lecturas secuenciales en todos los volmenes de datos
disponibles de forma simultnea en los mismos archivos usados en el paso 2. SQLIO se debe
ejecutar usando dos subprocesos por archivo de prueba, con un tamao de E/S de 512K y un
nmero ptimo de E/S pendientes segn determine la prueba anterior.
Los resultados de esta prueba muestran el rendimiento agregado mximo que se puede
conseguir al leer datos de los discos fsicos.
Los datos se leen del archivo de datos grande, como en la prueba anterior, en cada volumen
simultneamente.
El rendimiento agregado del disco debe estar entre el 80 y el 90 por ciento del ancho de banda
agregado de E/S de almacenamiento para los sistemas FTDW equilibrados.
Valoraciones de los componentes
En el diagrama siguiente se muestran los resultados de simulaciones sintticas que son coherentes
con los valores que se obtienen en arquitecturas de referencia de Fast Track similares.
48
Ilustracin 4: ejemplo de simulacin sinttica que obtuvo el ancho de banda para un servidor
de 2 sockets con 12 ncleos, con 3 tarjetas HBA de 8Gbps de puerto doble, con 12 volmenes
de datos principales de 4 discos RAID1+0
Resumen
Las simulaciones de hardware de lnea base validan la capacidad de ancho de banda real para
los principales componentes de hardware de la pila de la base de datos. Para ello se ejecuta
una serie de pruebas sintticas del caso mejor mediante una herramienta como SQLIO.
49
Qu es MCR?
El clculo de MCR proporciona un valor de rendimiento de E/S por ncleo en MB o GB por
segundo. Este valor se mide ejecutando una consulta predefinida no optimizada de solo lectura
desde la memoria cach del bfer y midiendo el tiempo que se tarda en ejecutar con la cantidad
de datos en MB o GB. Puesto que MCR se ejecuta desde la memoria cach, representa el intervalo
de exploracin no optimizado mximo que se puede conseguir con SQL Server para el sistema
que se est evaluando. Por esta razn, MCR proporciona una tasa mxima de la lnea base para
el diseo inicial. No est pensada para indicar los resultados promedio o previstos para una carga
de trabajo real. Las arquitecturas de FTDW validadas tendrn resultados agregados de rendimiento
de E/S de lnea base que sean al menos el 100 por cien del valor de MCR calculado en el servidor.
Otra manera de explicar esto es que MCR representa la mejor velocidad de procesamiento
posible de SQL Server para una carga de trabajo razonable del caso peor.
MCR se puede usar tambin como marco de referencia a la hora de comparar otras
arquitecturas de referencia de FTDW publicadas y validadas para SQL Server 2012.
En resumen:
MCR no es una medida definitiva de los resultados reales para una carga de trabajo de
cliente.
MCR proporciona una lnea base de velocidad mxima de procesamiento de datos para
SQL Server y una nica consulta asociada a la carga de trabajo de Fast Track.
MCR es especfica de una CPU y un servidor. En general, las valoraciones para una
CPU dada no varan mucho segn el servidor y la arquitectura de la placa base, pero el
valor final de MCR se debe determinar mediante pruebas reales.
La tasa de rendimiento de MCR se puede usar como valor comparativo con
arquitecturas de referencia de FTDW existentes ya publicadas. Esto puede ayudar
a elegir el hardware antes de realizar las pruebas de componentes y de aplicaciones.
Calcular MCR
Para establecer una tasa de consumo de CPU de lnea base para la aplicacin de SQL Server
se ejecuta una consulta SQL estndar definida para el programa FTDW. Esta consulta est
diseada de forma que sea una representacin relativamente sencilla de una consulta tpica
para el tipo de carga de trabajo (en este caso, almacenamiento de datos) y se ejecuta desde la
memoria cach del bfer. El valor resultante es especfico de la CPU y el servidor en los que se
est ejecutando la consulta. Use el mtodo siguiente para calcular MCR:
1. Cree un conjunto de datos de referencia basado en la tabla lineitem de TPC-H o un
conjunto de datos similar. El tamao de la tabla debe permitir su almacenamiento entero
en memoria cach en el grupo de bferes de SQL Server y mantener un tiempo de
ejecucin mnimo de un segundo para la consulta proporcionada aqu.
2. Para FTDW se emplea la consulta siguiente: SELECT sum([campo entero]) FROM
[tabla] WHERE [restringir al volumen de datos adecuado] GROUP BY [col].
3. El entorno debe:
o Asegurarse de que la configuracin del Regulador de recursos tiene los valores
predeterminados.
50
4.
5.
6.
7.
51
52
53
Resultados de BCR
En la ilustracin 6 se muestran los resultados de simulaciones basadas en cargas de trabajo de
SQL Server que son coherentes con los valores que se obtienen en arquitecturas de referencia
de Fast Track Data Warehouse similares.
Ilustracin 6: ejemplo de simulacin sinttica que obtuvo el ancho de banda para un servidor
de 2 sockets con 12 ncleos, con 3 tarjetas HBA de 8 Gbps de puerto doble, con 12 LUN de
datos principales de 4 discos RAID1+0
54
Conclusin
SQL Server Fast Track Data Warehouse ofrece una plantilla y herramientas para hacer realidad
un almacenamiento de datos, desde el diseo hasta la implementacin. En este documento se
describe la metodologa, las opciones de configuracin, las prcticas recomendadas, las
configuraciones de referencia, y las tcnicas de simulacin y validacin para Fast Track Data
Warehouse.
55
Le sirvi de ayuda este documento? Envenos sus comentarios. Dganos, en una escala del
1 (poco til) al 5 (excelente), cmo calificara este documento y por qu lo valora con esta
puntuacin. Por ejemplo:
Lo valora alto debido a que tiene buenos ejemplos, capturas de pantalla excelentes,
una redaccin comprensible u otra razn?
Lo valora bajo debido a que sus ejemplos son escasos, las capturas de pantalla son
borrosas o su redaccin es poco clara?
Esta informacin nos ayudar a mejorar la calidad de las notas del producto que publicamos.
Enviar comentarios.
56
Apndice
Herramienta de ajuste de tamao de FTDW
La Herramienta de ajuste de tamao de FTDW es una calculadora en forma de hoja de clculo
que le ayuda en el proceso para calcular un requisito de carga de trabajo de cliente en trminos
de rendimiento de FTDW. Puede usar esta herramienta si no dispone de una plataforma de pruebas
o como punto de partida para evaluar los requisitos del cliente. La herramienta se encuentra en
Fast Track Data Warehousing (http://www.microsoft.com/sqlserver/en/us/solutionstechnologies/data-warehousing/fast-track.aspx). Adems, algunos proveedores asociados han
generado sus propias herramientas de ajuste de tamao de Fast Track. Se pueden encontrar
en los sitios web de los asociados.
57
58
( NAME = N
FILEGROWTH
( NAME = N
FILEGROWTH
( NAME = N
FILEGROWTH
( NAME = N
FILEGROWTH
( NAME =
417GB ,
( NAME =
417GB ,
( NAME =
417GB ,
( NAME =
417GB ,
'FT_Demo_v6.ndf'
= 0 ),
'FT_Demo_v7.ndf'
= 0 ),
'FT_Demo_v8.ndf'
= 0 ),
'FT_Demo_v9.ndf'
= 0 ),
N 'FT_Demo_v11.ndf'
FILEGROWTH = 0 ),
N 'FT_Demo_v12.ndf'
FILEGROWTH = 0 ),
N 'FT_Demo_v13.ndf'
FILEGROWTH = 0 ),
N 'FT_Demo_v14.ndf'
FILEGROWTH = 0 ),
LOG ON
( NAME = N 'FT_LOG_v5.ldf' , FILENAME = N 'C:\FT\LOG\SE1-SP2-DG5-v5' , SIZE = 100GB ,
MAXSIZE = 500GB , FILEGROWTH = 50 )
GO
/*****************Configurar los valores recomendados***********************/
ALTER DATABASE FT_Demo SET AUTO_CREATE_STATISTICS ON
GO
ALTER DATABASE
GO
FT_Demo
SET AUTO_UPDATE_STATISTICS ON
ALTER DATABASE
GO
FT_Demo
SET AUTO_UPDATE_STATISTICS_ASYNC ON
ALTER DATABASE
GO
FT_Demo
61
62
Mediante BULK INSERT, estos datos se insertaron en paralelo en una nica tabla de ensayo de
ndices clster, usando el registro mnimo; elegimos un tamao de bloque que no inundara la
memoria disponible y que reducira el volcado en el disco. La deshabilitacin de los bloqueos
de pgina y la extensin de bloqueo en la tabla de ensayo mejor el rendimiento durante esta fase.
Se realiz una insercin final en una tabla de destino idntica, con MAXDOP 1 (mediante la
sugerencia TABLOCK) y evitando una ordenacin.
Ejecutar consultas para la medida de BCR
Use la herramienta SQL Server Profiler para registrar informacin pertinente para las simulaciones
de consulta. Se debe configurar SQL Server Profiler para que registre las lecturas lgicas, la CPU,
la duracin, el nombre de la base de datos, el nombre de esquema, la instruccin SQL y los
planes de consulta reales. Tambin se pueden usar los parmetros de sesin de estadsticas
set statistics io on y set statistics io on.
A continuacin se muestran algunas consultas de ejemplo (basadas en consultas de la
simulacin de TPC-H) y el valor de BCR conseguido en los sistemas de referencia. Tenga en
cuenta que este ejemplo no es indicativo del rendimiento que se obtendr en cualquier sistema
dado. Los valores de BCR son nicos segn el sistema, el tamao del esquema, los tipos de
datos, la estructura de la consulta y las estadsticas, por citar tan solo algunas de las muchas
variables posibles.
Complejidad de la consulta
Simple
Promedio
Compleja
Tabla 7: ejemplos de simulaciones
Simple
SELECT
sum(l_extendedprice * l_discount) as revenue
FROM
lineitem
WHERE
l_discount between 0.04 - 0.01 and 0.04 + 0.01 and
l_quantity < 25
OPTION (maxdop 4)
63
Promedio
SELECT
l_returnflag,
l_linestatus,
sum(l_quantity) as sum_qty,
sum(l_extendedprice) as sum_base_price,
sum(l_extendedprice*(1-l_discount)) as sum_disc_price,
sum(l_extendedprice*(1-l_discount)*(1+l_tax)) as sum_charge,
avg(l_quantity) as avg_qty,
avg(l_extendedprice) as avg_price,
avg(l_discount) as avg_disc,
count_big(*) as count_order
FROM
lineitem
WHERE
l_shipdate <= dateadd(dd, -90, '1998-12-01')
GROUP BY
l_returnflag,
l_linestatus
ORDER BY
l_returnflag,
l_linestatus
OPTION (maxdop 4)
Compleja
SELECT
100.00 * sum(case
when p_type like 'PROMO%'
then l_extendedprice*(1-l_discount)
else 0
end) / sum(l_extendedprice * (1 - l_discount)) as
promo_revenue
FROM
lineitem,
part
WHERE
l_partkey = p_partkey
and l_shipdate >= '1995-09-01'
and l_shipdate < dateadd(mm, 1, '1995-09-01')
OPTION (maxdop 4)
64
65