Mtodosyherramientasciclosdemejora PDF

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/299486837
Métodos y herramientas para la realización de ciclos de mejora de la calidad en

servicios de salud
Book · January 2015
CITATIONS READS
11 8,775
1 author:
Pedro Saturno
National Institute of Public Health, Mexico
165 PUBLICATIONS 1,338 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
How to study the nosocomial infection outbreaks? View project
Indicadores de Boas Práticas de Segurança do Paciente - Projeto ISEP-Brasil View project
All content following this page was uploaded by Pedro Saturno on 30 March 2016.
The user has requested enhancement of the downloaded file.

Métodos y herramientas
para la realización de ciclos de mejora
de la calidad en servicios de salud
Métodos y herramientas para la realización
de ciclos de mejora de la calidad en servicios de salud
Primera edición, 2015
D.R. © Instituto Nacional de Salud Pública

Av. Universidad 655, Col. Santa María Ahuacatitlán
62100 Cuernavaca, Morelos, México
ISBN: 978-607-511-152-0
Impreso y hecho en México

Printed and made in Mexico
Citación sugerida: Saturno-Hernández PJ. Métodos y herramientas para la realización de ciclos de mejora de la
calidad en servicios de salud. Cuernavaca, México: Instituto Nacional de Salud Pública, 2015.
Acerca del autor
P
edro J. Saturno Hernández es médico, doctor en Salud Pública
por la Universidad de Harvard, profesor honorífico de Salud
Pública de la Facultad de Medicina de la Universidad de Mur-
cia (España) y científico visitante y miembro del Grupo de Salud Glo-
bal de la Escuela de Salud Pública de la Universidad de Harvard. Di-
rige una Maestría en línea sobre Gestión de la Calidad en Servicios de
Salud, que actualmente se imparte en su 15° edición en la Universidad
de Murcia, en su segunda en el Instituto Nacional de Salud Pública
(INSP), en México y en su primera en la Universidad de Rio Grande
del Norte, en Brasil.
Previamente se ha desempeñado como director general adjunto
de Planificación Sanitaria y Educación en el Ministerio de Salud de
España. Tiene una extensa experiencia como consultor sobre gestión
de la calidad en servicios de salud para agencias internacionales como
la Organización Mundial de la Salud (OMS) y la Agencia de Estados
Unidos para el Desarrollo Internacional (USAID), entre otras. Ha par-
ticipado en varios grupos de trabajo y comités nacionales e interna-
cionales en relación con la gestión de la calidad, prevención en salud
y educación a lo largo de los últimos 30 años, ha impartido cursos
especializados y conferencias en numerosos ámbitos y ha ayudado a
la implantación de programas de mejora de la calidad en varios países
e instituciones.
Actualmente es AXA Professor on Healthcare Quality y director
adjunto del Centro de Investigación en Calidad y Encuestas del INSP.
Contenido
Presentación 11
Capítulo 1.
Marco conceptual para la gestión de la calidad 13
Capítulo 2.
Identificación y priorización de oportunidades de mejora 39
Capítulo 3.
Métodos y análisis de los problemas de calidad 61
Capítulo 4.
La construcción de criterios para evaluar la calidad 81
Capítulo 5.
Diseño de estudios de nivel de calidad y la investigación de causas.
Componentes de una evaluación 101
Capítulo 6.
Diseño de estudios para la investigación de causas 123
Capítulo 7.
Análisis y presentación de los datos de una evaluación 141
Capítulo 8.
Diseño de intervenciones para mejorar 167
Capítulo 9.
Implementación de intervenciones para la mejora de la calidad.
Métodos de seguimiento y control 179
Capítulo 10.
Cierre del ciclo de mejora. Reevaluación, análisis y presentación
de resultados comparativos de dos evaluaciones 189
Presentación
L
a mejora de la calidad de los servicios de salud precisa una atención específica, continua-
da y practicada con una metodología rigurosa en la que tienen cabida la innovación y la
experimentación en formas de hacer las cosas, pero que siempre ha de venir acompañada
de medición. Lo que no se mide no se conoce bien, lo que no se conoce no se puede mejorar, y la
mejora conseguida sólo puede tenerse como cierta si se documenta adecuadamente.
Sin apartarse de este principio general, se puede entrar a la dinámica de la mejora continua de
la calidad con tres enfoques o grupos de actividades, diferenciables metodológicamente pero en
definitiva complementarios: (i) planificación o diseño de la calidad, anticipándose a los problemas
y diseñando los procesos para conseguir –cuando se implementen– los resultados deseados; (ii)
monitorización de indicadores válidos, confiables y útiles para identificar –cuando se midan– si
estamos en los niveles de calidad deseados, y (iii) ciclos de mejora sobre problemas identificados
en la implementación de los procesos, resultados obtenidos o resultados de la monitorización.
Los tres enfoques son relevantes; los tres son una buena puerta de entrada para la mejora de la
calidad; los tres se interrelacionan, pero el central es el de ciclos de mejora. Sin el complemento de
este enfoque, la monitorización y planificación pueden ser inútiles o, como mínimo, insuficientes
para gestionar y mejorar la calidad. En los tres, sin embargo, es imprescindible un bagaje meto-
dológico adecuado para la implementación rigurosa y eficiente.
El presente manual aporta los conocimientos teóricos y, sobre todo, prácticos para la realiza-
ción paulatina de un ciclo de mejora sobre los problemas de calidad comenzando por su identifi-
cación y definición y pasando por todas las etapas analíticas, de intervención y de medición que
culminan con la documentación de la mejora conseguida. Complementa otros dos volúmenes:
uno, ya publicado, se centra en la metodología para la monitorización;1 el segundo, en prepara-
ción, aborda los métodos y herramientas para el diseño o planificación de la calidad en servicios
de salud. En conjunto, estos manuales constituyen un material de apoyo y referencia práctica
para hacer realidad el compromiso con la mejora de la calidad, que recae en todos los elementos,
personas y niveles del sistema de salud.
Hace ya años que se reconoce la responsabilidad que, además de los dirigentes del sistema,
ejerce el propio personal de salud en la evaluación y mejora de la calidad, aunque sólo sea desde
el punto de vista de la ética profesional. Se advierte como absolutamente necesario que la capaci-
1. Saturno-Hernández PJ. Métodos y herramientas para la monitorización de la calidad en servicios de salud. Cuernavaca, México: Instituto Nacional de Salud
Pública, 2015.
• 11 •
tación en la metodología adecuada para la mejora de la calidad forme parte de los conocimientos
y habilidades de todo el personal de salud.2-5
Existe un gran vacío, no sólo en los programas de formación de pregrado y posgrado, sino
también en el sector salud. No hay manuales que, como el que aquí se presenta, contribuyan con
la consecución de este objetivo ético y profesional para poder avanzar en la necesaria capacidad
organizacional del sistema de salud con el fin de ofrecer servicios de la mayor calidad posible.6,7
La forma secuencial en que están organizados los contenidos permite utilizar este manual
como guía metodológica para cada uno de los pasos de un ciclo de mejora, de forma que se pro-
vee al lector de las herramientas esenciales para aplicarlas de forma específica en cada uno de los
pasos o etapas.
Sin dejar de lado elementos conceptuales o teóricos, el enfoque es eminentemente práctico. El
presente manual, además, está avalado por más de quince años de utilización en la realidad de
los servicios de salud, durante los cuales ha formado parte del material de apoyo de la Maestría
en Gestión de Calidad en los Servicios de Salud, cuya metodología está orientada a la solución de
problemas reales y que actualmente se ofrece en España, México y Brasil.
Por otra parte, la estructura del manual sigue y pone énfasis en los aspectos requeridos a
nivel internacional para poder reportar un ciclo de mejora en términos publicables en revistas
científicas.8 De esta forma, no sólo es una guía para realizar las actividades del ciclo de mejora con
el rigor necesario, sino también para concretarlo sin perder de vista el tipo de información que ha
de ser útil para comunicar la experiencia y que otros profesionales y unidades puedan aprender
de ella. Con esto, se pretende incidir en la extensión y conocimiento de las herramientas para la
mejora continua mostrando su utilidad y beneficios, tanto para los profesionales, como para el
sistema en su conjunto y, principalmente, para la población a la que se atiende.
2. Berwick DM, Enthoven A, Bunker JP. Quality management in the NHS: the doctor’s role. BMJ 1992;304:235-239.
3. Brennan TA. Physicians’ professional responsibility to improve the quality of care. Academic Medicine 2002;77(10):973-980.
4. Peterson LE, Jaen CR, Phillips RL. Family physician participation in quality improvement. J Am Board Fam Med 2013;26:626-627.
5. Jones AC, Shipman SA, Ogrinc G. Key characteristics of successful quality improvement curricula in physician education: a realist review. BMJ Qual Saf
Published Online First: 30 Sep. 2014. doi:10.1136 bmjqs-2014-002846.
6. Jones AC, Shipman SA, Ogrinc G. Key characteristics of successful quality improvement curricula in physician education: a realist review. BMJ Qual Saf
Published Online First: 30 Sep. 2014. doi:10.1136 bmjqs-2014-002846.
7. Therman S, Massoud R, Saturno P: Quality of care. A process for making strategic choices in health systems. Ginebra: WHO, 2006.
8. Ogrinc G, Davies L, Goodman D, et al. SQUIRE 2.0 (Standards for quality improvement reporting excellence): revised publication guidelines from a detailed
consensus process BMJ Qual Saf Published Online First: 14 Sep.2015 doi:10.1136/bmjqs-2015-004411.
Capítulo 1
Marco conceptual
para la gestión de la calidad
Contenido general y objetivos específicos
1. El concepto general y operativo de la calidad
2. Satisfacción del profesional: concepto de cliente interno
3. Concepto de calidad total
4. Gestión de la calidad. Componentes esenciales de un sistema de gestión
de la calidad
5. Los bloques estratégicos para la mejora de la calidad
6. Las actividades para la mejora de la calidad
7. Programas internos y externos en la estrategia para la mejora de la calidad
8. Responsabilidades en la mejora de la calidad
9. Estrategias de implantación de actividades. El ciclo de mejora

Actividades para la mejora continua, pasos del ciclo de mejora
y su correspondencia con los capítulos de este manual
2 Identificación
de oportunidades de mejora Capítulo 2
Monitorización
Análisis del problema Capítulo 3
Elaboración
1 de indicadores y plan
de monitoreo Elaboración de criterios
o indicadores para Capítulo 4
medir calidad
(RE) Diseño de estudio

Capítulo 10 Evaluación del nivel de evaluación del nivel Capítulo 5
de calidad de calidad
Implantación Recogida, análisis

Capítulo 9 de la intervención y discusión Capítulo 7
diseñada de los datos
Capítulo 8 Diseño
de intervención
Definición de criterios/ Diseño de estudios

Experimentación Capítulo 6
requisitos de calidad de causas
• Definición de resultados por conseguir 3

• Nuevo producto o servicio
Puntos de partida 1 Monitorización 2 Ciclo de mejora 3 Diseño

Vía de acción normal
Vía contingente o alternativa
Contenido general
En este capítulo se da un marco de referencia global para las actividades de gestión de la calidad.
Se aborda la definición de calidad, necesaria para dar sentido (validez) a los aspectos que vamos
a medir y mejorar, y se especifican las principales actividades y componentes que ha de tener
un sistema de gestión de la calidad, así como responsabilidades y estrategias de implantación.
Finalmente, se describen de forma introductoria los distintos pasos de un ciclo de mejora, la
actividad central a cuya realización está dirigido el presente manual metodológico.
Objetivos específicos
1. Diferenciar definiciones genéricas de calidad, aplicables a cualquier tipo de producto o

servicio, de las definiciones específicas de actividades y de productos en el ámbito de los
servicios de salud.
2. Describir las dimensiones o aspectos generales que entraña el concepto de calidad de los
servicios de salud.
3. Distinguir los conceptos de cliente interno y cliente externo, aplicados a los servicios de
salud.
4. Identificar los componentes esenciales de un programa o sistema de gestión de la calidad.
5. Identificar los grandes bloques estratégicos para la mejora de la calidad.
6. Distinguir los tres grandes grupos de actividades que componen los programas de gestión
de la calidad.
7. Describir los puntos de partida (inicio) y los objetivos directos de cada grupo de actividades.
8. Explicar las diferencias entre los enfoques interno y externo.
9. Identificar el tipo de enfoque que corresponde a cada uno de los protagonistas (administra-
ción, personal de atención directa, pacientes/población) y las estrategias para la mejora de la
calidad en los servicios de salud.
10. Justificar la responsabilidad y el protagonismo que corresponde al personal que presta direc-
tamente los servicios, como proveedor y como cliente interno del sistema.
11. Razonar las ventajas e inconvenientes de las tres principales formas de comenzar las activida-
des para la mejora de la calidad.
12. Describir los principales pasos o fases de un ciclo de mejora.
Marco conceptual Capítulo
para la gestión de la calidad 1
“Cuando la mente se ensancha para dar cabida a una idea nueva

nunca recupera su dimensión original”.
Necesitamos definir qué es

1. El concepto general y operativo de la ficar. Vamos a necesitar definir para medir y
calidad para, entre otras
calidad medir para saber cómo podemos intervenir cosas, dar validez a su
para mejorar aquello que previamente hemos medición y mejora.
Definir lo que se entiende por calidad de la definido.
atención no es una disquisición teórica irre- Para orientarnos en la concreción de lo que
levante para la práctica, si lo que pretende- vamos a entender por calidad, es conveniente
mos es explicitar el marco de referencia para distinguir tres niveles, de más general a más
su evaluación y mejora. Las más elementales específico, tal como está representado en la fi-
reglas de validez exigen tener claro qué que- gura 1.1. Los tres niveles de conceptualización
remos decir con calidad de la atención cuando han de ser consistentes entre sí. Vamos a ver a
va a ser ese concepto el que vamos a cuanti- qué se refiere cada uno de ellos.
Calidad en general
Calidad de los servicios de salud
Calidad de un servicio concreto
Figura 1.1. Los niveles del concepto de calidad
• 17 •
Métodos y herramientas para la realización de ciclos de mejora de la calidad en servicios de salud
En general, la definición de
1.1. El concepto general de calidad nera que sintonicen perfectamente con éstas.
calidad de un producto o
servicio ha de hacerse en
La falta de sintonización, por desconocimiento
función de las necesidades De una manera amplia, el concepto de calidad de las necesidades y expectativas de los recep-
y expectativas de quien lo puede aplicarse a muy diversos aspectos de tores o por no ser capaces de diseñar los servi-
recibe. una determinada actividad industrial o de ser- cios de forma que satisfagan estas necesidades
vicios: desde niveles filosóficos globales, hasta y expectativas, serán defectos de calidad. Este
la calidad de los procesos, la organización del esquema básico está representado en la figura
personal, los objetivos de la empresa, etc. Aquí 1.2. En consecuencia, la calidad va a depender
nos vamos a referir de momento a calidad del de lo correcta que sea la interpretación que ha-
producto o servicio que se ofrece. La pregun- gamos de las necesidades y expectativas de los
ta por responder sería: ¿Cómo sabremos si un usuarios y de cómo las incorporemos al diseño
producto o servicio es de calidad? Como ejem- de los productos o servicios.
plo, veamos las respuestas de algunos de los
autores más influyentes sobre la calidad de la 1.2. El concepto de calidad en servicios de
industria: Juran, Deming e Ishikawa. Juran de- salud
fine la calidad como “idoneidad o aptitud para
el uso”. Un producto o servicio será de calidad Hay múltiples definiciones de lo que se entien-
si sirve para lo que está previsto que sirva. La de por calidad de los servicios de salud. Todas
aplicación de este concepto a un servicio o pro- responden a diversas interpretaciones sobre
ducto concreto exige una definición previa de qué significa atender las necesidades sanitarias
qué necesidades y expectativas está previsto de la población a la que se ofrecen los servicios
que sean satisfechas con el producto o servicio cuya calidad queremos definir.
El concepto de calidad y que se va a evaluar, las cuales serían diferentes En la definición adoptada en el Programa
el contexto de los centros según el producto o servicio y determinarán Ibérico (Saturno PJ, Imperatori E, Corbella A,
sanitarios van a ser la base las características que éste ha de tener para que 1990), calidad de la atención es “la provisión
para las actividades de sea de calidad. de servicios accesibles y equitativos, con un
gestión de la calidad Deming propone definir la calidad “en
función del sujeto que ha de juzgar el producto
o servicio”. La idea básica es la misma: quién
compra o demanda el servicio lo hace en fun- Servicios
ción de unas necesidades y expectativas que
son las que van a determinar si lo que recibe es Receptor
o no de calidad. Proveedor (usuario o cliente)
Ishikawa utiliza la misma idea: la calidad
del producto o servicio es la “satisfacción de
los requisitos de los consumidores de ese pro- Servicios de alta calidad:
ducto o servicio”. Hay que determinar, pues, responden a las necesidades y expectativas de los receptores
cuáles son esos requisitos para poder saber
si el producto o servicio es de calidad. Como Servicios
puede apreciarse, hay un esquema básico sub-
yacente a estas definiciones, que nos puede Receptor
servir para describir y analizar la calidad de Proveedor (usuario o cliente)
cualquier producto o servicio. Este esquema
básico parte de tres componentes que hay que
identificar y caracterizar: proveedor, servicio o
producto que se ofrece y receptor del servicio o Servicios de baja calidad:
no responden a las necesidades y expectativas de los receptores
producto. Para que haya calidad, el que ofrece
el servicio ha de tener en cuenta las necesida-
des y expectativas del receptor a quién va diri- Figura 1.2. Esquema para la definición de calidad
gido, y modelar el servicio o producto de ma-
• 18 •
Marco conceptual para la gestión de la calidad
nivel profesional óptimo, que tiene en cuen- proponiendo un esquema de sólo cuatro, nor-
ta los recursos disponibles y logra la adhesión malmente suficiente como marco de referen-
y satisfacción del usuario”. Esta definición, cia, y que resulta acorde con la definición que
como cualquier otra que decidamos adoptar, hemos propuesto.
explicita una serie de dimensiones que nos La competencia profesional o calidad cien-
dan pistas de hacia dónde mirar para valo- tífico-técnica de la atención es la dimensión
rar si hay o no calidad en los servicios que se central y menos discutible de la calidad. Hace
van a valorar. Al existir una gran variedad de referencia a la capacidad de los proveedores de
definiciones, existe también una apreciable utilizar el más avanzado nivel de conocimien-
variedad de esquemas de dimensiones, facto- tos existente para abordar los problemas de
res, componentes o atributos (de todas estas salud, es decir, para producir salud y satisfac-
formas se les llama). El cuadro 1.1 contiene al- ción en los usuarios. En la mayoría de las defi-
gunos de estos esquemas. El lector interesado niciones, incluye tanto los aspectos científico-
puede consultar la bibliografía que se cita en técnicos, en sentido estricto, como los de trato
este capítulo. A continuación vamos a revisar interpersonal, tal como es entendida desde la
el significado de las dimensiones más habi- conceptualización de los componentes de la
tuales (calidad científico técnica, efectividad, calidad que hizo Donabedian, quien también
eficiencia, accesibilidad, satisfacción, adecua- la situó en el centro de lo que se podría enten-
ción, continuidad y seguridad) para terminar der por calidad en servicios de salud.
Cuadro 1.1
Dimensiones de la calidad de la atención según diversos esquemas
Vuori Nutting et al. Joint Comm. Joint Comm. Programa
Palmer
(componentes) (atributos) (factores) (componentes) Ibérico IOM (2001) WHO (2006)
(1983)
(1982) (1987) (1989) (1990) (1990)
Calidad
Competencia Competencia Calidad científi-
científico- — — — —
profesional* profesional co-técnica
técnica
Distribución de
Accesibilidad/* Accesibilidad/ Accesibilidad/ Accesibilidad/
— la asistencia/ Accesibilidad Equidad
Equidad Disponibilidad Equidad Equidad
Integralidad
Aceptabilidad
Aceptabilidad/* Servicio centrado
— — Participación Aceptabilidad Satisfacción centrada en el
Satisfacción en el paciente
paciente
Efectividad Efectividad Efectividad Efectividad Efectividad — Efectividad Efectividad
Eficiencia Eficiencia Eficiencia Eficiencia Eficiencia — Eficiencia Eficiencia
Adecuación — Adecuación Adecuación — — —
Continuidad/
— — Continuidad Continuidad — — —
Coordinación
— — — Eficacia — — — —
Oportunidad
— — — — — Oportunidad Accesibilidad
temporal
— — — Privacidad — — — —
— — — Confidencialidad — — — —
— — — Seguridad — — Seguridad Seguridad
Apoyo estruc-
— — — — — — —
tural
*: Dimensiones mantenidas en publicaciones posteriores
• 19 •
Sin lugar a dudas, es la dimensión que me- Un matiz importante que podemos intro-
jor se entiende y más frecuentemente medida ducir es aplicar el concepto de accesibilidad
como representante de la calidad de los servi- no sólo a la obtención de servicios iniciales o
cios de salud; significa atender de forma cien- contacto principal con el sistema de salud, sino
tífica y humana las necesidades de salud. también a la existencia o inexistencia de barre-
ras organizativas, culturales o de otro tipo una
Efectividad es la medida en que una determina- vez que se ha accedido al sistema de salud. Po-
da práctica o atención sanitaria mejora el estado dríamos llamar este segundo aspecto accesibi-
de salud de la población concreta que la recibe. lidad interna y englobaría toda la problemática
Durante algún tiempo ha venido utilizándose de los tiempos de espera, descoordinaciones
de forma confusa o intercambiable con el tér- entre profesionales y niveles asistenciales, et-
mino eficacia. Sin embargo, en la actualidad, cétera, que impiden la fluidez normal que de-
de acuerdo con las propuestas de K. L. White bería tener un proceso asistencial visto en su
refrendadas por la OTA (Office of Technology totalidad. A este tipo de accesibilidad se refiere
Assessment) estadounidense, por eficacia se la dimensión oportunidad del más reciente es-
entiende “la probabilidad de beneficio de una quema del IOM.
determinada tecnología en condiciones ideales
de uso”, mientras que efectividad sería “la pro- La satisfacción puede definirse como la medida
babilidad de beneficio de una determinada tec- en que la atención sanitaria y el estado de sa-
nología en condiciones normales de uso”. Lo lud resultante cumplen con las expectativas del
más frecuente al definir calidad es la referencia usuario. Según las distintas definiciones de ca-
a la efectividad de la atención. lidad, esta dimensión se incluye o se confunde
con el concepto más amplio de aceptabilidad o
Eficiencia se define en términos de la relación el concepto más reciente de atención centrada
entre coste y producto es decir, un máximo de en el paciente, ampliado también a familia y
efectividad o unidades de producto, dado un población, del cual la satisfacción sería uno de
determinado coste, o un mínimo coste dadas los resultados. En todo caso, así se llame satis-
unas determinadas exigencias de efectividad o facción o aceptabilidad, de lo que se trata es de
unidades de producto. Por supuesto, se asume tener en cuenta la manera en que la atención es
que una mayor eficiencia se asocia a una ma- percibida y protagonizada por el usuario y sus
yor calidad. reacciones como consecuencia de ello.
La accesibilidad puede definirse como la fa- La adecuación (appropriatness) es otra de las di-
cilidad con que la atención sanitaria puede mensiones mencionadas con frecuencia, pero
obtenerse en relación con los aspectos (barre- de la que no existe una definición operativa
ras) organizacionales, económicos, culturales uniforme. En la lista de la JCAHO (Joint Com-
y emocionales. Esta dimensión no se incluye mission on Acreditation of Healthcare Orga-
en todas las definiciones de calidad. También nizations) estadounidense, la adecuación es
es cierto que aquellas que la incluyen a ve- la medida en que la atención se corresponde
ces introducen matices muy diferentes en su con las necesidades del paciente; es decir, ade-
conceptualización operativa, medible. Palmer cuado es entendido como sinónimo de correc-
incluye en ella el concepto de equidad: acce- to, conveniente o necesario para el problema
sibilidad es “la medida en que los cuidados concreto que es atendido. Éste es un concepto
apropiados son recibidos por la población de que parece muy difícil de separar, a la hora de
forma equitativa” o “la distribución equitati- ser medido, del concepto de calidad científico-
va y oportuna, a tiempo, de la atención sanita- técnica o competencia profesional. Un matiz
ria apropiada, para aquéllos con necesidades diferente se introduce en la definición de di-
equivalentes”. En todo caso, lo que subyace es mensiones de OMS (2006), en la que la adecua-
la necesidad de cuantificar si la atención sani- ción de competencia técnica y recursos para
taria llega o no a quien la necesita y cuando las necesidades de salud, queda incluido en la
la necesita. dimensión de accesibilidad.
• 20 •
La continuidad es, con toda probabilidad, la di- de que se produzca daño, aunque éste no lle-
mensión de la calidad de la atención más com- gue a producirse. Por tanto, el énfasis no está
pleja de conceptualizar y medir. De entrada, ya en que la atención sanitaria sea más o menos
resulta inquietante que sea la dimensión sobre efectiva o más o menos beneficiosa, sino en su
la que existen más versiones diferentes. La potencialidad para producir daño innecesario.
conceptualización más prevalente y atractiva,
parece ser que es la que propuso Shortell: “la En el cuadro 1.1 se incluyen esquemas que
medida en que la atención necesaria se provee contienen dimensiones, atributos o factores
de una forma ininterrumpida y coordinada”, de la calidad diferentes a los comentados has-
en cierto modo equivalente a lo que hemos lla- ta aquí. Revisar cada uno de ellos sería muy
mado accesibilidad interna. prolijo, máxime cuando pensamos que lo más
lógico es intentar simplificar. Destacamos, sin
La seguridad es la última de las dimensiones embargo, el del IOM, cuyas definiciones pue-
que se ha hecho explícita en las definiciones den verse en el cuadro 1.2, por la repercusión
de la calidad en los servicios de salud. Su pro- que tuvo y sigue teniendo como esquema de
minencia actual se basa en los datos que se base para la búsqueda y clasificación de indi-
hicieron públicos primero en Estados Unidos cadores para monitorizar la calidad de los sis-
y después en muchos otros países, los cuales temas de salud. Un esquema muy parecido es
demostraron en qué medida los servicios de el que contiene la publicación de la OMS (2006)
salud pueden ser la causa directa de daño evi- citada en la bibliografía, sólo que con referen-
table en el paciente. De ahí la definición inicial cia explícita al nivel comunitario e incluyendo
de la seguridad como la “ausencia de lesiones la dimensión accesibilidad. Proponemos un esquema
a causa de la atención sanitaria que se supo- simplificado de cuatro
ne puede ser beneficiosa” (IOM, 2001). Obvia- ¿Se puede simplificar? Las cuatro dimensiones dimensiones: calidad
mente es una dimensión íntimamente ligada clave y una agrupación con interés práctico. científico-técnica,
a la calidad científico-técnica, y más aún en la accesibilidad, atención
definición más aceptada en la actualidad, se- Un esquema reducido de dimensiones que centrada en el paciente, y
gún la cual la seguridad no es sólo la ausencia podemos adoptar se reduce a cuatro: calidad seguridad.
de lesiones sino la “ausencia de daño innecesa- científico-técnica o competencia profesional,
rio real o potencial asociado a la atención sani- atención centrada en el paciente/familia/po-
taria” (OMS, 2008). Es decir: incluye las situa- blación, accesibilidad/equidad y seguridad.
ciones de riesgo innecesariamente aumentado ¿Por qué puede prescindirse de explicitar
Cuadro 1.2
Las seis dimensiones clave de la calidad* (IOM, 2001)
l Seguridad Evitar lesiones a causa de la atención sanitaria, que se supone debe ser beneficiosa.
l Efectividad Proveer servicios basados en el conocimiento científico a todos los que pueden beneficiarse de ellos,
y no proveerlos a aquellos que probablemente no se beneficien de ellos (evitar sub y sobre utilización
respectivamente).
l Servicio centrado Proveer atención sanitaria que es respetuosa con el paciente y que responde a sus preferencias indivi-
en el paciente duales, necesidades y valores, asegurando que éstos guíen todas las decisiones clínicas.
l Oportunidad Reducir las esperas y, a veces perjudiciales, retrasos tanto para los que reciben como para los que
proveen la atención sanitaria.
l Eficiencia Evitar desperdicio de equipamiento, insumos, ideas y energía.
l Equidad Proveer servicios que no varían en calidad según características personales tales como género, etnia,
localización geográfica y estatus socioeconómico.
Adaptado de: Institute of Medicine: Crossing the Quality Chasm. A New Health System for the 21st Century. National Academy Press, Washington
2001
* Referidas fundamentalmente a la atención sanitaria individual, no a las poblaciones o comunidades
• 21 •
efectividad, eficiencia, adecuación y continui- calidad científico-técnica (de los diversos pro-
dad, y de otras que figuran en el cuadro 1.1 fesionales y niveles del sistema de salud) y la
como dimensiones de medición directa de la accesibilidad, el auge que está teniendo en los
calidad? No es porque se considere que estas últimos años la atención específica a este as-
dimensiones no puedan estar directamente pecto de la calidad asistencial con base en la
relacionadas con la calidad de la atención. Las magnitud de sus deficiencias en el sistema de
razones fundamentales tienen que ver con la salud, podría justificar su consideración parti-
práctica de las evaluaciones sobre calidad de cular a efectos de medición y mejora.
la atención, si se trata de medirla para deter- Finalmente, conviene señalar que, del con-
minar qué hacer para mejorarla, y evitar en la junto de dimensiones de la calidad, hay al-
medida de lo posible los solapamientos que gunas que se miden y aplican sobre todo a la
existen entre ellas. atención clínica individual de aquéllos que ac-
Tomemos, por ejemplo, la efectividad y la ceden a la atención (calidad científico-técnica,
eficiencia. Desde luego que más efectividad y seguridad, atención centrada en el paciente);
más eficiencia son más calidad; pero, efectivi- mientras que otras implican un ámbito comu-
dad y eficiencia ¿de qué?, provocadas o deci- nitario o poblacional (accesibilidad/equidad,
didas ¿por quién? La efectividad y la eficiencia atención centrada en la población). En algunos
son atributos de las acciones diagnósticas y ámbitos y momentos del desarrollo histórico
terapéuticas, en sentido amplio, que los pro- de la calidad en los servicios de salud, ha pri-
veedores de los servicios han decidido utilizar mado exclusivamente la consideración de las
o poner en marcha para la resolución de un de- dimensiones de atención clínica individual,
La definición general de terminado problema de salud. Depende de la pero conviene no olvidar la aplicación del con-
calidad de los servicios de
competencia profesional del proveedor haber cepto en sus dimensiones poblacionales y de
salud es aún insuficiente
para medir. Tenemos
seleccionado y ejecutado las acciones más efec- sistema.
que especificar cómo se tivas y eficientes que convenían al problema
traducen las dimensiones afrontado, con las limitaciones de los recursos 1.3. Calidad de un determinado proceso o
generales en requisitos de disponibles. Es decir, al medir efectividad y servicio: el tercer nivel del concepto de calidad
calidad de cada producto o eficiencia medimos la calidad científico-técni-
servicio que se ofrece. ca o la competencia profesional para actuar de A pesar de la claridad con que hayamos en-
forma adecuada. Serían así indicadores de re- tendido y asumido lo expuesto hasta aquí, hay
sultado de la calidad científico-técnica. que dar un paso más para hacer operativo el
En relación con otras dimensiones final- concepto de calidad. El entender y adoptar
mente no incluidas en nuestra propuesta ya conscientemente una definición de calidad
hemos argumentado antes lo difícil que resulta de los servicios de salud, de la que podemos
considerar la adecuación de forma separada de deducir unas dimensiones que interpretan lo
la calidad científico-técnica. Si consideramos que pensamos que da satisfacción a las nece-
la continuidad, de indiscutible relevancia a la sidades y expectativas de la población aten-
hora de medirla para mejorar la calidad, sus dida, nos confiere un importante marco de
diversos componentes o (sub)dimensiones son referencia, pero es aún insuficiente como ins-
identificables en su mayoría como cuestiones trumento para la medición directa de la cali-
que miden, en realidad, accesibilidad, atención dad. Son muchos los servicios diferentes que
centrada en el paciente o competencia profe- ofrece cualquier establecimiento sanitario y es
sional, con mayor o menor importancia rela- necesario traducir estas dimensiones generales
tiva, según el problema de salud que estemos a requisitos concretos para cada servicio, pro-
evaluando y el aspecto de la continuidad que blema de salud o tipo de paciente, de forma
valoremos. que podamos valorar si es o no de calidad. En
La seguridad merece mención aparte. Aun- cada tipo de paciente y problema de salud la
que los argumentos al respecto son similares importancia relativa de cada dimensión puede
a los expuestos para la adecuación y continui- ser diferente, así como los requisitos de calidad
dad, en el sentido de que la seguridad depende que las caracterizan. Piénsese, por ejemplo, lo
de una mezcla de factores relacionados con la muy diferente que han de ser los requisitos
• 22 •
de calidad científico-técnica para las distintas el componente proveedor, pero no es un ele-

enfermedades crónicas, en comparación con mento de la calidad del servicio en sí, aunque
procedimientos agudos, autolimitados, o con puede influir en él, al igual que otros muchos
problemas de tipo preventivo. Por eso, vamos factores del sistema o de la organización. Va-
a necesitar de la definición de los requisitos mos a detenernos un poco más en detallar es-
específicos de cada servicio o tipo de paciente tos dos aspectos: (i) cómo influye la satisfac-
para poder, finalmente, cuantificar la calidad. ción del profesional en la calidad del servicio
Este tercer nivel de especificación es el que re- y (ii) su relevancia como un elemento interno
sulta realmente operativo y, por lo tanto, el que del sistema.
vamos a manejar de manera preferente para
su evaluación y mejora. La definición de cali- 2.1. La satisfacción del profesional y la calidad
dad, de esta forma, es diferente y peculiar para del servicio prestado
cada servicio y se puede llegar a ella intentan-
do responder las siguientes preguntas: para un La justificación fundamental implícita y sub-
servicio concreto (atención al hipertenso, a la yacente para no incluir la satisfacción del pro-
diabetes, una determinada intervención qui- fesional en la definición de la calidad del ser-
rúrgica, la resolución de una solicitud de cita vicio que se ofrece al usuario externo es que
para consulta, etc.) ¿qué quiere decir que sea se trata de un elemento del sistema y no del
accesible?, ¿cómo me aseguro de que no tiene servicio ofrecido. La satisfacción del profesio-
problemas de accesibilidad?, ¿qué quiere decir nal puede considerarse como un criterio de
que se ofrece con un nivel óptimo de calidad la calidad de la organización o institución, un
científico-técnica?, ¿qué características me in- rasgo estructural que puede favorecer el buen
dican este nivel?, ¿qué importancia tiene la funcionamiento y la calidad del servicio. La satisfacción del
profesional forma parte
aceptabilidad y satisfacción de los usuarios?, Adicionalmente, la evidencia empírica
de la calidad del sistema
¿cómo puedo saber si están presentes? Una sostiene que, al igual que en la industria, la sa-
u organización, no del
respuesta exhaustiva a todas estas preguntas tisfacción del profesional puede influir en un servicio que se ofrece,
nos producirá un listado de características o mejor trabajo, así como el que una percepción aunque pueda influir en él.
requisitos que nos definirían una atención de del trabajo bien hecho produce satisfacción en
calidad para el problema de salud que intenta- los profesionales, pero no determina la calidad
mos definir, y que nos permitirán medirla. del servicio.
La relación satisfacción del profesional 
2. Satisfacción del profesional: concepto calidad para el cliente externo no es siempre
de cliente interno la misma, ni lineal, ni consistentemente impor-
tante. Lo que parece más claro es una relación
La satisfacción del profesional no ha sido de la satisfacción con la productividad y la es-
mencionada en las definiciones de calidad re- tabilidad o rotación en los puestos de trabajo.
visadas, ni es frecuente encontrarla de forma
explícita en ninguna definición. ¿Por qué? La 2.2. La satisfacción del profesional como
razón principal, si recordamos el esquema bá- cliente interno
sico (proveedor  servicio  receptor) (figura
1.2), es que el producto o servicio que hemos Los individuos y los departamentos o cuales-
intentado definir hasta ahora es aquél que re- quiera unidades organizativas que integran un
cibe el usuario o cliente externo al proveedor, determinado centro asistencial son, a su vez,
entendiendo por proveedor al individuo, la or- proveedores y clientes unos de otros, aunque
ganización o el sistema que ofrece el servicio. sus actividades deban estar interconectadas con
Adicionalmente, hemos aclarado que íbamos el fin exclusivo de servir a los clientes externos.
a hablar de calidad del producto o servicio, y Este concepto de clientes internos que reciben
no de otras calidades como puede ser la de la servicios para la provisión de un determinado
organización, objetivos, personal, etcétera. La producto final, lleva a incluir la satisfacción de
satisfacción del profesional ha de ser contem- los profesionales como parte de la definición
plada dentro de la calidad de la organización, de calidad de los servicios internos o, al menos,
• 23 •
como uno de sus determinantes de importancia Feigenbaum, el primero que introdujo el con-
y, desde luego, como un factor relevante para el cepto de total, en 1951 en un libro clásico que
funcionamiento del centro. Un cliente interno se- ha tenido una edición por su 40 aniversario.
ría aquél que recibe servicios de otros elemen- Feigenbaum, acuñó los términos total quali-
tos del sistema (radiografías, análisis, servicios ty control y total quality system, para referirse
administrativos, etc.), y su satisfacción a la hora al control de la calidad en todos los aspectos
de definir la calidad de ese servicio interno es del ciclo industrial (marketing, diseño/inge-
tan importante como para la definición de la niería, compras, manufactura, inspección del
calidad de los servicios externos. producto, distribución, instalación y servicio
Aparte de eso, aunque pueda argumentar- post-venta), y a un sistema establecido en toda
se que la satisfacción de los profesionales in- la empresa para guiar las acciones coordinadas
fluya en la calidad de su trabajo para el cliente de todos sus elementos en la consecución de la
externo y viceversa, es muy arriesgado decir satisfacción del cliente de una forma eficiente.
que, al medir la satisfacción del profesional, es- El mismo autor define total quality management
tamos midiendo calidad de la atención al clien- como aquello que abarca al ciclo completo del
te externo. Sí estaremos midiendo, en cambio, producto o servicio, desde su concepción hasta
un aspecto de la calidad de la organización y la atención al cliente que adquirió el producto
de sus servicios internos. o servicio, pasando por su producción.
Calidad total implica una
No ser total significa un ámbito de actua-
referencia a la calidad 3. Concepto de calidad total ción o atención explícita parcial (por ejemplo
del producto o servicio sólo a los procesos de producción) tanto si
y también a la calidad El adjetivo total cualificando al concepto cali- hablamos de control, como de gestión o de
de la organización y dad es algo de uso relativamente prevalente sistema.
sus relaciones con otras hoy en día en los medios sanitarios. En la lite- Si trasladamos las explicaciones de Fei-
organizaciones. ratura anglosajona, en dónde se ha originado genbaum al concepto de calidad que vimos al
el término, el adjetivo total unido a calidad se principio de este capítulo, cuando empleamos
empezó a utilizar en los años cincuenta y se si- el adjetivo total debemos estar incluyendo una
gue utilizando para adjetivar, no siempre a la atención no sólo a la calidad del producto o
palabra calidad, sino también a una tercera pa- servicio en sí, sino también a la calidad de la
labra, que es en realidad la que se conceptuali- organización en un sentido amplio, incluyen-
za de una forma particular el añadirle los dos do relaciones con proveedores y otras organi-
términos total y calidad. Así, encontramos total zaciones, así como las relaciones, clima organi-
quality control, total quality system y total quality zacional y satisfacción interna del personal de
management. ¿Qué se quiere significar al añadir la propia empresa. ¿Qué ocurre si utilizamos la
la palabra total? Si vamos a las fuentes origi- palabra total como adjetivo de calidad en vez de
nales de los inventores del concepto, queda como adjetivo de la función (control, gestión,
claro que lo que introduce es un importantísi- etc.), como de hecho se hace en muchas oca-
mo matiz de ámbito de actuación al control de siones? Pues que, al igual que si la aplicamos
calidad, al sistema de calidad y a la gestión de a gestión, control o sistema, nos debe quedar cla-
calidad: que el ámbito en el que actúen sea total ro que lo que estamos indicando es calidad a
quiere decir que ha de incluir todos los proce- todos los niveles y de todos los componentes,
sos y actividades que puedan influir en la cali- procesos y relaciones de nuestro negocio, o de
dad del producto o servicio de que se trate; es la institución, centro o sistema de salud en el
decir, se presta atención a la calidad de las ma- que trabajamos.
terias primas, del personal, de la organización, Lo que debemos evitar es utilizar total para
servicio post venta, etc., y no sólo los procesos significar diferencias en métodos de medición,
directamente relacionados con la manufactura enfoque o matices prioritarios, en vez de di-
básica del producto o la prestación del servicio ferencias en el ámbito de aplicación. Así, por
de que se trate. ejemplo, a veces encontramos quien dice que
Como ejemplo más destacado de esta con- las actividades son de calidad total porque se
ceptualización cabe citar la explicación que da miran todas las dimensiones, se emplean mé-
• 24 •
todos tomados de la industria, porque se da des que se justifican con la existencia previa
mucha importancia a la satisfacción del cliente de una filosofía o política explícita de mejorar
o porque se tiene en cuenta el componente de continuamente la calidad.
costes, etc.; todas estas circunstancias pueden
darse perfectamente dentro de un enfoque 4.1. Los componentes de un programa o
parcial de la calidad o de su gestión. sistema de gestión de la calidad
Lo lógico es que, cuando hablemos tanto
de gestión total de la calidad como de gestión de La lista de componentes o elementos que da
la calidad total, lo hagamos para significar que carácter a un programa de GC puede ser muy
nuestra atención y actividades para mejorar se larga, según el nivel de detalle al que quera-
van a dirigir a todos los ámbitos y niveles, in- mos descender. En sus rasgos organizativos
ternos y externos, y a todos los servicios o pro- más esenciales o elementales, a un programa
ductos, para clientes y de proveedores internos de GC lo pueden caracterizar los componentes
y externos, de nuestra institución. resumidos en el cuadro 1.3.
El marco conceptual incluye el concepto
4. Gestión de la calidad. Componentes concreto y explícito de calidad (ya hemos visto
esenciales de un sistema de gestión que hay varias opciones y dimensiones) que se
de la calidad adopte como propio por parte de la organiza-
ción; la misión, visión y valores que, igualmen-
Gestionar la calidad supone la materialización te explícitos, se pretende compartir con todo El concepto de programa
del compromiso con la calidad, traduciéndolo o sistema de gestión
a una estructura organizativa y unas activida- de la calidad incluye
des que lo hagan real y operativo. El objetivo la existencia de una
de la gestión de la calidad (GC) es la mejora Cuadro 1.3 política explícita para
continua, avanzar en la efectividad, eficiencia Componentes de un programa o sistema mejorar la calidad, unos
y satisfacción de todos los protagonistas de la de gestión de la calidad elementos estructurales y
asistencia; un progreso consciente y cuantifica- l Marco conceptual organizativos para llevarla
a cabo, y unas actividades
ble hacia la excelencia. Concepto de calidad
para hacerla efectiva.
Sobre esta base, vamos a llamar sistema Misión, visión, valores
o programa de gestión de la calidad (GC) al Cultura de calidad
“conjunto de elementos estructurales y de Calidad total
actividades que tienen como fin específico la
l Estructura
mejora continua de la calidad”. Este concepto
Recursos
puede encontrarse con diferentes nombres en
la literatura sobre calidad, tanto en la indus- Organización
tria, como en los servicios de salud. El término l Actividades para la mejora continua
globalizador más frecuentemente empleado Ciclos de mejora
en la literatura de la industria es el de sistema Monitorización
de calidad. Sin embargo, la terminología em- Planificación o diseño
pleada en el sector sanitario es diferente y par- l Enfoques
ticular. En salud, el término globalizador más
Recursos
frecuentemente empleado es el de programa y
Organización
también, a veces, el de plan.
¿Qué terminología adoptar? Si respetamos l Estrategias
la tradición sanitaria, le llamaremos programa Liderazgo y responsabilidad (accountability)
para enfatizar su carácter finalista y operativo, Sistema de información para la calidad
pero sin renunciar a unos contenidos que in- Incorporación de pacientes y población
corporan ideas de la industria. Lo que importa Capacidad organizacional
en definitiva, se le llame como se le llame, es
Regulación y estándares
que podamos identificar una serie de elemen-
Implementación de modelos integrales de atención
tos estructurales, organizativos y de activida-
• 25 •
el personal de la organización; la búsqueda tividades diferenciables dentro del programa:

explícita de una cultura de calidad, y la posi- ciclos de mejora, monitorización y diseño de la
ble adopción del concepto de calidad total que calidad (cuadro 1.4, figura 1.3).
vimos más arriba. Cada una de las actividades puede reali-
Una estructura identificable, que incluye zarse utilizando métodos y enfoques muy di-
una comisión o grupo visible que tiene como versos: d) los enfoques, interno o externo, desde
objetivo promover y preocuparse por las acti- los cuales se realizan las actividades, y e) los
vidades de gestión de la calidad, la integración bloques estratégicos que se adoptan para avan-
sinérgica de los diversos niveles de responsabi- zar en la mejora de la calidad.
lidad para la calidad dentro de la organización Merece la pena detenernos en los últimos
y los recursos dedicados a la función de cali- tres componentes y, sobre todo, repasar una
dad. La comisión o grupo visible no ha de ser visión panorámica e integradora de las tres
necesariamente quien se encargue de realizar principales actividades que pueden realizarse
las actividades de evaluación y mejora de la para la mejora continua; una de las cuales (los
calidad, pero sí ha de promoverlas, apoyarlas ciclos de mejora) es el objeto principal de este
y coordinarlas. Entre los rasgos estructurales manual.
también se incluyen las normas de funciona-
Las diversas intervenciones miento, incluyendo reparto claro de responsa- 5. Los bloques estratégicos para la mejora
para la mejora de la calidad bilidades, circuitos de información de los datos de la calidad
pueden agruparse en sobre calidad y mecanismos de elaboración de
seis grupos o estrategias planes de mejora de la calidad. Son varios los ámbitos en los que se puede in-
diferenciadas: liderazgo, Finalmente, las actividades que se realizan tervenir para conseguir una mejora importante
sistemas de información, para mejorar la calidad son tareas identificables y y sostenida de la calidad. La selección de los
participación de pacientes clasificables en razón del fin u objetivo parcial ámbitos, o bloques estratégicos, de interven-
y población, regulación al que sirven, dentro del objetivo común de la ción, representados en la figura 1.3, y de las
y estándares, capacidad
mejora de la calidad, y según tres principales intervenciones concretas para implementar es
organizacional, y desarrollo
puntos de partida en torno a los que puede la parte esencial de la estrategia de una organi-
e implementación de
modelos de atención. funcionar el programa: a) la identificación de zación para lograr la mejora de sus servicios.
oportunidades de mejora; b) la elaboración de La consideración de todos los posibles
indicadores y su monitorización, y c) el diseño ámbitos, bloques estratégicos o dominios con-
de nuevos servicios o cambios sustanciales en ceptuales para las intervenciones es tanto más
los existentes. Se trata de tres puntos de parti- importante cuanto más alto sea el nivel del
da que se corresponden con tres áreas de ac- sistema de salud en el que estemos intentan-
Cuadro 1.4
Actividades para la mejora continua de la calidad
Grupo de actividades Punto de partida Objetivo inmediato
• Solucionar el problema
• Identificación de un problema de calidad u oportunidad de
Ciclos de mejora • Aprovechar la oportunidad de
mejora en algún aspecto de los servicios que se ofrecen.
mejora descubierta
• Identificación de aspectos relevantes de los servicios que se
ofrecen y construcción de indicadores sobre su calidad. • Identificación de problemas de
Monitorización
• Selección de indicadores sobre problemas que hemos some- calidad u oportunidades de mejora
tido a ciclos de mejora.
• Programación de un nuevo servicio para ofrecer. • Diseñar los procesos de atención
Diseño o planificación • Identificación de necesidades y expectativas de los usuarios. para conseguir los resultados
• Identificación de parámetros y resultados por conseguir. deseados predeterminados
• 26 •
3
Participación
de pacientes/
población
2 4
Sistema Regulación
de información y estándares
1
Liderazgo
6 5
Modelo Capacidad
de atención organizacional
Adaptado de: Bengoa R, Key P, Leatherman S, Massoud R, Saturno P: Quality of care. A process for making strategic choices in health systems. WHO,
Geneva 2006
Figura 1.3. Los seis grupos de intervenciones para la mejora de la calidad
Las intervenciones sobre

el liderazgo implican la
búsqueda y consolidación
do actuar; entre otras cosas porque muchas de 5.1. Liderazgo de los líderes formales
las posibles intervenciones van a ser posibles y reales, así como un
y tendrán sentido sólo si se implementan y di- El liderazgo está situado en el centro del es- reconocimiento de su
rigen desde un nivel relativamente macro (al quema de estrategias en la figura 1.3 porque responsabilidad.
menos área o distrito). va ser un componente esencial o, al menos, ne-
Los seis componentes estratégicos repre- cesariamente complementario, sea cual sea la
sentados en la figura 1.3. son un marco de intervención que seleccionemos. Es uno de los
referencia útil para poder considerar de una puntos clave de cualquier estrategia.
forma integral las diversas alternativas de El grupo de intervenciones relativas al li-
intervenciones. Lo más común en cualquier derazgo incluye la búsqueda y consolidación
sistema u organización es que haga falta al- del apoyo de los líderes formales y reales (no
gún tipo de intervención en la mayoría de los siempre coincidentes) para las acciones de me-
grupos representados en la figura 1.3. También jora que queremos implementar. Obviamen-
es frecuente que en la mayoría de los casos se te los que identifiquemos como líderes para
enfatice o se implementen intervenciones en nuestra estrategia van a formar parte del gru-
relación con tan sólo uno o dos de los grupos po de referencia y seguimiento, porque lo que
o ámbitos posibles, por ejemplo regulación y tenemos que buscar es su compromiso firme
estándares, cuando la mejora de la calidad pre- con la mejora.
cisa normalmente de un enfoque más integral En ocasiones va a ser necesario construir
que contemple intervenciones en la mayoría – la capacidad de liderazgo en las personas que
si no en todos– los grupos de intervenciones habrían de tenerlo, uno de cuyos componentes
representados en la figura 1.3, cuyo significado va a ser el reforzamiento y reconocimiento de
es el que se describe a continuación. su responsabilidad (accountability). Es conve-
• 27 •
El sistema de información niente que liderazgo y responsabilidad es va- en marcha de alguna(s) de las formas de par-
ha de ser útil para la yan de la mano. ticipación solicitadas por el sistema o servicios
monitorización de los de salud. De nuevo, al igual que decíamos para
cambios que queremos 5.2. Sistemas de información los sistemas de información, debemos recordar
lograr, y no tiene por que la participación de pacientes y población
qué basarse siempre en
Ya hemos mencionado en el apartado 3 de este debe ser un medio para conseguir mejorar. En
tecnologías sofisticadas.
capítulo que la reorientación de los subsiste- ocasiones nos encontramos con algunas de es-
mas de información y de formación continua- tas iniciativas, por ejemplo encuestas, que se
da normalmente forma parte de los puntos implementan como un fin en sí mismas sin que
clave que hay que considerar en la implanta- sean utilizadas para mejorar.
ción de un programa o sistema de gestión de la
calidad en general. Lo mismo ocurre a la hora 5.4. Regulación y estándares
de diseñar estrategias para mejorar la calidad
El incremento de la en temas o problemas de salud concretos. En En este grupo se encuentran todas las iniciati-
capacidad organizacional este caso, debemos asegurarnos un sistema de vas con enfoque externo (explicado más ade-
tiene que ver tanto con la
información que sea útil para la monitoriza- lante), que abarcan desde los requisitos para
atención clínica concreta
ción de los cambios que queremos lograr y el el funcionamiento (licencias), los sistemas de
como con la capacidad
de realizar actividades de progreso de la estrategia. acreditación y certificación, y los esquemas
mejora continua de forma El sistema de información requerido no tie- de indicadores aplicados de forma general o
autónoma, así como con el ne por qué basarse siempre en tecnologías elec- externa a las instituciones, hasta las guías de
desarrollo de una cultura trónicas sofisticadas. Los cambios deben ser lo práctica clínica y diseño de procesos estanda-
organizacional que valore la más simples posible, con objetivos bien claros rizados y propuestos para el conjunto del sis-
calidad e incluya sistemas (el sistema de información es un medio, no un tema de salud.
de recompensa e incentivos fin en sí mismo); es posible utilizar, si es pre- Con mucha frecuencia, las iniciativas exis-
que la favorezcan. ciso, métodos de muestreo y monitorización tentes en los sistemas de salud se encuentran
simplificados, como el LQAS (Lot Quality Ac- dentro de este grupo, lo que probablemente se
ceptance Sampling). Es también importante que deba a su visibilidad y al relativo desconoci-
la información que se genere se ponga a dis- miento que aún parece existir sobre otro tipo
posición de todas las partes interesadas para de intervenciones para mejorar la calidad entre
reforzar su compromiso, y que se aplique de los dirigentes de los sistemas de salud. El prin-
forma consistente, no parcial, en todos los ám- cipal problema de un énfasis excesivo, o exclu-
La regulación y estándares bitos del sistema de salud que estén implicados sivo, en este tipo de intervenciones de carácter
son iniciativas normalmente en la atención al problema objeto de mejora. y enfoque típicamente externos es que se olvi-
externas, que hay que de el necesario balance que debe existir entre
procurar combinar con los
5.3. Participación de pacientes población los enfoques externo e interno para lograr la
enfoques internos.
mejora de la calidad.
La aceptabilidad y la atención centrada en el
paciente es una de las dimensiones de la cali- 5.5. Capacidad organizacional
dad. Hay diversas maneras de tener en cuenta
al paciente y población para conseguir que esta Las intervenciones que se incluyen en este gru-
dimensión sea una realidad. Éstas incluyen po van dirigidas fundamentalmente al desa-
formas de participación activa, decididas por rrollo y gestión de los recursos humanos para
La participación de
el propio paciente, que habremos de fomentar facilitar la mejora continua de la calidad, así
pacientes y población
implica el fomento de
y aprovechar, y formas de participación que como a la dotación de la infraestructura y equi-
la participación activa y podemos solicitarles, las más simples de las pamiento necesarios para la provisión de los
la puesta en marcha de cuales son las encuestas sobre su experiencia servicios que queremos mejorar.
formas de participación con el servicio que queremos mejorar. Las tres principales áreas de intervención
iniciadas o solicitadas por el De forma resumida, las intervenciones en son:
sistema. Es necesaria para este grupo van a consistir en el fomento de la l El desarrollo de recursos humanos con los
hacer realidad la atención participación activa, incluida la participación conocimientos y habilidades necesarios
centrada en el paciente. en su propio proceso asistencial, y en la puesta para la prestación de los servicios requeri-
• 28 •
dos, y con el equipamiento necesario para 6. Las actividades para la mejora de la

su trabajo. calidad
l El desarrollo de sistemas y capacidad me-
todológica para la práctica de la mejora Las tres grandes iniciativas o actividaes que
continua de la calidad (ciclos de mejora, dan entrada a la dinámica de la mejora conti-
monitorización, planificación de la cali- nua para servicios específicos (ciclos de mejo-
dad), con énfasis en el compromiso inter- ra, monitorización y planificación o diseño de
no y la autoevaluación. la calidad) se diferencian por el punto de par-
l El desarrollo de una cultura organizacio- tida que las inicia y el objetivo inmediato que
nal que valora la calidad, incluyendo, en persiguen, tal como se resume en el cuadro 1.4
su caso, sistemas de recompensa e incenti- y describimos a continuación.
vos que la favorezcan.
6.1. Ciclos de mejora
En este grupo se incluye la atención que siem-
pre hay que prestar a la reorientación del sub- La evaluación, el ciclo de mejora, ciclo evalua-
sistema de formación continuada, tal como vi- tivo o ciclo de garantía de calidad de la litera-
mos en el apartado 3 de este capítulo. tura tradicional sobre calidad en los servicios
de salud, comienza con la identificación de una
5.6. Desarrollo e implementación de modelos oportunidad de mejora en algún aspecto de los
de atención servicios que se están ofreciendo (el “proble-
ma” de calidad en la terminología tradicional).
Los modelos de atención son la forma más Este problema puede ser de tipo asistencial
completa y compleja de la planificación o dise- (calidad de los programas, diagnósticos, trata-
ño de la calidad. Se trata de diseñar e imple- A pesar de su inutilidad
mientos, controles de salud, etc.), organizativo como actividad aislada,
mentar modelos de atención integrales e inno- (descoordinaciones, tiempos de espera, cir- la monitorización resulta
vadores que incluyan toda la evidencia cuitos anómalos, etc.) o de cualquier otro tipo muy atractiva y a veces es
existente en torno al problema de salud que (satisfacción, comunicación, información, etc.). la única actividad sobre
queremos mejorar. Uno de los más conocidos El objetivo de las actividades que se generan a calidad que se lleva a cabo.
es el modelo de atención a enfermedades cró- partir de que el tema a estudio (oportunidad de
nicas* que requiere de una coordinación expre- mejora o problema de calidad) se ha identificado
sa y precisa de todos los niveles de atención, y definido es elevar el nivel de calidad del as-
así como de una participación activa y respon- pecto que se evalúa a los niveles máximos que
sable de los pacientes. Otros ejemplos destaca- permite el contexto en el que se prestan los ser-
dos se han desarrollado en el ámbito de la sa- vicios. Es decir: aprovechar la oportunidad de
lud materno-infantil, partiendo del llamado mejora o solucionar el problema identificado.
continuum de cuidados propuesto por WHO, A veces, sólo con el análisis del problema y
UNICEF y UNFPA, que comienza con la salud la consideración de los criterios o requisitos de
reproductiva y termina con la atención a la calidad que queremos, resulta evidente lo que
adolescencia, pasando por la atención prena- hay que hacer para mejorar y se puede diseñar
tal, perinatal e infantil. directamente la intervención oportuna. Otras
Los modelos de atención pueden enfocarse veces, sobre todo cuando el problema puede
en una parte concreta del continuum de cui- limitarse a un solo requisito de calidad (tiem-
dados o de la atención al problema de salud pos de espera elevados, insatisfacción, fallos
considerado, pero siempre han de incluir toda organizativos puntuales y repetidos, etc.) de
la evidencia existente para todos los niveles de difícil comprensión y sin relación sabida con
atención implicados. criterios de calidad concretos, lo oportuno es
hacer un estudio de causas o comprobación
de hipótesis que expliquen el incumplimiento
del criterio o requisito de calidad en estudio.
* http://www.improvingchroniccare.org/index.php?p=The_Chronic_
Estas dos eventualidades están marcadas en el
Care_Model&s=2 (último acceso en Septiembre 2015) gráfico más completo (figura 0) como vías de
• 29 •
Los ciclos de mejora son una acción contingentes o alternativas y completan ción es la única actividad desarrollada en los
actividad imprescindible en las actividades que se pueden relacionar direc- programas externos (de iniciativa externa al
los programas o sistemas de tamente con la evaluación de la calidad, el clá- centro). Piénsese, por ejemplo, en los listados
gestión de la calidad. sico ciclo evaluativo o ciclo de garantía de calidad, de indicadores o normas que se manejan para
en el que se evalúa la presencia o ausencia de evaluar desde los niveles centrales la atención
criterios o requisitos de calidad que se sabe de que se presta en los diversos centros sanitarios.
antemano que son importantes (por ejemplo,
todos los requisitos de una actuación clínica 6.3. El diseño o planificación de la calidad
adecuada a un tipo de paciente o problema de
salud concreto). Si los ciclos de mejora curan problemas que ya
El ciclo de mejora es probablemente lo más existen, y la monitorización tiene como fin de-
conocido y fácil de entender, pero también es tectar situaciones problemáticas o mejorables,
el grupo de actividades central y crucial de diseñar la calidad es lo mismo que prevenir la
cualquier programa de gestión de la calidad y aparición de problemas de calidad e implica,
el que más necesita de un enfoque interno, de en la terminología de la industria, diseñar sis-
autocompromiso. Sin embargo, no es suficien- temas y procesos de manera que la calidad sea
te si queremos tener un programa completo, inevitable; es decir, facilitar que las cosas ten-
aunque podamos encontrar programas que se gan que hacerse siempre bien, de manera que
basen exclusivamente en ciclos de mejora. el resultado sea el que precisamente hemos fi-
jado como esperado.
La monitorización de la
calidad es una medición 6.2. Monitorización de la calidad El diseño de la calidad es el área de activi-
periódica y planificada de dades que ha aparecido más tarde en los pro-
una serie de indicadores, Entendemos la monitorización como una me- gramas de gestión de la calidad, pero también
con el fin de controlar dición periódica, planificada y rutinaria de a la que más importancia se le está dando y la
que están a los niveles una serie de aspectos-resumen o indicadores más compleja de dominar. Su práctica parte
deseables. Sirve para de la calidad. Su objetivo es asegurarnos que de definir qué queremos conseguir, en térmi-
identificar problemas de nos mantenemos a unos niveles previamente nos de expectativas y necesidades por satisfa-
calidad u oportunidades de fijados como aceptables. En la práctica, para cer, resultados o parámetros del servicio por
mejora y controlar cambios. la monitorización se parte de una selección de diseñar y, a partir de ello, decidir qué hacer y
aspectos o servicios para los que se elaboran cómo hacerlo para lograr el resultado esperado
los correspondientes indicadores, que han de cuando tengamos ocasión de ofrecer el servicio
ir acompañados de su correspondiente esque- que hemos diseñado.
ma de medición o plan de monitorización, en Lo común dentro de las actividades de di-
el que hay que especificar, entre otras muchas seño de la calidad son los diseños de interven-
cosas, el método y la periodicidad de las me- ción subsiguientes al análisis del problema o la
diciones. Estos indicadores pueden derivarse discusión de los datos en un ciclo de mejora; el
de ciclos de mejora realizados o ser de entrada diseño de intervenciones es el punto en el que
construidos y seleccionados para monitorizar se unen evaluación y diseño de la calidad (fi-
aspectos que consideramos relevantes en los gura 0). Por otra parte, en los servicios de salud
servicios que ofrece el centro. El resultado o fin hay una cierta tradición en diseñar la calidad
principal de la monitorización es identificar de la atención clínica: la construcción de pro-
oportunidades de mejora, o problemas de ca- tocolos o guías de práctica. En la actualidad,
lidad que merecen una atención adicional más el enfoque de diseño, con diversos nombres y
profunda y detallada. acepciones (uno de los más populares, reinge-
Con el diseño de la calidad La monitorización es igualmente útil en niería) es el que se propone como fundamental
se intenta que las cosas los programas o enfoques internos y externos, para los programas de GC; incluso se llega a
se hagan siempre bien y como después veremos, no como los ciclos de aconsejar empezar por ahí. Sin embargo, di-
a la primera según unos mejora que tienen su máxima aplicabilidad en seño solo tampoco es suficiente. Por muy per-
parámetros prefijados, los programas internos. A veces, junto con la fecto que pensemos que sea, siempre hay que
previniendo la aparición de acreditación que es otra forma de monitorizar contrastarlo con la realidad, es decir, evaluar
problemas de calidad. si se hace de forma periódica, la monitoriza- los criterios o indicadores que nos digan si se
• 30 •
está implantando como estaba previsto y si conocido como gestión de la calidad total (total La trilogía de Juran
funciona o no. quality management), han surgido multitud de (planificar, controlar y
esquemas. La mayoría de estos esquemas re- mejorar la calidad) se
6.4. Otros modelos para representar las presentan sólo uno de los tres grupos de ac- corresponde con lo que
actividades de un programa de GC: ciclo de tividades (normalmente, los ciclos de mejora), hemos llamado diseño,
monitorización y ciclos de
garantía de calidad, trilogía de Juran, ciclo de confunden innecesariamente los tres, o son
mejora.
Deming adaptaciones de otros esquemas con gran pre-
dicamento en la industria que se llegan incluso
El esquema de actividades que hemos pro- a desvirtuar. El ejemplo más paradigmático e
puesto y explicado tiene sus raíces en el ciclo ilustrativo de esto probablemente son las múl-
de garantía de calidad ampliamente asumido tiples adaptaciones del ciclo de Shewart, que
en el pasado en el ámbito del sector salud, y Deming popularizó en Japón y que actualmen-
que hemos ido modificando a medida que la te se conoce como PDCA (plan-do-check-act),
conceptualización y la práctica de los progra- PDSA (plan-do-study-act) o ciclo de Deming.
mas de gestión de calidad han necesitado de El ciclo de Shewart fue mostrado por Deming
modelos más completos. El clásico ciclo de ga- como un esquema para la mejora de la calidad
rantía de calidad o ciclo evaluativo sólo con- con base fundamentalmente en el diseño de Hay multitud de otros
templa explícitamente las actividades propias innovaciones (plan, planificar), que luego hay esquemas, de los cuales
el más conocido es el
de lo que hemos llamado ciclos de mejora, y que ensayar a pequeña escala (do, hacer) y me-
PDCA o Ciclo de Deming,
aun así con algunas dificultades de entendi- dir sus efectos (check, comprobar o estudiar), profusamente adaptado e
miento en su aplicación cuando el problema para después incorporar los rasgos positivos a interpretado de maneras
identificado no es de tipo clínico. Por tanto, no la producción rutinaria de ese producto o ser- muy diversas.
puede evaluarse la calidad directamente con vicio (act, actuar). La inevitable interconexión
base en criterios de buena práctica previamen- entre los tres grupos de actividades ha ido pro-
te conocidos y establecidos, cuya falta de cum- duciendo adaptaciones varias que explicitan
plimiento sería la causa directa del problema más pasos de las otras dos (monitorización y
de calidad. solución de problemas), en detrimento de la
El esquema de actividades completo, com- idea inicial de ser un ciclo que se inicia como
puesto por ciclos de mejora, monitorización y actividad de diseño (innovación). En estado
diseño de la calidad, que hemos ido desarro- puro o en una de sus múltiples adaptaciones,
llando por la necesidad de modelar adecua- el PDCA o PDSA (como también se le llama, al
damente la realidad práctica y la visión de los sustituir el original y más vulgar check por el
Los programas o
programas que íbamos construyendo en cen- más académico study) es probablemente el mo-
sistemas de gestión de
tros sanitarios, se asemeja mucho a la esencia delo más citado, adaptado y referenciado en la la calidad son el camino
de otros esquemas utilizados en el ámbito de actualidad. hacia la excelencia,
la industria. El más parecido y conocido es punto culminante de la
la llamada Trilogía de Juran. Los términos que 6.5. Para qué sirve un sistema de GC autoestima.
se incluyen en el modelo de Juran, con algu-
na variación –lo que aquí hemos llamado di- La visión de lo que entendemos por un sistema
seño, monitorización y ciclos de mejora– son o programa de GC no estaría completa sin una
actividades de planificación, control y mejora, idea clara de lo que se puede conseguir en la
aunque este autor no ha descendido, como en práctica; es decir, de cuáles son sus resultados
nuestro caso, al detalle de los pasos que hay y su justificación.
que incluir en cada grupo de actividades. Podemos afirmar, sin temor a equivocar-
Otros esquemas y terminologías sobre las nos, que el compromiso explícito, estructurado
actividades que comprende un programa de y funcional con la calidad sirve para aumentar
gestión de la calidad (o cualquiera de los di- la efectividad, la eficiencia (a través sobre todo Los programas o sistemas
versos nombres que pueda recibir: garantía de una reducción drástica de los costes de la de Gestión de la Calidad
de calidad, gestión de la calidad total, mejo- calidad deficiente) y la satisfacción de provee- aumentan la efectividad, la
ra continua de la calidad, etc.) se cuentan por dores y usuarios, y además nos pone en el ca- eficiencia y la satisfacción
decenas. Dentro de la terminología o modelo mino hacia la excelencia. Si se juega bien, es un de proveedores y usuarios
• 31 •
juego sin perdedores: los gestores tienen ante El anhelo de excelencia y perfección, culmina-
sí una formidable herramienta para orientar su ción del arte de vivir ético, es el producto más
gestión; los profesionales de la salud trabajan exquisito del amor propio adecuadamente con-
mejor y, dado que responden de forma recono- siderado. Quien no desea ser excelente ni per-
cida y responsable a sus necesidades éticas y fecto, quien crea que no se merece tanto o no se
científicas, se sienten satisfechos; la población atreve a proponerse tanto, es que desde luego
atendida sólo puede esperar beneficios en su no se ama lo suficiente a sí mismo; o tiene una
salud y satisfacción cuando mejora la calidad idea de la excelencia y perfección puramente
de la atención sanitaria que recibe. La eviden- ajena, pervertida, esclavizadora, incompatible
cia empírica es abundante en la tradición de con las urgencias inaplazables de su yo.
los programas de calidad tanto en la industria
como en los servicios de salud. Los programas de GC nos ayudan a ser exce-
En el campo industrial, la representación lentes, es decir, exquisitamente egoístas, y a
más paradigmática de los beneficios que pue- disfrutar con ello.
de aportar la mejora de la calidad es la llamada
“reacción en cadena” de Deming: mejor cali- 6.6. Razones para no tener un programa de GC
dad  más productividad  disminución de
costes  disminución de precios  aumento Si tenemos en cuenta el compromiso ético de
de cuota de mercado  crecimiento de la em- los profesionales de la salud con los pacientes a
presa y de los beneficios. Sin embargo, el énfa- los que atienden, el rechazo a los programas de
sis se pone fundamentalmente en los costes y GC sólo podría estar basado en que la alterna-
los beneficios económicos, lo cual es compren- tiva de no tenerlos fuese más beneficiosa para
sible porque es el lenguaje que mejor entien- la población atendida o para los intereses de
den los gestores y, al parecer, esta literatura va los profesionales. Igual argumentación podría
La no existencia del sistema
de GC puede justificarse dirigida sobre todo a este tipo de lectores; pero utilizarse, tanto para los que proveen atención
por ignorancia, inercia, hay más beneficios que los puramente econó- directa al paciente, como para el nivel gestor y
incompetencia o una micos. Por ejemplo –y continuando en el am- otros proveedores de clientes internos.
mezcla de las tres. Para plio campo de la industria–, un resumen de los Por otra parte, la evidencia empírica sobre
ponerlo en marcha hay que beneficios de la GC medidos en 22 compañías los programas de GC es constante y consisten-
saber, querer y poder. finalistas del Baldrige National Quality Award temente la misma: los beneficios son tangibles
de Estados Unidos incluye, además de una y manifiestos en comparación con su inexis-
mayor productividad y mayores beneficios de tencia. ¿Cómo se explica entonces que lo más
mercado, mejor clima laboral y mayor satisfac- frecuente sea que no exista programa de GC?
ción los sus clientes. En el sector salud la situa- Los posibles argumentos para responder pue-
ción es la misma. Las publicaciones que descri- den resumirse en tres: ignorancia, inercia e in-
ben los resultados de las iniciativas de GC competencia.
documentan mejoras muy concretas, cuantifi- l Ignorancia. Está claro que la existencia de
cadas e importantes en la efectividad, eficien- programas de GC no es exigible si no se
cia y satisfacción de personal y usuarios. sabe previamente en qué consisten y cómo
Hasta aquí, todo lo mencionado consiste ponerlos en marcha. La calidad no es aún
en efectos y beneficios que tenemos al alcance un tema sobre el que tengan conocimiento
de la mano y que podemos ver materializados y formación todos los profesionales de la
en el corto y medio plazo, pero hay también salud ni todos los gestores.
otros efectos más intangibles y que van co- l Inercia. Saber no es suficiente; también hay
brando sentido a más largo plazo: los progra- que querer y poder superar los condicio-
mas de GC son el camino hacia la excelencia, nantes adversos que se imponen reforza-
un objetivo final, cambiante, e inalcanzable dos con el tremendo poder de la inercia,
por los propios cambios a que está sujeta la fácilmente asociada a la indecisión. Se
visión de la excelencia, pero motor último del puede argumentar que estos condicionan-
amor propio. Fernando Savater lo ha resumido tes adversos llegan a veces a hacer imposi-
de forma muy acertada: ble el programa de GC. En realidad, lo que
• 32 •
puede ocurrir es que lo hagan más difícil, de las principales ventajas de este enfoque es
no imposible. Es en estas situaciones en las que reconoce el grado de responsabilidad y
que es más evidente la importancia de la autonomía que los profesionales de la salud
capacidad creativa y el ejercicio del lide- tienen indudablemente en la prestación de los
razgo profesional para ir abriendo brecha. servicios; además de que es de manera interna
Se trata de dar el paso de tener un compro- como mejor se entiende el contexto en que se
miso explícito y operativo con la calidad a da la asistencia y los medios disponibles para
partir del compromiso implícito que todo mejorarla. Como consecuencia, los programas
profesional tiene. internos se adaptan a las condiciones locales;
l Incompetencia. Cuando se sabe en qué conse enfatiza la profesionalidad y se canaliza el
sisten los programas de GC y existe la po- deseo de la mayoría de hacer las cosas de la
sibilidad cierta y evidente de ir venciendo mejor manera posible; además, es lógico que
la inercia, el no ponerlos en marcha es ejer- el ejercicio interno del compromiso con la cali-
cer la profesión de forma incompleta. Éste dad facilite la sinergia con las iniciativas exter-
es un síntoma de cierta incompetencia, sonas para el mismo fin.
bre todo en el nivel gestor. Entre los inconvenientes, al principio está
el de tener que buscar el tiempo y esfuerzo ne-
7. Programas internos y externos en la cesarios para autoevaluarse y mejorar; una vez
estrategia para la mejora de la calidad superado éste pueden aparecer otros, como,
por ejemplo, determinados conflictos de auto-
Una característica importante de los progra- ridad, desarrollo de métodos demasiado idio-
mas e iniciativas para la mejora de la calidad es sincrásicos con poca base científica, autocom-
el énfasis específico o la combinación de inicia- placencia por la falta de una referencia externa
tivas externas e internas. Los enfoques interno para compararse, o falta de intervenciones y
y externo se distinguen en función de que las seguimiento sobre determinados problemas
actividades partan de los implicados directa- internos que pueden aparecer.
mente en aquello que se evalúa (autoevalua- En el enfoque externo, la iniciativa en sí
ción, enfoque interno) o se pretenda evaluar para evaluar y las normas de la evaluación o
las actuaciones ajenas (enfoque externo). monitorización son establecidas por personas
En el sector salud, algunos autores distin- distintas de los proveedores que van a ser juz-
guen una tercera categoría que podríamos lla- gados.
mar enfoque externo en programas internos, Su principal ventaja es que, al menos en
en referencia a las evaluaciones que se pueden teoría, sirven para un propósito socialmente
hacer de unos profesionales sobre otros den- más amplio: el que corresponde a todo el siste-
tro de un mismo centro de salud u hospital de ma de salud en cualquiera de sus niveles. Adi-
acuerdo con una línea jerárquica o de otro tipo cionalmente, los programas externos permiten
(por ejemplo, de tutores sobre sus residentes, las comparaciones entre centros semejantes,
de gerentes sobre los servicios, de coordinado- pueden llamar la atención sobre problemas
res sobre coordinados, etc.). Estas evaluaciones que de otra forma pasarían inadvertidos y ha-
son internas en relación con la institución, pero cen mucho más difícil la autocomplacencia o la
no con el profesional evaluado. ocultación de problemas. Sin embargo, uno de
En el enfoque interno, los que son evaluados sus principales inconvenientes es que revisan
quieren la evaluación, están implicados en el características de fiscalización o inspección,
establecimiento de los criterios e indicadores con el consiguiente rechazo de los inspeccio-
que van a ser utilizados y participan, de forma nados, en vez de ayudar a la evaluación inter-
activa o delegada, en la totalidad de activida- na, a la identificación de problemas y, en defi-
des de los ciclos de mejora, monitorización y nitiva, al proceso de mejora de la calidad. Los
diseño. La utilidad de las iniciativas internas programas externos precisan también de una
depende directamente del compromiso de considerable infraestructura organizativa y,
los propios evaluados de ser rigurosos con su sobre todo, de utilizar normas, criterios e indi-
evaluación y con la mejora de la calidad. Una cadores suficientemente fiables y válidos para
• 33 •
su propósito. Los programas externos pueden instituciones de salud sobre la base de un en-
utilizar estándares artificiales o irrelevantes, foque exclusivamente externo. Como resume
desconociendo o ignorado las circunstancias Palmer: “desde fuera se puede medir, desde
de la asistencia diaria y, lo que es peor, los me- dentro se puede medir y mejorar”.
dios con los que se puede mejorar la asistencia
en un centro concreto. 8. Responsabilidades en la mejora de la
Los enfoques interno y externo se comple- calidad
mentan; ambos son necesarios para un acerca-
miento global de sistema de salud a la mejora La calidad en los servicios de salud tiene tres
de la calidad, y ninguno es por sí solo una res- grupos de protagonistas directos (personal
puesta suficiente desde el punto de vista de la de gestión, personal que provee directamente
población en su conjunto. Sin embargo, aun in- los servicios y población atendida), y los tres
sistiendo en la complementariedad de los dos tienen algo que decir y hacer para mejorar la
tipos de enfoque, lo que tenemos al alcance en calidad. El problema no es, sin embargo, iden-
cualquiera de los niveles que nos encontremos tificar quiénes son los protagonistas sino tener
en el sistema de salud son las actividades de claro cómo ejercer este protagonismo. Para
evaluación y autocorrección desde la perspec- ello, en primer lugar, hay que tener presentes
tiva interna. Pero aún hay más razones para los dos tipos de enfoques y programas com-
traer a primer término el enfoque interno. Ya plementarios: externo e interno, y después hay
hemos comentado cómo el entender y practi- que revisar cuáles de ellos están al alcance de
car la gestión de la calidad como algo inheren- cada uno, cuáles son sus principales activida-
te al funcionamiento diario de los respectivos des y cómo se justifica su realización para con-
centros y servicios favorece la superación de seguir el objetivo final de la mejora continua
La gestión de la calidad resistencias frente a propuestas de sistema que de la calidad.
tiene tres protagonistas: pueden ser percibidas como fiscalización del
gestores, personal de salud exterior, y no como una necesidad de optimi- 8.1. El papel de los gestores
y población que recibe los zar profesional y socialmente los servicios de
servicios. salud. Adicionalmente, los análisis realizados Una de las principales características de los
de los muchos años de experiencia con progra- más recientes enfoques de los programas de
mas de todo tipo en el multisistema de Estados GC es el reconocimiento de la máxima respon-
Unidos concluyen en lo imprescindible que sabilidad que tiene el personal gestor para que
resultan los programas internos para lograr el programa exista y funcione. En los libros y
la mejora de la calidad, poniendo en primer manuales sobre implementación de programas
término el interés y la responsabilidad de los de GC con los métodos tomados de la indus-
profesionales que la protagonizan. En esen- tria se afirma, de forma totalmente inequívoca,
cia, los programas externos pueden apoyar u que sin el compromiso activo de los directivos
obligar a que existan programas internos, pero no hay programa posible.
la mejora de la calidad exige que la gestión Los necesarios programas externos, tanto
de la calidad sea asumida como un esfuerzo los de nivel de sistema como los de niveles in-
interno. No puede parecer lógica ninguna es- termedios, son una responsabilidad ineludible
trategia de mejora de la calidad que descanse del nivel gestor. La forma en que estén diseña-
principalmente ni, menos, exclusivamente en dos e implementados y la medida en que con-
acercamientos externos. Esto no quiere decir tribuyan o no a la mejora de la calidad depen-
que los programas externos no sean útiles o den ampliamente de la capacidad de gestión
necesarios: la situación ideal es de sinergismo de sus impulsores. El nivel gestor es también
entre programas internos y externos, donde responsable de impulsar y mantener los pro-
los programas externos apoyan a los internos gramas internos de los centros a su cargo; pero
y ofrecen elementos de comparación entre ins- para ello, todos los autores subrayan la necesi-
tituciones de características semejantes. Lo que dad de tener en cuenta las peculiaridades de la
sí es cuestionable es intentar que se empiecen actividad y el personal que en la práctica ha de
las actividades de mejora de la calidad en las llevar adelante las actividades de GC y, en defi-
• 34 •
nitiva, la mejora de la calidad. La participación salud. Adicionalmente, en el sector salud la in- El rechazo a los programas
del personal sanitario es uno de los factores fluencia de los líderes profesionales puede ser o sistemas de GC sólo se
clave para el éxito del programa. mucho mayor que la de los gestores a la hora de justificaría si el no tenerlos
introducir actividades de GC. Este hecho, com- fuese mejor para los
8.2. El papel del personal de salud probado empíricamente en más de una oca- pacientes y los propios
profesionales.
sión, confiere una responsabilidad adicional a
El personal encargado de proveer directamen- los buenos profesionales en la práctica pionera
te la asistencia sanitaria es la base insustituible de las actividades de GC.
de los programas internos y de todo el siste-
ma. Sin su compromiso y participación, la me- 8.3. El papel de los usuarios
jora de la calidad no es posible aunque exista
oficialmente un programa de GC. En uno de De una forma esquemática, podemos clasificar
los primeros libros sobre las experiencias del las principales formas en que el usuario puede
enfoque industrial aplicado a la salud, editado contribuir a la GC en dos grandes grupos me-
entre otros por Donald Berwick, se reconoce todológicos: activa (por iniciativa propia) o so-
taxativamente. Por otra parte, el grado de au- licitada por el sistema de salud. Metodológica-
tonomía en las decisiones a la hora de la pres- mente, la distinción es importante pero, al
tación de servicios que tiene el personal de igual que ocurre con los enfoques interno y
salud probablemente sea de los más elevados externo, no deben considerarse como exclu-
que puedan encontrarse en cualquier empre- yentes. Ambas son útiles, ambas son teórica-
sa. En muchos de los aspectos, un solo médi- mente necesarias y, por tanto, el grado de desa-
co, enfermera, fisioterapeuta o un mínimo rrollo de ninguna de ellas debería oscurecer a
equipo son, en gran parte, gestores de sí mis- la otra, ni impedir que se avance en el conoci- El grado de autonomía en
mos, de su tiempo y de sus acciones, y las de- miento de métodos y mecanismos de optimi- las decisiones que afectan
cisiones que tomen tienen una gran trascen- zación de cada una de las formas de participa- a la calidad, y la influencia
del liderazgo profesional
dencia para la calidad del servicio que ofrecen. ción posible. No puede decirse, sin embargo,
en la implementación de
Adquieren así, a su nivel, las mismas respon- que se haya demostrado un nivel de utilidad actividades de GC son dos
sabilidades que puedan ser atribuidas a los en GC parecido para todas ellas, ni que la me- razones adicionales para
gestores de niveles superiores de la organiza- todología de su puesta en marcha y aprovecha- subrayar el importante
ción sanitaria, aunque dentro de su particular miento efectivo esté igualmente desarrollada. papel de los profesionales.
ámbito de influencia. En la actualidad, aun dentro de las muchas di-
Desde otra perspectiva, la participación del ficultades y puntos oscuros que todavía exis-
personal de salud en los programas internos de ten, se sabe mucho más de los métodos y apro-
los centros asistenciales en su autoevaluación vechamiento rutinario de la participación
para asegurar y mejorar la calidad de la aten- solicitada (por ejemplo, a través de encuestas y
ción que ofrecen puede justificarse por razones documentos como el consentimiento informa-
eminentemente prácticas: no quedarse al mar- do y las voluntades previas) que de las diver-
gen de algo que se va imponiendo hasta hacer- sas formas de participación activa, entre las
se inevitable. Sin embargo, su justificación más que destacan las quejas y reclamaciones y la
profunda son las razones de ética profesional; participación activa en el propio proceso asis-
la evaluación y mejora de la calidad es un deber tencial.
que tienen consigo mismos y con sus pacientes.
El rechazo de los programas de GC sólo sería 9. Estrategias de implantación de
justificable si la alternativa de no participar se actividades. El ciclo de mejora
mostrase más beneficiosa para los intereses de
los pacientes –de los que son ineludiblemente Como vimos en el apartado 6 de este capítulo,
responsables– y del propio personal de salud; podemos identificar tres grandes grupos de ac- El usuario de los servicios
éste no parece ser el caso a la vista de los abun- tividades en los programas de GC, que respon- puede participar por
dantes problemas de atención, muchos de ellos den a otros tantos puntos de partida: diseño de decisión propia o porque se
previamente inadvertidos, que afloran cada la calidad, monitorización y ciclos de mejora. le solicite. Ambas formas
vez que se evalúa la calidad de los servicios de Todos ellos terminan estando interrelaciona- son útiles para la GC.
• 35 •
dos, pero en teoría es posible comenzar nues- torización es necesariamente una actividad
tras actividades por cualquiera de los tres. Sin complementaria que, aunque resulta de gran
embargo, lo que vamos a proponer es la reali- relevancia en los programas estables, es perfec-
zación de un ciclo de mejora, ¿por qué? Hay tamente prescindible al inicio de los mismos.
tres razones: la primera es que, dentro de su Una secuencia posible, e incluso deseable,
posible complejidad, es la actividad más fácil en la implantación de actividades de GC es
de realizar y comprender; la segunda es que, que, una vez conocidos y practicados los méto-
como actividad de aprendizaje, es muy com- dos y herramientas útiles para los ciclos de me-
pleta y básica, de modo que abona el terreno jora, se sintiera la necesidad de conocer tam-
para comprender y practicar mejor las otras bién las de monitorización y diseño, y de
dos, y la tercera es que posibilita la obtención liderar la implantación de la GC como activi-
Proponemos comenzar de resultados a un relativo corto plazo, de dad plenamente asumida en el entorno de tra-
la dinámica de la mejora modo que motiva a continuar. bajo de cada uno. En este manual vamos a cen-
continua con la realización Schein, uno de los grandes nombres del de- trarnos en lo que supone la realización de un
de un ciclo de mejora por sarrollo organizacional, resume en siete puntos ciclo de mejora, cuyos pasos se describen bre-
su relativa facilidad de sus recomendaciones estratégicas para intro- vemente a continuación. En cada paso nos au-
compresión, por su valor ducir cambios; destaquemos los dos que se re- xiliaremos de determinados métodos y herra-
didáctico para la GC y por fieren a actividades concretas: “comenzar como mientas, los cuales detallaremos en cada
su efecto motivador si se
si fuese un experimento” y “empezar con pa- capítulo de este manual, de acuerdo con el es-
realiza con éxito.
sos poco ambiciosos y adoptar una estrategia quema representado en la figura 0, al principio
de implantación progresiva”. Aplicado a nues- de este capítulo.
tro tema, comenzar por actividades de diseño,
aunque es tremendamente atractivo e incluso 9.1. Pasos de un ciclo de mejora
hay una tendencia actual a proponerlo como
primer paso, no sería una buena opción porque Paso 1. Identificación y priorización de la oportuni-
reviste en general mayor complejidad que los dad de mejora. El ciclo de mejora comienza
otros dos. También es muy frecuente que se con la identificación de una oportunidad
propugne comenzar por elaborar un listado de de mejora o problema de calidad. A partir
indicadores y monitorizar. Sin embargo, optar de ahí se generan actividades cuyo objeti-
por la realización de un ciclo de mejora es un vo es solucionar el problema identificado
comienzo más simple, fácil de enfocar y que a o, lo que es lo mismo, aprovechar la opor-
la vez resulta enriquecedor y didáctico. Sin em- tunidad de mejorar. De los muchos méto-
bargo, no es descartable ni excluyente comen- dos que se pueden utilizar, hay que cono-
zar identificando problemas a través de la me- cer a fondo por lo menos unos cuantos de
dición de indicadores bien seleccionados, o tipo cualitativo, de los que destacamos la
Los ciclos de mejora se bien diseñando o rediseñando un servicio es- lluvia de ideas, la técnica de grupo nominal y
realizan siguiendo una serie pecialmente importante. Todo depende del las matrices decisionales, aparte de otros que
de pasos concretos, que se
grado de madurez, compromiso y recursos ini- precisan de datos y una determinada in-
benefician de métodos y
herramientas relativamente
ciales para la GC: han de ser mayores para co- fraestructura para realizarlos. En este paso
específicos que serán objeto menzar con monitorización, y aún más para debemos elegir cuál es el servicio o el as-
de revisión en los diversos comenzar con diseño. En relación con la moni- pecto del mismo que queremos mejorar.
capítulos de este manual. torización, ha de quedar claro, además, que
monitorizar no es, en sí mismo, mejorar. Moni- Paso 2. Análisis del problema de calidad. Es cru-
torizar es asegurarse de que nos mantenemos a cial para decidir qué hacer a continuación.
unos niveles de calidad aceptables y preesta- Para el análisis de problemas de calidad
blecidos, o hacer despistaje de existencia de son de utilidad diversos métodos como el
problemas, mientras que evaluar en un ciclo de diagrama de causa y efecto, flujograma, histo-
mejora es buscar las causas y lograr la solución grama, estratificación y diagrama de Pareto
de esos problemas. Los ciclos de mejora son la y gráficos de control, utilizables con y sin
esencia imprescindible de cualquier programa datos previos sobre el problema, según el
de GC, tienen sentido por sí mismos. La moni- método. De este paso se derivan tres posi-
• 36 •
bles cursos de acción: diseño de interven- realizar un análisis gráfico con diagrama
ción, diseño de estudio de nivel de calidad de Pareto y otras representaciones visua-
y diseño de estudio de causas hipotéticas. les, de manera que nos resulte más eviden-
En cualquier caso se necesita previamente te sobre qué incidir para mejorar.
tener claro cuáles son los criterios o indi-
cadores que nos midan la existencia o no Paso 6. Diseño de intervenciones para mejorar. La
de calidad. discusión de los datos de la evaluación
puede sugerir por sí sola qué hacer para
Paso 3. Construcción de criterios para evaluar ca- mejorar; sin embargo, es conveniente co-
lidad. En este paso deben identificarse cri- nocer una serie de herramientas que pue-
terios válidos y fiables para medir la cali- den ser útiles para decisiones grupales
dad del servicio o aspecto del servicio en sobre diseño de planes de acción para la
estudio. mejora. Entre estas herramientas, está el
Junto a las indicaciones formales para análisis de campos de fuerza, el diagrama de
valorar la validez, hay que manejar un es- afinidades y la votación múltiple, que deben
quema para medir la fiabilidad, antes de ser revisados para ayudar en la realización
utilizar los criterios o indicadores de for- de este paso.
ma generalizada.
Paso 7. Implementación de la intervención diseña-
Paso 4. Diseño de estudio de nivel de calidad o de da. En esencia, es el cumplimiento del plan
causas hipotéticas. En la realización de ciclos de acción resultante del paso 6.
de mejora hay que detallar los componen-
tes para el estudio de nivel de calidad, y Paso 8. Reevaluación y documentación de la mejora
los de causas hipotéticas que puedan rea- conseguida. Es el paso que cierra el ciclo de
lizarse incluso después de haber realizado mejora si hemos tenido éxito con la inter-
un estudio de nivel de calidad. En este vención diseñada e implementada. Para
paso hay que utilizar unos conocimientos documentar la mejora, hemos de efectuar
básicos de estadística para beneficiarse de la comprobación estadística de que la di-
las ventajas de evaluar con muestras. ferencia es significativa, si hemos utiliza-
do muestreo, y una forma sencilla y muy
Paso 5. Análisis y presentación de los datos de la completa de visualizarlo gráficamente
evaluación. Tras recoger los datos de acuer- como, por ejemplo, un diagrama de Pareto
do con el diseño realizado, hay que buscar antes-después. Tras la reevaluación, pode-
la forma más eficiente de presentarlos y mos decidir monitorizar, reanalizar el pro-
analizarlos. Si hemos evaluado una mues- blema –si no hemos conseguido mejorar–
tra, daremos los datos estimados con inter- o emprender otros ciclos de mejora sobre
valos de confianza, y veremos la forma de un aspecto o servicio diferente.
• 37 •
BIBLIOGRAFÍA
• Bengoa R, Kawar R, Key P, Leathermam S, Massond R, Saturno P. Quality of care. A process for making strategic choices in Health
Systems. Geneve: WHO, 2006. Cap 2.
• Berwick DM, A Blanton Godfrey AB, Roessner J. Curing Health Care. New Strategie for Quality Improvement. San Francisco:
Jossey Bass, 1990.
• Deming WE. Calidad, productividad y competitividad. La salida de la crisis. Madrid: Díaz de Santos, 1989. Cap. 6.
• Donabedian A. Explorations in quality assessment and monitoring. Vol. I. The definition of quality and approaches to its as-
sessment. Ann Arbor: Health Administration Press, 1980.
• Feigenbaun AJ. Total Quality Control, 3ª ed. (edición 40 aniversario). New York: McGraw Hill, 1991.
• Institute of Medicine. Crossing the Quality Chasm. A New Health System for the 21st Century. Washington: National Academy
Press.
• Ishikawa K. What is quality control? The Japanese way. Englewood Cliffs: Prentice-Hall, 1985. Cap. 3.
• Juran JM, Gryna FM, Bingham RS. Manual de Control de la Calidad, 2ª ed. Reverté, Barcelona, 1990. Cap. 2 y 3.
• Leebow W, Ersoz CJ. The health care manager´s guide to continuous quality improvement. Chicago: AHA, 1991, Cap. 11.
• Lohr KN (ed.). Medicare: A Strategy for Quality Assurance. Washington DC: National Academy Press, 1990. Vol. I, Cap. 9.
• Office of Technology Assessment (OTA). Assessing the Efficacy and Safety of Medical Technologies. Washington DC: US Gover-
nment Printing Office, 1978.
• Palmer RH. Evaluación de la asistencia ambulatoria. Principios y práctica. Madrid: Ministerio de Sanidad y Consumo, 1990.
Cap. 3 y 4.
• Robbins SP. Organizational behavior. Concepts, controversies and applications. Englewood Cliffs: Prentice Hall, 1989. Cap. 17.
• Saturno PJ, Imperatori E, Corbella A (eds.). Evaluación de la calidad asistencial en Atención Primaria. Experiencias en el marco
de la cooperación ibérica. Madrid: Ministerio de Sanidad y Consumo, 1990.
• Saturno PJ. Estrategias para la puesta en marcha de actividades de evaluación y mejora de la calidad asistencial en Atención
Primaria (I). Consideraciones generales. Centro de Salud 1993; 1(9): 586-592.
• Savater F. Ética como amor propio. Barcelona: Ariel, 2008.
• Schein EH. Organizational culture and leadership. San Francisco: Jossey-Bass, 2004.
• Scholtes PR, et al. The team handbook. Madison: Joiner Associates, 1988.
• The Conceptual Framework for the International Classification for Patient Safety. Final technical report. Geneva: WHO, 2009.
Disponible en: http://www.who.int/patientsafety/taxonomy/ icps_full_report.pdf (acceso: febrero de 2010).
• 38 •
Capítulo 2
Identificación y priorización
de oportunidades de mejora
Contenidos generales y objetivos específicos
1. Introducción
2. Concepto de problema de calidad u oportunidad de mejora
3. Identificación de la oportunidad de mejora
4. Normas generales para la selección de una oportunidad de mejora
5. Métodos de identificación de oportunidades de mejora. Consideraciones generales
6. Métodos para la identificación de oportunidades de mejora que no precisan datos
7. Métodos para la identificación de oportunidades de mejora mediante datos
8. Inicio práctico del ciclo de mejora
9. El cartel narrativo: un apoyo para la realización y el seguimiento del ciclo de mejora
Anexo 2.1. Instrucciones para la elaboración de un cartel narrativo de un ciclo de mejora
Anexo 2.2. Instrucciones para la realización de la técnica de grupo nominal

2 Identificación
de oportunidades de mejora Capítulo
Capítulo 2 2
Monitorización
Elaboración
medir calidad


Capítulo 8 Diseño
de intervención



Contenido general
Este capítulo versa sobre el primer paso de los ciclos de mejora: la selección y descripción
operativa del problema u oportunidad de mejora que se evaluará.
Se hace una revisión de diversos métodos utilizables, ilustrándolos con ejemplos, y se
insta al lector a que seleccione su objetivo de mejora. Para facilitar la realización y seguimiento del
ciclo de mejora que se inicia con este capítulo, se aconseja utilizar un cartel narrativo.
1. Describir diferentes métodos aplicables para la identificación de problemas de calidad u

oportunidades de mejora
2. Escoger la metodología de identificación de problemas más adecuada a su entorno de tra-
bajo
3. Resumir los resultados de la lluvia de ideas de un grupo de trabajo
4. Dirigir la realización de un Grupo Nominal
5. Distinguir diferentes métodos de priorización de problemas
6. Aplicar matrices de decisión a la priorización de problemas
7. Establecer prioridades basándose en datos
8. Identificar en qué formas puede tenerse en cuenta al usuario para la identificación de opor-
tunidades de mejora
9. Definir qué es un problema de calidad u oportunidad de mejora
10. Describir un problema de calidad en términos operativos concretos
11. Diferenciar problemas genéricos y específicos
12. Diferenciar problemas estructurales de problemas relativos a las actividades y resultados
13. Escoger la oportunidad de mejora que va a ser sometida a evaluación
Identificación y priorización Capítulo
de oportunidades de mejora 2
“Un defecto puede ser un tesoro. El descubrimiento de la imperfección

nos brinda la posibilidad de reducir el espacio que nos separa de la excelencia”
(citado por Berwick DM)
Este capítulo aborda el

1. Introducción tánea de todos los servicios prestados es ge-
inicio del ciclo de mejora
neralmente impracticable como primer paso e
o ciclo de evaluación:
Cualquier actividad de evaluación de la cali- incluso es desaconsejable afrontar varias opor- la identificación de la
dad debe comenzar por plantearse ¿Qué es lo tunidades de mejora a la vez, es preferible que oportunidad de mejora; y
que se quiere mejorar? De esta forma iniciamos seleccionemos solamente una. Lo anterior es se revisan diversos métodos
el ciclo de evaluación: con la identificación de algo que queremos hacer especialmente bien o para llevarla a cabo.
la oportunidad de mejora. Probablemente ésta que es inadmisible que se haga mal y que sos-
sea la fase más importante. Una elección acer- pechamos que hay una diferencia importante
tada será crucial para que tengamos éxito en el entre la atención proporcionada y la que sería
proyecto. De hecho, la decisión que tomemos razonable prestar. Las ventajas de esta mane-
en este momento condicionará el desarrollo ra de proceder son numerosas. Focalizamos
metodológico de las siguientes etapas del ciclo la evaluación de la calidad en un aspecto con-
(análisis del problema, evaluación e interven- creto y tangible, facilitando el compromiso de
ción). Si la elección no es acertada, las siguien- los profesionales con la mejora de la calidad.
tes fases no se podrán desarrollar con la agili- Además, en ocasiones, la delimitación de una
dad requerida y sin tropiezos. Peor aún, puede oportunidad de mejora será suficiente para
ocurrir, en un caso extremo, que el desarrollo que se promuevan los cambios que conducen a
del ciclo de mejora entre en una vía sin sali- la resolución del problema, sobre todo cuando
da. Por tanto es conveniente, sobre todo en las sus causas son evidentes.
primeras experiencias, que para identificar la En este capítulo revisaremos una serie de
oportunidad de mejora reflexionemos sobre las herramientas conducentes a delimitar y priori-
implicaciones de su elección, priorizando las zar oportunidades de mejora. Veremos que te-
que sean más sencillas en su desarrollo a lo lar- nemos diversas técnicas para su identificación.
go del ciclo de mejora y, sobre todo, en las que La decisión de utilizar un método determina-
vislumbremos la factibilidad de su solución. do debe condicionarse a las características de
Es posible que la idea de mejorar en con- cada centro y principalmente a la factibilidad
junto la calidad de toda la organización pueda de su empleo. En este sentido, vamos a subra-
parecernos atractiva. Sin embargo, una eva- yar la utilización de la lluvia de ideas, la téc-
luación global puede presentar numerosas di- nica del grupo nominal y la matriz decisional.
ficultades prácticas, especialmente cuando se Esta elección se debe a que estos métodos no
aplica a una institución en la que se llevan a requieren un contexto especial de aplicación
cabo numerosos procesos asistenciales y admi- (no necesitan fuentes de datos adicionales),
nistrativos para resolver condiciones clínicas son fáciles de comprender e involucran a los
con requisitos de calidad muy diferenciados, que quieran evaluar y mejorar la calidad. Son
como obviamente ocurre en la mayoría de los métodos versátiles que pueden adaptarse a la
centros sanitarios. Dado que la revisión simul- mayoría de las situaciones.
• 43 •
2. Concepto de problema de calidad u prestados al usuario y definir a continuación

oportunidad de mejora sus respectivos requisitos de calidad. Por ejem-
plo, la atención de pacientes crónicos con hi-
Podemos proponer una oportunidad de mejora percolesterolemia es un producto asistencial
si percibimos o intuimos que alguna de las ca- con unos requisitos de calidad que le confieren
racterísticas del servicio que ofrecemos no está una identidad propia y que le diferencian de
como creemos que debe de estar. Desde el pun- otros productos asistenciales, como puede ser
to de vista cuantitativo la podemos definir como el caso de la atención al paciente con cervical-
una diferencia, que potencialmente se puede re- gia, la atención a diabéticos, a la mujer emba-
ducir, entre lo que es razonable que exista (es- razada o la gestión de la cita previa.
tructura), se haga (proceso) u ocurra (resultado), Una vez que llegamos a este nivel de espe-
con lo que existe, se hace o se proporciona en la cificación debe plantearse para ese determinado
práctica habitual. Por ejemplo, podemos identi- proceso o servicio que nos preocupa especial-
La oportunidad de mejora ficar una oportunidad de mejora cuando perci- mente ¿Qué tipo de atención es razonable que
es cualquier situación bimos que la captación de hipertensos es muy se proporcione? ¿Qué tipo de atención estamos
en la que se observan baja en relación a lo que podríamos esperar, sos- proporcionando? y ¿Qué diferencia suponemos
diferencias, que se pueden pechamos que el seguimiento de las dislipemias o percibimos que hay entre ambas? Esta aproxi-
reducir, entre lo óptimo y la se realiza de forma esporádica, intuimos que se mación a los elementos básicos y específicos de
realidad. utilizan antibióticos en la mayoría de los pacien- la atención sanitaria es probablemente más ade-
tes diagnosticados con infección respiratoria cuada para apreciar las posibles divergencias
alta, vemos que es demasiado frecuente el que entre lo que es y lo que debería ser y permitirá
no esté disponible la historia clínica a la hora delimitar con más facilidad diversas oportuni-
de la consulta, etc. Una oportunidad de mejora dades de mejora de la calidad asistencial que
es una divergencia entre la situación actual y la pueden coincidir completamente -perspectiva
que queremos que exista. ¿Cómo proceder para integral- o en parte -perspectiva parcial- con uno
identificarlas en nuestro entorno? Hay una serie o varios servicios de la actividad asistencial. Si
de técnicas que sirven para hacerlas explícitas y atañe a un solo servicio le vamos a llamar pro-
que veremos a continuación. blema específico, mientras que si afecta a más de
un servicio le llamaremos problema genérico.
3. Identificación de oportunidades de Con estas reflexiones, espontáneamente o
mejora con métodos estructurados, es posible identifi-
car un listado normalmente extenso de oportu-
Es evidente que para determinar una posible nidades de mejora; sin embargo, para empezar
divergencia entre la atención proporcionada y un ciclo de mejora vamos a seleccionar una, y
la que se debería proporcionar, tenemos que es conveniente que prestemos atención a una
haber establecido previamente un marco de re- serie de normas generales que nos pueden
ferencia, en el que se reflejen de forma explícita ayudar a que la selección sea adecuada.
y consciente las características que, a nuestro
Las oportunidades de juicio y en función de las necesidades del usua- 4. Normas generales para la selección de
mejora se identifican más rio, debería reunir la atención sanitaria para una oportunidad de mejora
fácilmente si pensamos en cumplir con la finalidad para la cual ha sido
servicios concretos y sus concebida y con el menor coste posible. Este Cualquier oportunidad de mejora es válida des-
requisitos de calidad. marco de referencia corresponde al concepto de el punto de vista operativo siempre que su
de calidad de los servicios sanitarios que ya ha- desarrollo metodológico sea posible (puede ana-
bremos establecido previamente, adoptando o lizarse y medirse sin dificultad) y conduzca a su
adaptando las diversas definiciones posibles. resolución. Para valorar esta validez debemos
Sin embargo, este marco de referencia pue- considerar tanto factibilidad de su resolución
de resultar excesivamente ambiguo y poco como las características intrínsecas del proble-
operativo para concretar una oportunidad de ma, que pueden determinar la mayor o menor
mejora. Es preferible que se reflexione acerca garantía de éxito en la mejora de la calidad, y
de la gran variedad de productos o servicios con base en, ello priorizar y seleccionar una.
• 44 •
Identificación y priorización de oportunidades de mejora
4.1 Factibilidad de la resolución del problema la oportunidad de mejora en términos de “falta

de calidad de...”; sin embargo, la ausencia de algo no es
evaluable: puede ser una causa del problema o
La identificación y selección de una oportuni- una solución a un problema, pero nunca el pro-
dad de mejora no debe consistir exclusivamen- blema a evaluar. Es recomendable que descar-
te en revelar o denunciar una atención inco- temos, de entrada, los problemas de estructura
rrecta sino tener como objetivo corregirla. Por en términos de cantidad de recursos humanos
tanto, es básico que se valoren, al mismo tiem- o de equipamiento como foco de evaluación.
po que se identifica la oportunidad de mejora, ¿Quiere esto decir que sólo debemos some-
las posibilidades de éxito de esa evaluación, en ter a ciclos de mejora a los problemas para los
el sentido de que sea factible la mejora. En pri- que se intuye una fácil solución? A mediano
mer lugar tendríamos que averiguar si existe y largo plazo probablemente no, pero a corto
una relación evidente entre las posibles solu- plazo, para las primeras experiencias, rotunda-
ciones y nuestra capacidad de intervención. En mente sí. Es una cuestión de estrategia de im-
la mayoría de las ocasiones, la capacidad de re- plantación de la innovación que supone pres-
solver los problemas relacionados con aspectos tarle una atención explícita y cuantificada a la
estructurales de tipo cuantitativo (falta de per- mejora de la calidad.
sonal, recursos insuficientes, horario inadecua-
do, etc.) dependen en gran medida de organis- 4.2 Características intrínsecas de la
mos o de niveles jerárquicos distintos a los que oportunidad de mejora e implicaciones
han identificado el problema. Por tanto, en es- metodológicas
tos casos el margen de maniobra de resolución
del problema será escaso y la identificación del Desde un punto de vista operativo, además Cualquier problema de
problema se limitará con mucha probabilidad de la visión integral o parcial que ya hemos calidad es válido para iniciar
a una simple denuncia de la situación. Uno de visto, es útil que clasifiquemos las oportuni- un ciclo de mejora siempre
los errores más comunes en los primeros pasos dades de mejora en función de dos caracterís- que se pueda cuantificar,
en la mejora de la calidad consiste en plantear ticas intrínsecas (figura 2.1): (i) en función de analizar y resolver.
Proceso/resultado Estructura (organizacional)
Problema tipo I Problema tipo II

(ejemplo: atención (ejemplo: organización
Específico de pacientes con del equipo en la atención
hipercolesterolemia) de pacientes con
hipercolesterolemia)
Problema tipo IV
Problema tipo III (ejemplo: organización
(ejemplo: control de del equipo en la atención
Genérico pacientes con de pacientes de la
enfermedad crónica) consulta programada)
Figura 2.1. Clasificación de los problemas de calidad
• 45 •
que coincidan con un solo producto o servicio Problemas relacionados con el proceso y/o
asistencial -problema específico- o se refieran resultado mejor que los problemas relacionados
a varios -problema genérico-, tal como hemos con la estructura
apuntado más arriba; y (ii) según afecten a un
componente determinado en la prestación de En la mayoría de los casos, la capacidad de
los servicios -problemas de estructura versus resolución de los problemas estructurales por
problemas de proceso/resultado. La elec- parte del personal de los centros sanitarios se
ción de uno de estos tipos de problema debe limita exclusivamente a aquellos que están re-
hacerse de forma consciente, valorando las lacionados con aspectos organizativos. Sin em-
consecuencias de la elección en relación a su bargo, los aspectos estructurales, aunque son
medición y capacidad de resolución. En gene- necesarios, no son suficientes para que la ca-
ral, la posibilidad de desarrollar metodológi- lidad aumente. Por ejemplo, la inexistencia de
camente el ciclo de mejora y las posibilidades esfigmomanómetro o la falta de fiabilidad del
de éxito de la evaluación son mayores con los mismo (problema estructural) imposibilitan u
problemas de tipo I (específicos y de proceso/ ocasionan un déficit en la calidad del diagnós-
resultado) que con los de tipo IV (genéricos y tico y seguimiento de pacientes hipertensos.
estructurales) pasando por los de tipo II (espe- Sin embargo, si se plantea como un problema
cíficos y estructurales) y tipo III (genéricos y de de calidad y éste se resuelve, hará posible una
proceso/resultado). atención adecuada, pero no hay ninguna ga-
rantía de que esto ocurra realmente. En el mis-
Problemas específicos mejor que genéricos mo sentido, un equipo perfectamente organi-
zado no es sinónimo de que los problemas de
La factibilidad y facilidad de Los problemas genéricos presentan, por su ten- salud se atiendan adecuadamente, sin embar-
análisis de los problemas dencia globalizadora, un gran atractivo para go, una mala organización puede ser la causa
específicos y de proceso/ resumir diversos servicios asistenciales en una de defectos en la atención sanitaria. No obstan-
resultado es en general sola evaluación. Sin embargo, precisamente te, un problema de organización que imposibi-
mayor que la de los por su tendencia globalizadora, su evaluación lita que un determinado proceso se pueda lle-
problemas genéricos y de puede reflejar espejismos. Cualquier problema var a la práctica es equiparable en importancia
estructura se complica y se difumina cuando se trata de a los problemas del proceso y/o resultado. Por
forma genérica. Por ejemplo la organización ejemplo, en un programa de búsqueda de ca-
del trabajo en equipo para los atendidos en el sos de riesgo cardiovascular elevado, un siste-
centro de salud o en un determinado servicio ma de recepción de pruebas complementarias
hospitalario es una oportunidad de mejora de en el que son frecuentes los extravíos dificulta-
tipo genérico en la que no se puede determinar rá la adecuada valoración diagnóstica de la po-
con precisión sobre qué aspecto hay que inci- blación incluida en el programa de prevención;
dir para mejorar ¿Sobre la cita a las consultas? aunque este problema estructural se haría tam-
¿El tiempo dedicado a cada consulta? ¿La visi- bién evidente pero como una de las causas de
ta a domicilio? ¿La coordinación con enferme- la mala calidad, si elegimos como oportunidad
ría para la atención a un tipo de paciente con- de mejora la valoración del riesgo cardiovas-
creto? Un problema potencialmente genérico cular en sí mismo. En resumen, si un proble-
como la organización del trabajo para atender ma estructural es relevante, es candidato a ser
a un tipo de paciente específico es más fácil de detectado como causa de alteraciones en el
comprender y de abordar que la organización proceso o resultado, mientras que la ausencia
del trabajo en general (problema genérico). Del de problemas estructurales no significa que el
mismo modo, los requisitos del registro de los proceso y resultado consiguientes no sean de-
datos relacionados con el control de un tipo es- fectuosos. A veces los problemas estructurales
pecífico de pacientes (problema específico) son específicos son buenos candidatos por su fácil
más evidentes y fáciles de admitir y concretar abordaje y solución. Pero normalmente no son
que la calidad del registro en la historia clínica los mejores. El análisis de problemas de pro-
en general (problema genérico). ceso o resultado es más exhaustivo y permite
• 46 •
determinar diferentes causas, entre las que se sus posibles limitaciones. Si los aplicamos ade-
encuentran los problemas estructurales subya- cuadamente, la oportunidad de mejora identi-
centes. ficada se corresponderá con las preferencias de
Ya tenemos claro que vamos a seleccionar los profesionales evaluados, lo que facilitará el
un problema u oportunidad de mejora que, compromiso de éstos con la resolución del pro-
por cuestión de factibilidad del ciclo de mejora blema.
completo, es conveniente que tenga una serie Los métodos que requieren datos, entre los
de características. Pero no hemos revisado aún que se encuentran el micromuestreo, la moni-
la metodología para identificar oportunidades torización de indicadores, el análisis de perfi-
de mejora para elegir. Esto es lo que vamos a les, y la participación del usuario, no siempre
ver a continuación. estarán inicialmente al alcance de cualquier
centro ya que precisan sistemas de informa-
5. Métodos de identificación ción específicos. Obviamente, serán más pre-
de oportunidades de mejora. cisos en la identificación de oportunidades de
Consideraciones generales mejora que los puramente cualitativos, ya que
cuantifican la dimensión del problema.
Hay muchos métodos y, en principio, cual- Vamos a ver con más detalle ambos tipos
quier método puede ser válido; al momento de de métodos, aunque enfatizando los métodos
utilizar uno u otro es conveniente ser flexibles sin datos porque son más versátiles, sencillos
y adaptarse a las posibilidades del contexto. y están al alcance de todo el mundo. El cuadro
Tampoco hay por qué utilizar sólo uno, no son 2.1 contiene una relación de los métodos que
excluyentes. Uno de los principales factores vamos a revisar, agrupados según precisen o
determinantes de nuestra elección del método no datos.
o métodos será el que dispongamos de datos
sobre los servicios que prestamos o no.
Si no disponemos de datos, la fuente de
información que nos permite apreciar si hay Cuadro 2.1
problemas de calidad será exclusivamente la Métodos de identificación y priorización de problemas
propia experiencia; el conocimiento que tenga- 1. Métodos que no requieren datos
1.1. Lluvia de ideas (brainstorming)
mos de la actividad de nuestros centros. Como 1.2. Técnica de grupo nominal
se puede suponer, la principal limitación de 1.3. Matriz decisional
estos métodos que no utilizan datos, entre los 1.4. Comparación por pares
que destacan la lluvia de ideas y la técnica del 1.5. Comunicación de incidencias
grupo nominal, radica en que su efectividad 2. Métodos que requieren datos
es directamente proporcional al grado en el 2.1. Micromuestreo
que conocemos de forma directa los servicios 2.2. Monitorización de indicadores
2.3. Análisis de perfiles estadísticos
que se quieren mejorar. Lo que implica la ne- 2.4. La participación del usuario
cesidad de que seamos proveedores de esos
servicios o que tengamos un contacto directo
con los mismos, para que estos métodos se
puedan utilizar con provecho. Por otra par-
te, cuando los utilizamos podemos sospechar 6. Métodos para la identificación de
la existencia de un problema de calidad pero, oportunidades de mejora que no
aunque es muy probable que éste exista, sólo precisan datos
será una oportunidad de mejora o un proble-
ma de calidad potencial, hipotético, del que no 6.1. La lluvia de ideas (brainstorming)
tendremos constancia de su magnitud ni de si
constituye en realidad un problema hasta que Vamos a emplear esta técnica principalmente
se cuantifique. Sin embargo, las ventajas de los cuando no tenemos mucha experiencia en la
métodos que no precisan datos sino el conoci- toma de decisiones en grupo y cuando el ob-
miento del contexto en que se dan, superan a jetivo es sacar a la luz una gran cantidad de
• 47 •
oportunidades de mejora. Sin embargo, hay pecialmente cuando se necesiten clarificar los
que considerar que el grado de conclusión de problemas planteados y redefinir aquellos que
los resultados será menor en relación a la técni- presenten puntos en común. Es difícil seleccio-
ca del grupo nominal y que habrá que comple- nar una oportunidad de mejora solamente con
tar el proceso de identificación de problemas la lluvia de ideas.
con alguna técnica de priorización como, por
ejemplo, la matriz decisional o la técnica del 6.2. Técnica de grupo nominal
grupo nominal. Además, los resultados pue-
den polarizarse, reflejando sobre todo los pro- Podemos aplicarla cuando el grupo no es muy
blemas aportados por aquellos miembros del heterogéneo y tiene un tamaño inferior a 10
grupo con mayor tendencia a la participación y personas. Con esta técnica normalmente con-
a la exteriorización de sus impresiones. seguiremos una gran validez en las decisiones
La lluvia de ideas favorece El principio básico para llevar a cabo esta realizadas a nivel grupal, a la vez que se favo-
la creatividad y la técnica consiste en evitar cualquier tipo de va- rece la resolución constructiva de los conflictos
identificación de una gran loración o crítica cuando los participantes ex- despersonalizando la confrontación entre los
cantidad de oportunidades ponen sus ideas. De esta manera, no se coac- desacuerdos.
de mejora, pero es difícil cionará la libertad de los participantes ni se Este método se basa en utilizar la reflexión
que sirva por sí sola para
dificultará un proceso creativo que puede ser individual para generar ideas y para su priori-
seleccionar una.
incompatible con un juicio crítico anticipado. zación. A lo largo de su desarrollo se procura
Podemos identificar cuatro normas de interés la participación paritaria de todos los compo-
en la ejecución de este método (cuadro 2.2). nentes del grupo para asegurar que se expre-
Tras la introducción, podemos empezar con sen también las posturas e ideas minoritarias,
la propuesta de una oportunidad de mejo- las cuales quedarían ocultas o no se llegarían a
ra, que en un principio pueda parecer banal, expresar en una discusión abierta. Su desarro-
con el fin de crear un ambiente distendido llo se realiza de una forma muy estructurada y
que promueva a la participación y favorezca requiere que se sigan las siguientes etapas:
el planteamiento del mayor número de ideas.
A partir de este momento, el encadenamiento 1. Generación de ideas de forma individual.
y la asociación de ideas son la base que faci- Después de plantear en forma de pregunta es-
lita una mayor creatividad. Cada participante crita, concreta y sin ambigüedades la cuestión
planteará un solo problema en cada interven- sobre la que hay que reflexionar (en nuestro
ción cuando lo considere oportuno y sin que se caso, las oportunidades de mejora existentes)
establezca un límite de intervenciones. Duran- los participantes escriben sus propuestas, de
te los episodios de silencio, el moderador pue- forma individual, sin que intercambien infor-
de aportar nuevas ideas o variaciones sobre el mación y sin que se realicen aclaraciones so-
tema. En ocasiones tendremos que completar bre el tema. Para mayor operatividad es con-
La técnica del grupo este método con otras técnicas de consenso, es- veniente limitar el número de propuestas por
nominal favorece la cada individuo, por ejemplo a tres o cinco.
participación paritaria
de todo el grupo en 2. Registro del listado individual de ideas. Para
la identificación de la Cuadro 2.2 ello solicitaremos a cada participante que de for-
oportunidad de mejora. Normas para el desarrollo de la lluvia de ideas. ma rotatoria exponga su listado de problemas
1. Exposición del objetivo de la reunión por parte del (oportunidades de mejora) por turno de inter-
moderador. vención para registrarlos en un listado común.
2. Repaso de las reglas del método: no criticar las ideas
propuestas.
3. Clarificación de ideas. Los problemas plan-
3. Planteamiento, por parte del animador, de un ejemplo
que puede parecer banal, pero que favorece un am- teados en el listado común se someten a una
biente distendido y la generación de ideas. discusión que tendrá como principal objetivo
4. Exposición, por cada participante, de una sola idea a la aclarar su significado, evitando duplicacio-
vez cuando considere oportuno y sin limitación en su nes y malentendidos. Posteriormente se pue-
número. de volver a elaborar el listado eliminando los
• 48 •
conceptos que se encuentren repetidos y con- 6.3. Otros métodos de selección de oportunidades
cretando o matizando aquellos que sean ambi- de mejora: notificación de incidentes,
guos o que no respondan completamente a la comparación por pares y matriz decisional o
cuestión planteada. parrilla de análisis de criterios múltiples
4. Priorización individual de las ideas (votación Hay otros métodos, enfocados sobre todo a la
preliminar). Durante esta fase se valoran de for- priorización, que establecen unos criterios de
ma individual e independiente (sin discusión valoración para evaluar la relevancia del pro-
de grupo) las oportunidades de mejora del lis- blema. Para definir estos criterios las indica-
tado definitivo, otorgándoles una puntuación ciones de la Joint Commission on Accreditation of
según se consideren más o menos relevantes. Health Care Organizations (JCAHO) pueden ser
De esta manera se evitarán las presiones de los orientativas en el sentido de seleccionar proce-
compañeros, y se garantizará que la toma de sos que sean conjunta o separadamente muy
decisiones refleje lo que opinan todos los par- frecuentes, de alto riesgo para los usuarios o
ticipantes. Obtendremos la decisión del grupo con tendencia reconocida a ser problemáticos.
calculando el promedio de las priorizaciones Además se pueden añadir la dependencia in-
individuales. La puntuación es el método de terna de la solución y el coste de la misma. Cada
priorización más simple y el que se emplea ha- centro determinará la adopción, adaptación o
bitualmente en el grupo nominal (por ejemplo incorporación de estos u otros criterios de prio-
de 0 a 5 puntos para cada problema, repartien- rización, así como su grado de relevancia.
do un número de votos fijo entre todos ellos, o Los criterios que decidamos para valorar
de cualquier otra forma que acuerde el grupo). la oportunidad de mejora los podemos aplicar
Sin embargo, en este paso pueden utilizarse de forma implícita o bien explícita, como por
también otros métodos complementarios como ejemplo en la comparación por pares y en la La técnica del grupo
la matriz decisional que veremos más adelante. matriz decisional respectivamente. Esta última nominal es muy
normaliza las valoraciones realizadas por los estructurada y se realiza
5. Discusión del voto preliminar. Cada parti- diversos participantes en el proceso de prio- siguiendo una serie de
cipante expresa su votación y se suman todas rización, a diferencia de lo que ocurre con la pasos determinados.
ellas para obtener la priorización del grupo. comparación por pares que al ser implícita es
La decisión del grupo puede someterse a una más subjetiva. Ambos métodos los revisare-
nueva valoración en la que se intenta discutir mos más a detalle a continuación.
las votaciones obtenidas. Se consideran espe- Otro método sencillo y de utilidad, sobre
cialmente los apartados con patrones de vota- todo cuando ya tenemos una estructura orga-
ción heterogéneos, o puntuaciones extremas nizativa para las actividades de gestión de la
(muy elevadas o muy bajas). En estos casos es calidad, es el establecimiento de un sistema de
importante que se descarte la existencia de fac- recogida de incidencias o problemas (problem
tores artificiales, como por ejemplo la informa- report) identificados por los profesionales
ción insuficiente o parcial, así como interpreta- del centro. Estos problemas son considerados
ciones incorrectas sobre la cuestión planteada. como posibles oportunidades de mejora.
Si se ve oportuno, tras esta discusión puede
procederse a la votación final. 6.4. La comparación por pares
6. Voto final. Con esta etapa se finaliza el pro- Con este método el proceso de valoración se
ceso de toma de decisiones procediéndose de realiza concentrándose en dos problemas como
forma análoga a la 4ª etapa. El problema u máximo de forma simultánea, comparando un
oportunidad de mejora más votado será el ele- problema con el otro y eligiendo aquel que se
gido por el grupo para su evaluación y mejora. considere más importante. No es imprescindi-
ble, por tanto, que se apliquen criterios explíci-
El anexo 2.2 contiene instrucciones que pueden tos de valoración. Podemos distinguir en su de-
servir de guía para la realización de la técnica sarrollo las siguientes etapas (el esquema final
del grupo nominal puede verse en la figura 2.2): (i) elaboración de
• 49 •
Problema A B C D
D D D C 2
C C C 3 (Resultado C=3; D=2; A=1; B=0)
B A 0
A 1
A= utilización de antibióticos
B= calidad del registro de la historia clínica
C= control del paciente hiperlipémico
D= tratamiento de la infección respiratoria de vías altas
Figura 2.2. Priorización de problemas de calidad mediante el método de comparación por pares
una tabla en la que se detallan como cabeza de blemas identificados y en la primera fila los
las filas y las columnas todos los problemas a criterios de valoración (figura 2.3). Los proble-
considerar; (ii) confrontación de todas las pare- mas de calidad se valoran de forma separada
jas posibles, combinando los problemas de dos concediéndoles una puntuación en cada uno
en dos, al cruzar filas y columnas; (iii) selec- de los criterios para contabilizar posteriormen-
ción, dentro de cada pareja, del problema más te el total de puntos obtenidos. El nivel de prio-
importante. Ese problema se anota en la celda rización se establece ordenando los problemas
correspondiente al cruce donde se encuentra la de calidad según la puntuación obtenida.
pareja comparada. Cada pareja se compara sólo En el segundo caso, previa jerarquización
una vez; (iv) cómputo final, contabilizando el o priorización de los criterios decisionales, se
número de veces en los que ha sido elegido diseña un gráfico de forma arborescente en el
La comparación por pares
cada problema durante la fase anterior; y (v) que los criterios de valoración se representan
prioriza con criterios
implícitos, subjetivos. priorización de los problemas clasificándolos como nódulos sucesivos y su valoración posi-
en orden decreciente a la puntuación obtenida. tiva o negativa se representa como un segmen-
La figura 2.2 esquematiza este proceder apli- to superior o inferior respectivamente, que se
cándolo a la priorización de cuatro problemas. inicia en ese nódulo y conecta con el siguiente
(figura 2.4). El criterio más importante se sitúa
6.5. Matriz decisional de criterios múltiples o en el primer nódulo, continuándose con los de-
parrilla de análisis más criterios en función del orden decreciente
de importancia. Cuando se valora un problema
Esta herramienta tiene dos modalidades de se sigue el recorrido determinado por la valo-
aplicación en función de que los criterios em- ración positiva o negativa de los criterios y una
pleados se consideren igual de importantes o vez que se llega al último se señala su nivel de
bien se jerarquicen. prioridad.
En el primer caso la parrilla de análisis La matriz decisional puede utilizarse como
adopta una forma matricial en la que se inclu- método de priorización individual en el paso 4
yen en la primera columna los distintos pro- de la técnica de grupo nominal.
• 50 •
Criterios de decisión (máximo=5; mínimo=1)
Problema ¿Afecta a muchos ¿Supone un riesgo ¿Dependencia interna ¿Es una solución Total
pacientes? grave para la salud? de la posible solución? barata?
A ++ ++ +++ ++++ 11
B ++ + +++ ++++ 10
C ++ +++++ +++ ++++ 14
D +++++ + +++ ++++ 12
A= uso no racional de antibióticos

B= calidad del registro de la historia clínica
C= control del paciente hiperlipémico
D= tratamiento de la infección respiratoria de vías altas
Figura 2.3. Parrilla de decisión mediante criterios univalentes
C3.
¿Afecta a muchos
C2. pacientes? 1°
¿Supone un
riesgo grave?
C1. 2°
¿Dependencia 3°
interna de
la solución?
4°
5°
6°
7°
8°
Figura 2.4. Parrilla de análisis aplicando criterios jerarquizados en orden de importancia (C1>C2>C3) (la línea continua
corresponde a la valoración positiva del criterio)
La combinación de lluvia de ideas, grupo zar la identificación y priorización de oportuni-

nominal y matriz decisional sin jerarquización dades de mejora, contando exclusivamente con
de criterios (figura 2.3) es probablemente una el conocimiento que se tiene del entorno de tra-
de las más frecuentes y mejores bases para reali- bajo en el que se prestan los servicios a evaluar.
• 51 •
7. Métodos para la identificación de ser más restrictivo que los métodos que no pre-
oportunidades de mejora mediante datos cisan datos.
El uso de este tipo de métodos está condicio- 7.3. Análisis de perfiles estadísticos
nado por la disponibilidad de fuentes de infor-
mación que suministren los datos necesarios Cuando la medición de un indicador se realiza
para aplicarlos. La posibilidad de identificar entre distintos proveedores (facultativos, cen-
oportunidades de mejora puede ser más am- tros sanitarios, etc.), los resultados se pueden
plia con el micromuestreo y los métodos de representar mediante un gráfico de barras.
participación del usuario mientras que la mo- Cada barra refleja el nivel alcanzado por cada
nitorización y el análisis de perfiles se suelen uno de los proveedores en la medición del in-
circunscribir a aspectos asistenciales concretos dicador (figura 2.5). Una amplia variabilidad
y previamente seleccionados. en la distribución de los perfiles sugiere la exis-
tencia de un problema de calidad en alguna o
7.1. Micromuestreo de registros varias áreas asistenciales que se encuentran re-
lacionadas con el indicador valorado, especial-
Este método requiere que se registren los datos mente en aquellos proveedores que se encuen-
de la actividad asistencial. Cuando dispone- tran alejados en más de una o dos desviaciones
mos de estos registros (historias clínicas, do- estándar en relación a la media. Este método
cumentos de derivación, prescripciones) pode- se ha empleado con frecuencia para identificar
mos hacer una revisión rápida de una pequeña posibles oportunidades de mejora en la pres-
parte de los mismos (por ejemplo 15 o 20) para cripción de medicamentos, estancia media
detectar áreas potencialmente problemáticas. para la misma patología y utilización de re-
Para aumentar la validez de este método se cursos en general. En el campo de la prescrip-
suele revisar cada registro por dos profesiona- ción, se han utilizado indicadores, entre otros
les con experiencia en la materia. Estos valoran recursos, como la proporción de medicamen-
si a su juicio existe alguna actuación incorrec- tos de utilidad terapéutica baja, la proporción
ta en la atención proporcionada al paciente, de antibióticos recetados en atención primaria
comparando y resumiendo posteriormente sus pertenecientes al grupo de las quinolonas o
anotaciones, a partir de las cuales se puede las cefalosporinas, etc. Obviamente, precisa de
elaborar un listado de problemas. Pueden bus- una priorización previa de los aspectos a me-
carse problemas genéricos (de antecedentes, dir. La figura 2.5 es un ejemplo de análisis de
prevención, utilización de analítica, etc.) o es- perfiles. Una variante es la representación de
pecíficos, si hacemos el muestreo sobre un tipo las medias y los percentiles, o la estimación con
concreto de pacientes. sus intervalos de confianza.
7.2. Monitorización de indicadores 7.4. La participación del usuario en la

identificación de problemas
Los sistemas de monitorización de la calidad
tienen como objetivo principal identificar pro- El paciente, usuario del servicio y población
blemas de calidad. Por tanto, si tenemos un en general son el destinatario final de la aten-
sistema de medición periódica de indicadores ción sanitaria. Su papel en la identificación de
sobre aspectos asistenciales concretos (tiempos problemas de calidad es esencial en aquellos
de espera, control del paciente diabético, del aspectos que están relacionados con el incum-
paciente con cervicalgia, infarto agudo de mio- plimiento de sus expectativas, a la vez que
cardio, etc.) podemos identificar problemas constituye una fuente de información adicio-
relacionados con ese área asistencial. Cuanto nal para identificar oportunidades de mejora
más amplio sea el listado de indicadores uti- de procesos asistenciales que no se registran
lizado, mayor será el espectro de problemas y habitualmente. Su implicación en la identifica-
servicios sobre los que será posible identificar ción de oportunidades de mejora por parte de
la existencia de problemas, pero siempre va a los centros asistenciales se puede articular me-
• 52 •
C.S.A
C.S.B
C.S.C
C.S.D
C.S.E
C.S.F
C.S.G
C.S.H
C.S.I
C.S.J
C.S.K
0 0.1 0.2 0.3 0.4 0.5
Figura 2.5. Análisis de perfiles estadísticos

Ejemplo: Proporción de quinolonas y cefalosporinas en relación al total de antibióticos recetados en 11 centros de
salud. El área sombreada incluye a la media ± una desviación estándar
diante el análisis de las quejas y reclamaciones, ficar problemas relacionados con los aspectos
las encuestas de satisfacción, calidad percibida que más valora el usuario, y pueden ser la
y los informes del usuario. Todas ellas precisan punta del iceberg de problemas que debemos
de una infraestructura previa para su realiza- solucionar.
ción y aprovechamiento. Resumimos aquí lo
fundamental de estas herramientas como mé- 7.6. Encuestas de satisfacción y calidad
todos de identificación de problemas. percibida
El micromuestreo y la
7.5. Análisis de quejas y reclamaciones Con las encuestas de satisfacción y calidad participación del usuario
percibida podemos identificar problemas simi- pueden identificar una gran
Las ventanillas o los libros de recepción de lares a los señalados en el análisis de quejas y variedad de oportunidades
de mejora, pero la
quejas y reclamaciones son un medio clásico reclamaciones (no cumplimiento de las expec-
monitorización y el análisis
de identificación de problemas, aunque con tativas del usuario). Pero las ventajas sobre este de perfiles se focalizan en
frecuencia se haya desvirtuado su naturaleza, último radican en que: (i) si la encuesta es me- aspectos asistenciales.
considerándolos principalmente como un sis- todológicamente correcta, identifica una ma-
tema que es obligatorio tener y eventualmente yor cantidad de problemas (relacionándolos
punitivo. El número de reclamaciones recibi- directamente con la satisfacción) y (ii) refleja los
das en un centro sanitario puede ser un reflejo puntos de vista de una muestra representativa
de su calidad y de las facilidades prestadas al de pacientes, de manera que se evita el sesgo
usuario para participar en la identificación de de incluir sólo la opinión de los pacientes que
problemas. En ocasiones tendremos que valo- expresan su insatisfacción a iniciativa propia.
rarlas con precaución ya que pueden respon- En definitiva, las encuestas de satisfacción y
der a una interpretación errónea y no señalar calidad percibida son en general una fuente de
en realidad un problema de calidad, pero en información más adecuada para sacar a la luz
general nos van a ser de utilidad para identi- problemas relacionados con el trato recibido, el
• 53 •
contexto en el que se desarrolla la asistencia y 9. El cartel narrativo: un apoyo para la

también problemas de tipo organizacional. realización y el seguimiento del ciclo de
mejora
7.7. El informe del usuario
El story board o cartel narrativo del proyecto
De forma complementaria a las encuestas de de mejora es una representación paso a paso
satisfacción y calidad percibida, e incluso de del ciclo de mejora. Aunque puede empezar
los registros clínicos en algunos de sus aspec- a utilizarse a cualquier altura dentro del ciclo
tos, se puede preguntar al propio usuario sobre de mejora, lo más lógico es establecerlo una
aspectos de la asistencia recibida que él conoce vez decidido el problema a evaluar y mejorar
(¿Le informaron cuántas veces al día tenía que o, como mínimo, una vez decidida la inter-
tomar esa medicación?, ¿Cuándo le tomaron la vención para mejorar. Los elementos del car-
tensión arterial por última vez? Durante su es- tel completo se pueden ver en la figura 2.6. Al
tancia en el hospital, ¿le prestaron ayuda para principio estarán los espacios en blanco y se
su aseo siempre que la necesitó?). La princi- irán ilustrando y llenando a medida que vaya
pal ventaja de este método consiste en revelar avanzando el proyecto. Para cada paso del ci-
áreas-problema de aspectos asistenciales que clo de mejora se va informando de las activi-
habitualmente no se registran, pudiendo ser, dades clave y sus herramientas utilizadas. El
en ocasiones, un método incluso más eficiente que esté todo ello expuesto en un lugar visible
de recopilación de datos en la identificación de fomenta la responsabilidad y compromiso del
problemas que la revisión de registros. grupo de mejora encargado del proyecto, a la
vez que hace posible y fácil recibir comentarios
8. Inicio práctico del ciclo de mejora y sugerencias de otros profesionales del centro.
Los carteles narrativos
Esta herramienta de ayuda a la implemen-
fomentan la transparencia
Hemos revisado una serie de métodos para tación de los proyectos se originó de forma
de las actividades de
mejora de la calidad, el
poder identificar y priorizar oportunidades de casi casual en la industria (concretamente la
compromiso de los grupos mejora, tanto si tenemos como si no tenemos popularizó Florida Power and Light, la primera
de mejora datos; y hemos señalado los métodos sin datos compañía americana que ganó el Premio De-
como los más sencillos y de aplicación univer- ming), pero se ha extendido a todos los sec-
sal. Con este bagaje estaríamos en condiciones tores, incluido el sanitario, por su sencillez y
de elegir la oportunidad de mejora utilizan- utilidad, fomentando la trasparencia de las ac-
do el método más conveniente. En principio tividades de mejora de la calidad y, como ya
podríamos sondear en el conjunto global de hemos apuntado, el compromiso de los grupos
la atención prestada y evaluar aquel servicio de mejora implicados. Adicionalmente, es una
que pareciera prioritario. Sin embargo, es con- herramienta total y absolutamente compatible
veniente conocer en la práctica cómo pueden con todas las demás; de hecho, cualquier méto-
funcionar algunas de las herramientas que he- do que se utilice en cualquiera de los pasos del
mos visto en este capítulo. Vamos a seleccionar ciclo de mejora puede y debe verse reflejado
dos: la técnica de grupo nominal y la matriz en el cartel, que tiene así, además, una función
decisional de criterios múltiples. Animamos educativa para todo el personal del centro.
por tanto a realizar un ejercicio práctico sobre Se incluyen como anexo 2.1 las instruccio-
identificación de problemas para mejorar. Si se nes para su elaboración, adaptadas para uso
va a realizar en grupo, se aconseja utilizar la en países latinoamericanos por el proyecto de
técnica de grupo nominal, usando puntuación Garantía de Calidad (QA Project) que se realizó
simple para la priorización o bien la matriz de- con fondos de la AID (Agency for International
cisional; si el trabajo es individual, puede utili- Development) norteamericana, y gestionado
zarse la matriz decisional directamente. por la URC (University Research Corporation).
• 54 •
Narración de EMC
Definición del problema Equipo Foto Cronograma
Mes
1 2 3 4 5 6 7 8
1
2
3
Nombres:
Actividad
4
5
6
7
8
Roles:
Análisis del problema Criterio Núm. incumplimientos % frecuencia

(frecuencia absoluta) (relativa)
Frecuencia
acumulada
Lista de criterios
1. Diagnóstico correcto 5. Consumo de alcohol 54 15.8 15.8
12. Fondo de ojo 51 14.9 30.7
2. Antecedentes familiares 11. Edemas 45 13.2 43.9
3. Antecedentes personales 4. Consumo de tabaco 42 12.3 56.1
8. Exploración abdominal 36 10.5 66.7
4. Consumo de tabaco 9. Pulsos periféricos 30 8.8 75.4
5. Consumo de alcohol 10. Soplos carotideos 27 7.9 83.3
Listado de chequeo 1. Diagnóstico correcto 15 4.4 87.7
6. Peso y talla y/o IMC
Cuestionario sí/no 7. Auscultación cardiaca 15 4.4 92.1
7. Auscultación cardiaca 2. Antecedentes familiares 12 3.5 95.6
1. xxxxxxxxxxxxxxx
1. xxxxxxxx? ABC 6. Peso y talla y/o IMC 9 2.6 98.2
8. Exploración abdominal
Diagrama de causa y efecto 2. xxxxxxxxxxxxxxx
2. xxxxxxxx? ABC
3. Antecedentes personales 6 1.8 100.0
9. Pulsos periféricos 342 100
3. xxxxxxxxxxxxxxx
3. xxxxxxxx? ABC
10. Soplos carotideos
4. xxxxxxxxxxxxxxx
4. xxxxxxxx? A B C
11. Edemas
Incumplimientos (%)
5. xxxxxxxxxxxxxxx
5. xxxxxxxx? A B C 100
12. Fondo de ojo
Cumplimientos (%)
Criterios Instrumentos
50
Flujograma
0
3. 6. 2. 1. 7. 10. 9. 8. 4. 11. 12. 5. 5. 11. 8. 10. 7. 6.
Gráfica de tendencia Criterios Criterios
Presentación y análisis de datos
Resultados
12.
1.
2. Antes Después Manteniendo
Causas principales Solución 11. 3.
lo alcanzado
%___ %___ %___

10. 4.
1. %___ %___ %___

9. 5.
1a evaluación 2a evaluación
100 342
Fecha Fecha Fecha
2. 8.
7.
6.
Mejora
222 100 ____ ____ ____
5. 11. 8. 10. 7. 6. 12. 11. 5. 8. 9. 4 10 7 6 2 1 3

Criterios Criterios
Análisis gráfico
Figura 2.6. Cartel narrativo de un ciclo de mejora C
• 55 •
BIBLIOGRAFÍA
• Delbecq AL, Van de Ven AH, Gustafson DH. Técnicas grupales para la planeación. México DF: Trillas, 1984.
• Palmer RH. Evaluación de la asistencia ambulatoria: principios y práctica. Madrid: Ministerio de Sanidad y Consumo, 1990. Cap 7.
• Pineault R, Daveluy C. La planificación sanitaria: Conceptos, métodos, estrategias. Barcelona, Masson, 1987. Cap. 3.
• Sannazaro PJ, Mills DH. A critique of the use of generic screening in quality assessment. JAMA 1991; 265:1977-1981.
• Saturno PJ. Los métodos de participación del usuario en la evaluación y mejora de la calidad de los servicios sanitarios. Rev Esp
Salud Publica 1995; 69:163-175.
• Saturno PJ. Monitorización del uso de medicamentos para mejorar la calidad de la prescripción: problemas, métodos e indica-
dores. Aten Primaria 1996; 18(6):331-338.
• 56 •
Anexo 2.1
Instrucciones para la elaboración de un cartel narrativo de un ciclo de mejora
Cartel narrativo de evaluación y mejora de la calidad (1)
Enunciado del problema

l Describir la oportunidad que existe de mejorar en términos de sus consecuencias. El enunciado del problema debe definir
con claridad la diferencia entre la situación deseada y la existente.
l No debe hacer ninguna referencia a la causa del problema; no debe culpar a otros, ni debe expresarse como una solución.
Deberá ser evidente dónde comienza y termina el problema, de manera que se marque la diferencia respecto de otros
problemas del sistema en general.
l Si se desea, también puede describirse el método o los métodos utilizados para seleccionar un problema o campo para
mejorar.
El equipo de EMC (evaluación y mejora de la calidad)

l Identificar a todos los integrantes del equipo, sus funciones en las organizaciones y las funciones que cumplirán en el
esfuerzo de mejora de la calidad. Si es posible se puede incluir una fotografía del equipo. También se puede incluir un
cronograma general que enumere todas las actividades principales y cuándo se espera iniciarlas y terminarlas. No es
necesario seguir exactamente lo que indique el cronograma general, dado que sólo proporciona una guía general para
los miembros del equipo.
Análisis del problema

l El análisis del problema debe documentar los esfuerzos realizados por el equipo para determinar cuáles son las causas
de fondo del problema. No es necesario incluir todos los elementos que se enumeran a continuación, pero debe
mencionarse la causa o las causas de fondo del problema, las que constituirán el punto central de las actividades de
mejora.
Diagrama de flujo
l Sirve para mostrar el proceso que existe actualmente e indicar cuáles son los límites del esfuerzo para mejorar la calidad.
Indicar los impedimentos o los puntos problemáticos con una flecha. Trazar un círculo alrededor de los campos en los que
será necesario recopilar datos.
Diagrama de causa y efecto

l Mostrar el análisis de las causas y efectos utilizando un diagrama de causa y efecto. Marcar aquellas causas sobre las que
deben recogerse datos.
l Recordar que se trata de causas hipotéticas hasta que estén fundamentadas con datos.
(1)
Batalden P, Gillen T: “Hospitalwilde Quality Improvement Storytelling”, Quality Resource Group, Hospital Corporation of America, Nashville, Noviembre de 1989.
Continúa/...
• 57 •
.../continuación.
Indicadores o criterios principales

l Criterios o indicadores que cuantifican la diferencia entre el desempeño real y el deseado, así como los que determinen la
frecuencia de las causas posibles que se marcaron antes, en caso de que sea un estudio de causas hipotéticas.
Instrumentos para la recolección de datos

l Incluir los instrumentos para la recolección de datos que se desarrollaron para medir los indicadores anteriores.
Exhibición de los datos

l Presentar los resultados en cuadros adecuados, incluyendo la representación gráfica (histogramas, diagramas de barras o
diagramas “Pareto”).
Identificar causas de fondo

l Basándose en el análisis, el equipo debe indicar qué causa o causas quisieran abordar a fin de solucionar el problema y
mejorar la calidad. Es importante acordarse de concentrarse en las “pocas causas fundamentales” del problema que los
datos hayan revelado.
Formular una solución

l Formular una descripción clara y sencilla de las mejoras propuestas para el proceso. Resumir los pasos clave del plan para
poner en ejecución la solución. Describir los métodos utilizados para diseñar y seleccionar una solución (opcional).
Resultados
l Mostrar los datos que demuestran los adelantos logrados en términos de mejoras en el proceso y los resultados deseados.
Se pueden utilizar los mismos indicadores que se utilizaron para analizar el problema o un subconjunto de los mismos.
Los resultados deben demostrar que la discrepancia demostrada en el enunciado del problema se ha reducido, logrando
que el desempeño real se parezca más al desempeño deseado.
l Es conveniente que los resultados se midan nuevamente después de 6 meses o un año para asegurar que las mejoras se
mantienen. Si se ha producido el problema nuevamente, el equipo debe estudiar la situación para comprender el motivo
y se deben tomar otras medidas correctoras.
• 58 •
Anexo 2.2
Instrucciones para la realización de la técnica de grupo nominal
PREGUNTA: ¿Cuáles son las ( ) oportunidades de mejora más importantes en tu ámbito de trabajo?
1. Generación de ideas
l Cada participante anota sus respuestas de forma individual y sin comentario alguno.
2. Enunciado de ideas
l Cada participante enuncia su primera opción y se efectúan tantas rondas como sean precisas hasta agotar las ideas
anotadas.
l Todas las ideas deben recogerse en una pizarra o similar.
l Las ideas sólo se enuncian no permitiéndose aclarar, opinar o discutir sobre su contenido.
l Si durante esta fase se generan nuevas ideas, también se apuntarán.
3. Clarificación
l Se trata que los participantes asignen el mismo significado a los enunciados. Para ello, cada participante explicará
a los demás el significado del enunciado que expuso. No se deberá opinar o discutir sobre el contenido de los
enunciados.
4. Primera votación
l Se hace de forma individual y secreta, puntuando, en orden decreciente según su importancia.
l Después se recogen las puntuaciones y se anotan juntos a las opciones elegidas.
5. Discusión
l Se procede a discutir sobre los resultados obtenidos en la fase anterior, justificando y criticando los mismos de forma
libre y ordenada. Se establecen los turnos de palabra fomentando la participación de todos los componentes del
grupo.
6. Rondas de votación-discusión
l Se procede a sucesivas rondas hasta obtener las oportunidades de mejora prioritarias.
7. Informe del resultado
• 59 •
Capítulo 3
Métodos de análisis
de los problemas de calidad
1. Introducción
2. ¿Por qué se realiza el análisis del problema de calidad

u oportunidad de mejora?
3. Métodos de análisis de problemas
4. Análisis de problemas con métodos que no requieren datos
5. Herramientas de análisis que requieren datos sobre el problema

2 Identificación
Monitorización
Análisis del problema Capítulo 3 3

Capítulo
Elaboración
medir calidad


Capítulo 8 Diseño
de intervención



Contenido general
Una vez delimitado el problema de calidad u oportunidad de mejora por evaluar (capítulo 2),
este capítulo desarrolla la metodología para analizarlo con datos y sin ellos, y sienta las bases
para las acciones o pasos siguientes. Se revisan diversos métodos útiles para analizar proble-
mas de calidad y se explica en detalle y con ejemplos prácticos el uso para estos fines del
diagrama de Pareto, histograma, flujograma y diagrama de causa-efecto. Estos últimos son
los más útiles y utilizados para analizar problemas de forma grupal y cualitativa, por lo que se
recomienda ponerlos en práctica frente a algún problema del entorno del propio lector.
1. Describir los objetivos que se persiguen al analizar los problemas de calidad con cualquiera
de los métodos de análisis que se utilice.
2. Identificar los principales tipos de problemas o situaciones para los que está indicado cada
uno de los métodos.
3. Especificar las condiciones de aplicación de los métodos de análisis sin datos.
4. Especificar las limitaciones en la interpretación de los resultados de los análisis de problemas
sin datos.
5. Definir el significado y distinguir los símbolos utilizados en un flujograma.
6. Analizar estructuradamente un flujograma.
7. Realizar un diagrama de causa-efecto para analizar problemas de calidad.
8. Analizar los resultados de un diagrama de causa-efecto.
9. Distinguir entre los tres principales tipos de causas que pueden ser identificadas al analizar
los problemas de calidad.
10. Formular diversos cursos de acción sobre la base del análisis efectuado.
11. Decidir el curso o cursos de acción consiguientes, según los resultados del análisis efectuado.
12. Tener en cuenta las implicaciones metodológicas y los riesgos de los diversos cursos de
acción.
Métodos de análisis Capítulo
de los problemas de calidad 3
“No podemos considerar nada verdad si no reconocemos claramente que lo es. Para conseguir
esto, puede que sea necesario dividir un problema complejo en cuantas partes parciales sea
posible. Entonces se puede empezar por las ideas más sencillas”. Descartes
1. Introducción en conjunto y sin un conocimiento explícito y En este capítulo se sientan

visualizado de sus implicaciones. Normalmen- las bases para el camino
En el capítulo anterior habremos identificado te conviene que lo examinemos y lo dividamos que habremos de seguir
una oportunidad de mejora. Ahora veremos en aspectos (subproblemas o causas) que sean en la continuación del
que hay varias metodologías de utilidad para lo suficientemente manejables para determi- ciclo de mejora, tras haber
analizar las oportunidades identificadas, in- nar, en cada una de ellas, el tipo de contribu- identificado qué se quiere
mejorar.
cluso sin tener datos. Un análisis correcto nos ción al problema analizado y el curso de acción
aclara el camino que habremos de seguir. Para consiguiente que conviene emprender. En con-
decidir sobre las alternativas de acción que secuencia, vamos a realizar el análisis estructu-
conduzcan a la mejora del probable problema rado de la oportunidad de mejora para conse-
de calidad identificado, debemos reflexionar guir los siguientes objetivos: dimensionar el
acerca del grado de conocimiento que tene- problema; identificar las causas; clasificarlas y
mos sobre el mismo (¿cómo es de importante? priorizarlas, y decidir cómo continuar en el ca-
¿cómo se puede corregir?) y realizar un aná- mino hacia la mejora.
lisis estructurado para identificar los facto-
res implicados en él. Sobre esta base vamos a Dimensionar el problema. ¿Constituye la oportu-
decidir qué hacer. En los capítulos siguientes nidad de mejora un problema de calidad real?,
avanzaremos por uno de los posibles cursos de ¿qué magnitud tiene el problema? La respues-
acción, hasta completar el ciclo de mejora. ta es más fácil si los métodos empleados en
la identificación de la oportunidad de mejora
2. ¿Por qué se realiza el análisis del han sido de tipo cuantitativo, como la moni-
problema de calidad u oportunidad de torización, el análisis de perfiles o el informe
mejora? del usuario, o bien si ya disponemos de datos
relacionados con ese tema. Sin embargo, con el
Una vez que hemos identificado la oportuni- resto de los métodos intuimos una divergencia
dad de mejora, debemos preguntarnos de qué entre lo que se observa y lo que es razonable
forma puede abordarse para conseguir su re- que exista (se ha sospechado un problema de
solución. Sin embargo, es probable –de hecho calidad) pero no se ha objetivado todavía. En
es lo más frecuente– que en este segundo paso estos casos la reflexión sobre sus posibles cau-
del ciclo de mejora tengamos un conocimiento sas y la frecuencia con la que se dan éstas pue-
El análisis del problema
insuficiente del problema y no estemos prepa- de confirmarnos intuitivamente la importancia
de calidad u oportunidad
rados para pasar al planteamiento de solucio- del problema. Sin embargo, el dimensionado de mejora se realiza para
nes. Para ello, requerimos indagar sobre sus real no se conocerá (a menos que tengamos ya dimensionar el problema,
causas e incluso cuantificar hasta qué punto cuantificadas las causas), hasta que no se mida. reflexionar sobre sus
existe o no el problema. No es fácil cuantificar causas y decidir qué hacer a
el problema ni identificar las medidas de inter- Identificar las causas. Consiste en descomponer continuación en el camino
vención cuando éste se aprecia como un todo, el problema en unidades elementales que sean hacia la mejora.
• 65 •
susceptibles de medición y que a la vez se pue- Todos estos objetivos pueden lograrse utilizan-
dan traducir en medidas operativas que faci- do métodos muy diversos, cuya aplicabilidad
liten la resolución del problema. Por ejemplo, depende del tipo de problema y de la existen-
la existencia de hojas sin numerar puede ser cia o inexistencia de datos sobre el mismo.
una de las causas de que no se pueda revisar
la historia clínica de los pacientes atendidos 3. Métodos de análisis de problemas
(que a su vez puede contribuir como causa al
problema de calidad que estamos analizando). A continuación, vamos a revisar los métodos
Además de ser medible, se puede convertir en que en general son de más utilidad, clasifica-
una medida correctora, anulando, contrarres- dos según precisen o no de la existencia previa
tando o modificando la propia causa, que en de datos.
este caso sería simplemente la numeración de No hay reglas fijas para elegir un método
las hojas de la historia clínica. de análisis determinado. Lo importante es que
el método o métodos elegidos se adapten al
Clasificación y priorización de las causas. Con el problema y permitan alcanzar los objetivos del
análisis estructurado, es posible identificar las análisis. La única limitación radica en la dispo-
principales subáreas problema (componentes nibilidad o carencia de datos que cuantifiquen
principales del problema) y las causas del pro- las subáreas o las causas del problema. En el
blema (componentes medibles y operativos cuadro 3.1 se resumen los métodos que vamos
para la intervención) a la vez que priorizar el a revisar.
orden de intervención para su corrección o es- Cuando no tenemos datos, podemos anali-
tudio, según su importancia y el grado de co- zar básicamente el problema con tres tipos de
nocimiento que tengamos sobre su frecuencia. herramientas: el flujograma, el diagrama de
causa-efecto y el análisis de campos de fuerza
Decidir cómo continuar. Éste es el principal ob- (ver algoritmo representado en la figura 3.1).
jetivo del análisis del problema u oportunidad El flujograma nos será de gran utilidad en
de mejora. Como veremos más adelante, lo más problemas relacionados con procesos que tie-
probable es que nos encontremos con diversos nen numerosas actividades secuenciadas en el
tipos de causas frente a las cuales la acción más tiempo, como en el caso de los problemas de
oportuna es también diferente. Resumidamen- tipo organizacional, circuitos, coordinación de
te, habrá tres tipos de causas: a) causas sobre profesionales y niveles, entre otros (por ejem-
las que no podremos actuar fácilmente, típi- plo, la cita programada, la organización de
camente causas estructurales en relación con médicos con enfermeros en el seguimiento de
la adquisición de recursos; b) causas sobre las pacientes, el circuito de obtención de pruebas
que será posible la intervención directa, por- complementarias desde que se solicitan hasta
que sabemos que influyen en el problema de
calidad analizado y sabemos su grado de pre-
sencia en nuestro centro: también suelen ser
causas estructurales y organizacionales pero
Cuadro 3.1
a nuestro alcance; por ejemplo, la inexistencia Herramientas de análisis de la oportunidad de mejora
de protocolización, la falta de numeración de
las páginas en la historia, circuitos innecesaria- 1. Sin datos
mente complicados o redundantes, etcétera, y 1.1. Diagrama de flujo
c) causas que tendrán que ser investigadas y 1.2. Diagrama de causa-efecto
cuantificadas. Si resumimos aún más, los dos 1.3. Análisis de campos de fuerza
cursos de acción a los que nos va a guiar el aná- 2. Con datos
lisis del problema son la intervención directa 2.1. Histograma
2.2. Estratificación
y el diseño de estudios para un conocimiento 2.3. Gráfico de Pareto
cuantificado de las causas sobre el que basar la 2.4. Gráfico de control
intervención.
• 66 •
Métodos de análisis de los problemas de calidad
Identificación
de una oportunidad
de mejora
Analizarlos:
Sí - Histograma
¿Tenemos datos? - Estratificación
- Diagrama de pareto
- Gráficos de control
No
Análisis sin datos:

- Campos de fuerza No Sí Diseño
¿Es obvia la solución? de intervención
- Flujograma
- Diagrama de causa-efecto
Sí
Clasificar causas ¿Intervención directa?
Sí
No
Sí Diseño de estudio
¿Modificables? ¿Influencia conocida? del nivel de calidad
No
No
Diseño de estudio
Stop
de causas
Figura 3.1. Algoritmo decisional del análisis de la oportunidad de mejora
que se obtienen, etc.); a su vez, el diagrama de necesaria para el análisis. Su empleo será ade-
causa-efecto tiene utilidad para todo tipo de cuado, por tanto, en la exploración de opor-
problemas. El análisis de campos de fuerza, tunidades de mejora que nos sean conocidas
de utilidad como método de diseño de estra- de forma directa. Por otra parte, aunque en
tegias, puede ser también utilizado para iden- principio los podemos elaborar de forma indi-
tificar causas sobre las que intervenir o cuan- vidual, la información obtenida es mayor y, en
tificar. Por último, aunque cada una de estas consecuencia, el análisis es más exhaustivo si
herramientas tiene utilidad por sí sola, pueden se hace en grupo; más aún si este grupo, cono-
también utilizarse combinadas: por ejemplo, cedor del tema, es el que se va a encargar de
un flujograma puede identificar dónde están solucionar el problema, es decir, si es lo que se
los problemas de un circuito o proceso deter- llama un grupo de mejora.
minado, y se puede aplicar un diagrama de Si tenemos datos del problema, el análisis
causa-efecto para analizar las causas. se puede realizar utilizando el histograma, la
Aunque no precisan de datos, la principal estratificación o el gráfico de Pareto, y, si tene-
condición para el empleo de estos métodos es mos una serie temporal de mediciones, los grá-
que se tenga experiencia sobre el problema ficos de control. Con estos métodos estaremos
analizado con el fin de aportar la información más seguros sobre qué hacer a continuación,
• 67 •
qué intervenciones son oportunas o hacia dón- dad; de lo contrario, se requerirá intercalar
de dirigir estudios en más eprofundidad. Es un bloque de contingencia o decisión.
obvio que su gran limitación se encuentra en la l Rombo: señala una situación de contin-
disponibilidad de los datos necesarios. gencia o comprobación que dividirá la
Una vez enunciados, vamos a ver en qué dirección del flujo en dos o más opciones
consisten estos métodos. y en la que la conveniencia de elegir una
dependerá de que se dé una circunstancia
4. Análisis de problemas con métodos determinada. Por tanto, se sigue de tantos
que no requieren datos flujos como posibilidades tiene esta con-
tingencia, aunque habitualmente suele ser
4.1. Flujograma dicotómica: sí o no.
Con el diagrama de flujo o flujograma vamos Para elaborar el flujograma se pueden seguir
a describir, de forma estructurada, la secuencia los siguientes pasos:
de actividades de un proceso determinado. 1. Identificar las actividades o tareas (por
Es una de las herramientas más útiles para ejemplo, mediante una lluvia de ideas o
analizar problemas organizacionales o de pro- cualquier otro medio de reflexión grupal)
cesos que incluyen numerosas tareas secuen- y determinar quiénes son sus responsables
ciadas a lo largo del tiempo (por ejemplo, la or- respectivos.
ganización de los distintos profesionales en el 2. Clasificar las tareas en orden cronológico
seguimiento de un paciente crónico, los circui- y determinar los flujos del proceso (¿qué
El análisis del flujograma se tos de petición de pruebas complementarias, dirección sigue?).
realiza considerando una etc.). Con él simplificamos un proceso comple-
serie de aspectos concretos. jo dividiéndolo en actividades definidas, en las
Adicionalmente, puede que sea más fácil apreciar en cuál de ellas o en
utilizarse combinado con qué paso entre ellas puede haber problema. De Inicio
otros métodos de análisis hecho, la percepción directa de procesos com-
para indagar las causas de plejos sería análoga a captar, en una sola toma
los puntos señalados como instantánea, un objeto en movimiento, con la
críticos o problemáticos. Ejecutar
consiguiente pérdida de información. Median- tarea A
te el flujograma conseguiremos apreciar a cá-
mara lenta este movimiento para identificar
cada tarea del mismo y apreciar así las interco-
nexiones y relaciones existentes. Contingencia
No Ejecutar
Entre los principales componentes para tarea C
X
plasmar en un flujograma podemos distin-
guir: a) una entrada o inicio; b) actividades
concretas; c) situaciones de contingencia, don-
Ejecutar Sí No
de se comprueba si ocurre o no determinada Contingencia
tarea B
circunstancia decisiva y d) una salida. Estos Y
elementos se representan mediante símbolos
preestablecidos y su secuencia representa el Ejecutar
proceso analizado (figura 3.2): tarea D
l Elipse: representa el inicio (lo que se re-
quiere para comenzar el proceso) y el final
del proceso analizado. Final
l Flecha: señala la dirección en la que fluye
el proceso dentro de la secuencia de tareas.
l Rectángulo: representa una tarea o una ac-
Figura 3.2. Representación gráfica de un proceso
ción determinada dentro del proceso. Nor- mediante el diagrama de flujo
malmente se sigue un solo flujo de activi-
• 68 •
3. Identificar situaciones en las que una de- 4.2. Diagrama de causa-efecto*

terminada tarea no se puede empezar
porque la anterior no se ha concluido ade- El análisis de una oportunidad de mejora me-
cuadamente o no ha ocurrido algo que se diante el diagrama de causa-efecto es probable-
supone debía haber ocurrido y, determinar mente lo más frecuente e incluso lo aconsejable
qué actividad o contingencia es necesaria cuando no disponemos de datos del problema.
para que se resuelva esta situación y en En la mayoría de las situaciones en las que se
qué orden del cronograma se colocaría. identifica un problema es posible apreciar, de
4. Representar el flujograma y sustituir las forma más o menos inmediata, un reducido
situaciones en las que surge más de un número de causas. Pero, si no se examina con
flujo de una sola tarea por un nódulo de más profundidad, pueden pasar inadvertidos
contingencia (con un rombo). Posterior- otros factores que, aunque no sean tan eviden-
mente, habrá que señalar de qué tipo de tes, sí son esenciales para comprender el ori-
contingencia se trata (dentro del rombo) y gen del problema.
cuáles son sus posibilidades al lado de sus Con esta herramienta podemos descompo-
flujos respectivos. En este punto se puede ner una oportunidad de mejora en elementos
dar por terminado el flujograma como re- identificables, medibles y operativos para la
presentación gráfica del proceso, aunque intervención (causas potenciales del proble-
generalmente es posible continuar iden- ma). Una vez que se han identificado las cau-
tificando actividades que probablemente sas, trasladaremos la reflexión sobre el grado
no se hayan identificado en un principio, de conocimiento del problema en conjunto, a
concentrando nuestro foco de atención en- la reflexión sobre el grado de conocimiento de
tre dos actividades consecutivas y cuestio- sus causas potenciales. En este nivel de acer-
nándonos si se requiere alguna actividad o camiento estamos en mejores condiciones para
alguna contingencia entre ellas. conocer la frecuencia o cuantificar parte de sus
causas. Cuando se tiene este conocimiento, el
Una vez que hemos elaborado el flujograma curso de acción más oportuno (diseño de inter-
podemos plantear las siguientes cuestiones ge- vención o estudio) aparece con mucha mayor
nerales para analizar el problema de calidad: claridad.
1. Análisis del flujo general: ¿es lógico el flu- El diagrama de causa-efecto se conoce tam-
jo?, ¿hay diferencias entre el flujo ideal y el bién como diagrama de Ishikawa (su inventor)
realizado de forma habitual?, ¿cuáles son o “diagrama de espina de pescado” (por el as-
las causas de estas diferencias? pecto que tiene). Es probablemente una de las
2. Análisis de cada etapa del proceso: ¿de qué herramientas más sencillas y, sin embargo, más
forma esta etapa puede no cumplir su fun- eficientes para determinar las causas de un
ción?, ¿cuáles son los problemas potencia- problema de calidad o para detectar subáreas
les de calidad en esta etapa?, ¿cuáles son problemáticas. Representa la relación entre un
las posibles causas de estos problemas? problema de calidad determinado (efecto) y
3. Análisis de los bucles o pasos hacia atrás: sus causas potenciales según se esquematiza
¿cuáles son las causas que motivan un re- en la figura 3.4. Para ello se exploran, de forma
traso en el desarrollo del proceso? sistematizada y en sucesivas fases de profun-
dización en el análisis, las distintas categorías
Esta herramienta se puede utilizar de forma o clases de causas y factores que contribuyen
combinada con el diagrama de causa-efecto al problema, identificándolos y relacionándo-
cuando queremos indagar acerca de las causas los unos con otros.
de los puntos críticos del proceso. Para elaborarlo se puede seguir una serie
La figura 3.3 contiene dos ejemplos (3.3.a y de pasos en los que siempre hay que pregun-
3.3.b) de aplicación de flujograma, que pueden
servir para ver más claramente en qué consiste.
En el anexo 3.1 se da una explicación más deta- * Este apartado fue mejorado con las aportaciones de los asistentes al
“Seminario de Formación de Tutores para la supervisión de la Formación
llada de la forma de analizar un flujograma. a Distancia”, celebrado en Pamplona los días 26 y 27 de Junio de 2003.
• 69 •
El médico pide
el análisis
La enfermera acepta
el pedido y rellena
el formulario
No
¿Está claro el pedido?
Sí
Preparación del material

requerido para
el análisis
No ¿Hay jeringa y agua

adecuadas?
Sí
Preparación del juego

de tubos
¿Se dispone No
de los tubos
correctos?
Sí
Recolección
del material
No
Envío
¿Se tomó
al laboratorio
la muestra según
lo pedido?
Entrega del material Sí
en el laboratorio
¿Es aceptable No
la muestra
Sí
Se analiza la muestra
¿Se realizó No ¿Quedó algo No

correctamente
el análisis? del material?
Sí
No
No ¿Es creible
¿Resultado normal?
el resultado?
Sí
Sí
El centro recibe
Se registra el resultado Envío al centro
el análisis
Figura 3.3.a. Flujograma del circuito de petición y realización de análisisde petición y realización de análisis
• 70 •
El fisioterapeuta programa Se realiza visita

una vista de control a los seis de control
meses (con radiografía)
Sí
¿Se realizó
Se acuerda día y hora, y se correctamente
registra en libro citaciones No la radiografía?
Se entrega solicitud
de realización de radiografía
No
El individuo se realiza la
radiografía durante el mes El paciente olvida
anterior a la visita la radiografía
Se realiza recordatorio Renuncia

telefónico días antes de la
visita de control Sí
Sí
Se confirma la visita Se fija otra fecha y hora Desea abandonar Acude el paciente
No No No a la visita
Sí
Se localiza la historia
clínica el día anterior
a la visita
Figura 3.3.b. Flujograma del seguimiento de la escoliosis
Grupo de causas Grupo de causas

C. 3
C. 2
C.1
Problema
de calidad
Grupo de causas Grupo de causas
Figura 3.4. Diagrama de causa-efecto. Causas de primer orden (C.1), de segundo orden (C.2) y de tercer orden (C.3)
• 71 •
tarse: ¿Por qué ocurre la situación anterior? ferior y se coloca el problema de calidad o
(problema, grupos de causas, causas de primer efecto en su parte derecha. El problema es
orden, causas de segundo orden...). Para ello la cabeza de la espina. Debe estar defini-
se suelen utilizar técnicas que faciliten la crea- do de forma escueta y clara (por ejemplo:
tividad como, por ejemplo, la lluvia de ideas “seguimiento irregular del paciente con
(figura 3.5). Los pasos concretos para su elabo- escoliosis”, “captación deficiente del hi-
ración son los siguientes: pertenso”, “historia clínica no disponible
1. Anotación del problema. Se traza una flecha en el momento de la consulta”, “exceso de
centrada entre los márgenes superior e in- pruebas complementarias”, etc.). Puede
Lluvia de ideas
- Descoordinación entre profesionales
- Citación sin que esté disponible
la exploración complementaria
- Ausencia de protocolos
- Escaso seguimiento del calendario vacunal
- Deficiente captación precoz
¿Por qué ocurre esa causa?
Causa principal Causa principal

C. 3
C. 2
C.1
Problema
de calidad
Causa principal Causa principal
Figura 3.5. Identificación secuencial de las causas de un problema
• 72 •
incluso ser cuantificado (por ejemplo: “el sas de cada una de las categorías genéri-
30% de los pacientes no vienen a las citas cas. Consiste en cuestionarse, para cada
de control”, “el número de diabéticos en una de las categorías genéricas, ¿por qué
programa es menor a 50% de los espera- sucede ésta?; por ejemplo ¿por qué los mé-
dos”, “el 10% de los pacientes tienen que todos de trabajo son causa del problema?
ser vistos sin su historia”; “el 60% de los Se representan como una flecha paralela a
hipertensos no tienen controlada su cifra la flecha central y dirigida en uno de sus
tensional tras seis meses de tratamiento”, extremos hacia la flecha correspondiente a
etc.). la causa genérica. Si se comienza la inda-
2. Análisis de grupos de causas. Se determi- gación de causas a este nivel. Después de
nan las causas principales del problema tener el listado, hay que agruparlas en 4 a
agrupadas en categorías genéricas o en 6 grupos genéricos, como vimos en el paso
un número reducido de grupos de causas anterior.
(de 4 a 6) como, por ejemplo, los métodos 4. Análisis de causas de segundo, tercer y hasta n
de trabajo, el personal, los recursos físicos orden. Se procede de forma análoga a la an-
(infraestructura), los pacientes, etc. Cada terior. Para cada causa hay que plantearse,
una de ellas se representa como una flecha ¿por qué ocurre?, y de ésta, su vez, ¿por
que oblicúa a la flecha central. La determi- qué?, hasta llegar a la más elemental. Las
nación de este grupo reducido de grandes respuestas se representan como ramifica-
apartados puede hacerse con discusión ciones de esa causa.
simple o con lluvia de ideas. Incluso pue-
de posponerse y realizarse después de ha- Un ejemplo simple de diagrama de causa-efec-
cer el listado de causas de primer orden. to, aplicado al problema historia clínica no dis-
3. Análisis de causas de primer orden. Mediante ponible en el momento de la consulta puede verse
una lluvia de ideas se determinan las cau- en la figura 3.6.
Método Material
No diariamente
Extracción
de historias Archivo Hojas sin
numerar Espacio insuficiente
de historias
Orden según su número Extravío
No por cupo
de hojas
Extravío de historias
Hojas sin número Cajones sin rotular
Según sexo, fecha de historia
de nacimiento
Sistema de identificación Carpetas

de historias deterioradas Historia
no disponible
en la consulta
Cambios
de cupo
Historias que
Consultan por no se dan de baja
primera vez
Información
de movimientos
de pacientes
Atendido en urgencias
Pacientes Mantenimiento
Figura 3.6. Diagrama de causa-efecto aplicado en el análisis de los “pacientes atendidos sin historia clínica” como
oportunidad de mejora
• 73 •
Un punto siempre controvertido a la hora adecuadamente en los hábitos alimenticios del

de hacer un diagrama de causa-efecto es has- paciente”, que puede contribuir a fracasos en
ta qué nivel de causas llegar, es decir, cuándo el control del riesgo cardiovascular, puede ser
parar de interrogarse. Otro problema que sue- incluida en el grupo de métodos o en el de perso-
le ocurrir es encontrarse causas que encajan en nal, pero parece más claro que sea en el de méto-
más de un grupo, ¿dónde colocarlas? No hay dos; otra cosa sería si la causa fuese “el personal
una norma inflexible ni, por tanto, una respues- desconoce la importancia de los factores dieté-
ta única a estas cuestiones. En relación con el ticos en el control del riesgo cardiovascular”.
nivel al que hay que llegar en la explicitación Una vez que se han terminado de identifi-
de causas, en teoría tendría que ser hasta haber- car las causas potenciales del problema de ca-
nos quedado sin respuestas; sin embargo, en la lidad, es posible clasificarlas, desde un punto
práctica el proceso de indagación se detiene de vista operativo, en las siguientes categorías
cuando se ve que esta causa ya es medible y se (esquematizadas en la figura 3.7):
entiende bien cómo puede influir en el proble- 1. Causas estructurales inmodificables: son
ma analizado. En relación con la ubicación de factores de la producción de servicios (re-
causas que pueden estar en más de un grupo, cursos físicos y recursos humanos) sobre
tampoco hay regla inflexible; lo importante es los que normalmente no podemos interve-
que estén, que se hayan identificado: si se de- nir a corto plazo o que escapan de nues-
sea, se pueden clasificar en más de una catego- tra capacidad de intervención y que, por
ría, aunque lo lógico sería elegir aquel grupo al tanto, en principio, limitan y condicionan
que contribuyan más, o al que sean más afines; la calidad. Es bueno, en todo caso, cono-
por ejemplo, una causa como “no se indaga cerlos y tenerlos presentes.
Causa estructural inmodificable
Problema
de calidad
Causa evidenciada Causa evidenciada (requisito)

(requisito) no dimensionada Causa hipotética
dimensionada
Diseño de Diseño de Diseño de estudio

intervención evalulación de causas
Figura 3.7. Clasificación de las causas de un problema de calidad y vías de acción consiguientes
• 74 •
2. Causas con repercusión conocida en el arriba). También podríamos pensar, como

problema analizado (requisitos de cali- hipótesis, que los controles no se cumplen
dad): son factores en los que hay evidencia porque los análisis se pierden, o porque el
previa de la existencia de un nexo causal paciente cambia las citas con demasiada
con el problema de calidad. A su vez, se frecuencia. Todas éstas son hipótesis plau-
pueden distinguir dos tipos: sibles pero que hay que medir e indagar si
2.1. Frecuencia conocida (cuantificadas): en realidad ocurren y si repercuten en los
son requisitos de calidad normalmen- seguimientos irregulares (por ejemplo, un
te estructurales y de organización de análisis que se pierda puede repetirse sin
los cuales tenemos datos sobre la fre- perjudicar en definitiva el seguimiento del
cuencia con la que ocurren, que suele paciente; lo mismo puede suceder con los
ser siempre o nunca, y sobre los que controles de citas).
podemos intervenir directamente
para mejorar la calidad. Por ejemplo, Los métodos de análisis de los problemas de
la ausencia de normas, protocolos, re- calidad que no precisan datos son los que se
gistros, existencia de circuitos redun- utilizan con mayor frecuencia; sin embargo,
dantes, etcétera. son complementarios con los métodos que uti-
2.2. Frecuencia desconocida (no cuanti- lizan datos, en los casos en los que disponga-
ficadas): son requisitos de la calidad mos de esta información.
que no están cuantificados y que de-
berán medirse para determinar el ni- 5. Herramientas de análisis que requieren
vel de calidad. Lo más frecuente es datos sobre el problema
que sean actividades de proceso que Una vez completo el
no sabemos hasta qué punto se reali- 5.1. Histograma diagrama, las causas
zan. Se sigue, en consecuencia, con el expuestas se pueden
diseño de evaluación, para saber su Cuando el problema por analizar está expresa- clasificar en función de su
nivel de cumplimiento. En los servi- do en términos de un solo indicador o criterio traducción operativa para
cios de salud, todos los requisitos de de tipo cuantitativo (es decir, no mide presen- la continuación del ciclo de
una buena actuación clínica están en cia o ausencia de una cualidad, sino cantidad mejora.
este grupo. de una determinada variable, como puede
3. Causas de repercusión hipotética en el pro- ser tiempo de espera), su resumen estadístico
blema analizado: son factores de los que simple (por ejemplo, la media) suele no ser
intuimos una relación con el problema de suficiente y es conveniente realizar un análisis
calidad, pero sin contar con evidencia pre- gráfico para saber qué hacer con el problema.
via sobre esta relación. Su curso de acción Este análisis gráfico es el histograma tal como
consiguiente es el diseño de investigación se estudia en los textos básicos de estadística,
de causas, para saber no sólo hasta qué sólo que interpretado de una forma un tanto
punto están presentes o no, sino también peculiar.
hasta qué punto influyen en el problema El histograma, tal como se aprende en
de calidad analizado. Supongamos, por las primeras lecciones de cualquier curso de
ejemplo, que nuestro problema es el se- estadística, es un gráfico de barras en el que
guimiento irregular del paciente hiperten- se muestra la distribución de una determina-
so; para explicarlo, podemos pensar en el da variable cuantitativa a partir de los datos
cumplimiento de los criterios establecidos de una tabla de frecuencias de los intervalos
en cuanto a periodicidad de controles y so- o valores sucesivos en que se ha dividido la
licitud de exploraciones complementarias. variable que se ha medido; por ejemplo, dis-
Éstos serían requisitos que tendríamos tribuimos el tiempo de espera para la con-
que medir para saber el nivel de cumpli- sulta en intervalos de cinco minutos y vemos
miento. Serían causas con repercusión pre- cuántos han esperado de 1 a 5 minutos, de 6
viamente conocida pero frecuencia des- a 10 minutos, etcétera. Lo que se consigue al
conocida (la situación 2.2 explicada más representarlo gráficamente con el objetivo de
• 75 •
analizar el problema es, básicamente, ver el sesgado a un lado, nos conviene identificar las
tipo de variabilidad que presenta, lo cual aclara características de los que esperan más (2º pico
la situación y nos ayuda a decidir cómo pro- del histograma o cola extrema) porque son los
ceder a continuación. Por ejemplo, si tenemos que realmente representan el problema; o en-
medido el tiempo de espera para la consulta focar nuestro estudio en distinguir cuáles son
o los días que demora una determinada prue- las características diferenciales de los que espe-
ba analítica solicitada, no será suficiente sólo ran poco y los que esperan mucho (puesto que
con saber el tiempo medio o la media de días hemos visto que son dos grupos diferentes) y,
porque desconocemos si estos tiempos medios en segundo lugar, si es necesario, cuáles son
representan una distribución homogénea o los factores adicionales que pueden asociarse
no. Tomemos el caso del tiempo de espera: al a que se espere más. Este supuesto del tiempo
hacer el histograma podemos encontrar que de espera analizado con histograma está repre-
hay poca variación y que la media represen- sentado en la figura 3.8.
ta bien lo que la gente espera; en este caso, si Para elaborar un histograma podemos se-
el tiempo de espera es elevado, el problema guir los siguientes pasos:
es generalizado y hay que diseñar un estudio 1. Recopilar los datos del problema o causa
de causas hipotéticas sin distinción de grupos potencial del problema en estudio (por
de pacientes. Sin embargo, si nos encontramos ejemplo, tiempo de espera antes de la con-
que es bimodal (con dos picos) o francamente sulta).
Al igual que para las

demás herramientas de
análisis estructurado de
los problemas de calidad,
Frecuencia
Frecuencia
la construcción de un
histograma se realiza
siguiendo una serie de
indicaciones y pasos
determinados.
Tiempo de espera antes de la consulta Tiempo de espera antes de la consulta
Variabilidad pequeña Distribución sesgada a la izquierda
Conclusión: problema general; estudio de causas Conclusión: problema no general; estudiar

sin distinción de grupos causas de espera en las que esperan más
Frecuencia
Frecuencia
Tiempo de espera antes de la consulta Tiempo de espera antes de la consulta
Variabilidad grande Distribución bimodal
Conclusión: problema general; estudiar causas de Conclusión: problema no general; estudiar

variabilidad; ver sobre todo lo que puede ocurrir características diferenciadas de los dos grupos
a las esperas por encima de la media
Figura 3.8. Posibles histogramas del tiempo de espera antes de la consulta para decidir los estudios subsiguientes
• 76 •
2. Calcular el rango de la variable (restar el de radiografía en nuestro centro y que el pro-

valor mínimo al valor máximo) y decidir blema es que está colapsado, con listas de espe-
sobre la amplitud del intervalo en que va- ra inaceptables. Un posible acercamiento, si te-
mos a dividirlo. Supongamos que el rango nemos datos de los motivos de prescripción de
resulta de 40´, y que 5´ nos parece un inter- radiografías, sería estratificar por estos motivos La estratificación ayuda a
valo razonable. de prescripción para ver cuál es más frecuen- entender la influencia de
3. Establecer el número de barras del histo- te. Con este análisis por delante, lo lógico sería un determinado factor en
grama (debe resultar un mínimo de 6 y un ver si están claras las indicaciones de radiogra- la magnitud del problema
máximo de 20) dividiendo el rango entre fías para los motivos más frecuentes e interve- y ayuda a priorizar los
el intervalo establecido. En nuestro ejem- nir directamente (para acordar suprimirlos) si estudios de causas por
plo tendríamos un histograma con ocho aparecen motivos de solicitud de radiografía realizar.
barras (40´/5´). inadecuados. Sin la estratificación podríamos
4. Determinar la frecuencia para cada inter- haber estado tentados a estudiar la adecuación
valo. Es decir, ver cuántos pacientes han de la prescripción radiográfica en general, en
esperado un tiempo incluido en cada uno vez de centrarnos en las causas de prescrip-
de los intervalos. ción más frecuentes e intervenir directamente
5. Representar en un gráfico con dos ejes (un sobre las inadecuadas. Situaciones como ésta,
eje vertical “y” [frecuencia de cada inter- en la que la estratificación es de gran ayuda,
valo] y uno horizontal “x” [los intervalos se producen con frecuencia si el problema por
de la variable]) las barras correspondien- analizar es de utilización de recursos (por ejem-
tes a cada intervalo. plo, derivación a especialista  estratificar por
especialista o incluso por tipo de enfermedad;
Este gráfico reflejará el patrón de distribución utilización de analítica  estratificación por
de la variable analizada, así como la variabili- tipo de análisis; prescripción de antibióticos 
dad de esta distribución y nos indicará el me- estratificación por patologías o tipo de antibió-
jor camino para seguir (figura 3.8). tico, etc.). Como veremos más adelante –capí-
tulo 7–, la estratificación es uno de los métodos
5.2. Estratificación de gran utilidad en el análisis de los datos de
un estudio de causas hipotéticas.
Una modalidad de analizar un problema de
calidad consiste en presentar los datos de for- 5.3. El diagrama de Pareto
ma estratificada. En este caso, cuando tene-
mos los datos en conjunto de la oportunidad Este gráfico se estudiará con detalle en el capí-
de mejora analizada (por ejemplo, tiempo tulo 7 como forma de análisis y presentación
transcurrido entre la recepción y la petición gráfica de los resultados de una evaluación. En
de pruebas de laboratorio) podemos saber el general lo podemos aplicar para determinar Un diagrama de Pareto
grado de contribución de una determinada en qué grado contribuyen las distintas causas sirve para priorizar las
causa potencial (por ejemplo, dos laboratorios o estratos de un problema en el mismo. En am- categorías o causas
distintos) recogiendo los datos de forma des- bos casos lo que tenemos es un cierto número principales sobre las que
glosada para cada uno de ellos y elaborando de categorías o de grupos y la frecuencia de dirigir nuestra atención. En
los dos histogramas. La contribución de esta su presencia o ausencia (variable cualitativa). el capítulo 7 se describe en
causa potencial (laboratorio al que se solicitan Una vez medida la frecuencia con que se pro- detalle su construcción y
las pruebas) puede apreciarse por el grado en duce cada categoría, podemos ordenarlas de utilización para analizar los
que se diferencian ambos histogramas. Natu- mayor a menor frecuencia y focalizar nuestra datos de una evaluación y
orientar en el diseño de las
ralmente, ante dos histogramas muy diferen- atención en las categorías más frecuentes.
intervenciones.
tes decidiremos estudiar o intervenir sobre el El diagrama de Pareto consiste básicamen-
laboratorio más problemático. te en un diagrama de barras, en el que cada ba-
La estratificación puede realizarse también rra es una de las categorías, criterios o estratos
cuando el problema sobre el que tenemos datos considerados, y en el que las barras se ordenan
no es cuantitativo sino cualitativo. Suponga- de mayor a menor frecuencia. De esta forma se
mos, por ejemplo, que tuviésemos un servicio hace gráficamente evidente qué es prioritario
• 77 •
analizar. El ejemplo de la estratificación de las de control estadístico son sensibles a cualquier

radiografías por tipo de patología o cualquier cambio introducido en el proceso que moni-
otra estratificación por variables categóricas torizan, por lo que pueden utilizarse también
(variables con varias categorías o posibilida- para evidenciar los efectos de las intervencio-
des excluyentes) pueden ser presentados grá- nes que se implementan para mejorar las si-
ficamente con diagrama de Pareto. tuaciones que se han identificado como mejo-
Hay que advertir, no obstante, que el aná- rables o problemáticas. Los gráficos de control
lisis con diagrama de Pareto que veremos en el estadístico son, pues, instrumentos muy versá-
capítulo 7 se construye de una forma diferente tiles, con múltiples aplicaciones.
y particular, y tiene mayor utilidad para deci- El análisis básico que se realiza con el con-
dir sobre diseño de intervención, que sobre es- trol estadístico consiste en determinar si los
tudios sucesivos. valores que se obtienen del indicador que se
La figura 3.9 es un diagrama de Pareto, he- mide están dentro de los esperados, dada la
cho para decidir por dónde empezar a analizar variabilidad, o si son estadísticamente incom-
la problemática de la derivación a especialistas. patibles con la situación estable de partida. Sin
embargo, este análisis es visual, gráfico y no
5.4. Gráficos de control estadístico entraña, una vez construida la plantilla gráfica,
ningún cálculo adicional a la propia medición
El control estadístico (gráfico) de la calidad es del indicador. El objetivo inicial principal del
el método de elección para monitorizar indica- análisis gráfico es caracterizar la variabilidad
dores que se miden de forma continua o muy del indicador que se mide, dado que su mejora
frecuente (como mínimo cada mes). A esto y control han de empezar por la comprensión
hay que añadir su utilidad como herramien- de su variabilidad. Una vez conocida y contro-
ta de análisis de los procesos, lo que permite lada la variabilidad, el proceso es predecible y
detectar no sólo si hay problema (algo común cualquier desviación que ocurriese será fácil-
a todos los métodos de monitorización), sino mente detectable.
también qué tipo de problema es (esporádico La gran utilidad potencial del control grá-
o sistemático). Al mismo tiempo, los gráficos fico de la calidad contrasta con lo lenta que
% Centro A % Centro B
100 100
75 75
50 50
25 25
0 0
Oftalmología
Med. interna
ORL
Ginecología
Cirugía
Rehabilitación
Traumatología
Tocología
Traumatología
Oftalmología
ORL
Cirugía
Rehabilitación
T ocología
Med. interna
Ginecoloría
Conclusión: en el centro A se priorizará el estudio de las derivaciones de oftalmología y medicina interna, mientras que en el
centro B se priorizará el estudio de las derivaciones de traumatología y oftalmología
Figura 3.9. Pareto de derivación a especialistas
• 78 •
está resultando su utilización rutinaria en los es aceptable, con base en una serie de criterios
servicios de salud. Probablemente la principal que incluyen la búsqueda de causas relaciona-
causa sea que se precisan series temporales con das con el sistema y los procesos –no con las
mediciones muy frecuentes para que puedan personas– y la credibilidad del plan de acción
ser aplicados. Ésta es una limitación inexisten- enviado.
te cuando hablamos de sistemas de monitori- El RCA a su vez incluye varias metodo-
zación frecuente de indicadores. Los gráficos logías concretas, entre ellas los diagramas de
de control estadístico se revisan en detalle en causa-efecto y otras como el análisis de cam-
el documento Métodos y herramientas para la mo- bios y la comparación de procesos con nulos
nitorización de la calidad Manual (volumen II de resultados con procesos con buenos resulta-
esta colección). dos, el análisis de barreras (evaluación de la
adecuación de las barreras existentes para evi-
5.5. Análisis de causas raíz (root cause analysis) tar el suceso adverso), el análisis secuencial de
sucesos y factores concretos, etcétera.
Un tipo particular de análisis de causas es el Las causas pueden ser de varios tipos,
conocido como análisis de causas raíz (root cau- y ser agrupadas como en el diagrama de Is-
se análisis, representado con las siglas RCA o hikawa, pero es interesante el énfasis en las
RoCA, según versiones), que puede ser defini- causas atribuibles al sistema. Así, por ejem-
do como el proceso de averiguar y eliminar la plo, se afirma como una de las reglas para
causa (o causas) últimas de un problema para realizar el RCA que “cada error humano ha
evitar que vuelva a ocurrir. El método tiene su de tener una causa que lo precede”. Descu-
origen en el ámbito industrial con el objetivo brir que hubo un error humano no ayuda en
de analizar las causas de los accidentes o su- nada a la prevención del problema. Es la cau-
cesos adversos infrecuentes pero importantes, sa del error, generalmente relacionada con el
de forma que pudiera prevenirse su repeti- sistema o el diseño del proceso encausado, no
ción. En esencia, se trata de una investigación el error en sí mismo, lo que puede conducir-
estructurada a fondo para averiguar cómo nos a estrategias de prevención productivas.
podría haberse evitado ese accidente. Sin em- El desarrollo exhaustivo de esta metodología,
bargo, el campo potencial de aplicación se ha así como su práctica, escapa de los objetivos
ampliado hasta incluir problemas recurrentes de este manual. No obstante, quienes estén
y frecuentes, así como variabilidad inadecuada interesados pueden revisar las publicaciones
en los resultados que se obtienen. Root cause analysis guidance document, publica-
La incorporación de este método al cam- do en 1992 por la Oficina de Seguridad Nu-
po sanitario es relativamente reciente, dentro clear, Política y Estándares del Departamento
del énfasis en los problemas de seguridad del de Energía de los Estados Unidos y el Manual
paciente y particularmente en la vigilancia de de la JCAHO Root Cause analysis in heatlh care:
sucesos centinela y el apoyo metodológico tools and techniques, ambas en la bibliografía
para su análisis. Ante la aparición de un seceso de este capítulo.
centinela, la JACO incluye como obligatorio el Con este capítulo estaremos en condicio-
RCA así como los planes de acción consiguien- nes de analizar el problema para dimensio-
tes, en los estándares para acreditar. Un suceso narlo, conocer sus causas, priorizar sus com-
centinela se define como “un suceso que ocu- ponentes principales y, en definitiva, decidir
rre de forma inesperada, implicando muerte cómo continuar el ciclo de mejora. De todos
o lesiones serias de tipo físico o psicológico, o los métodos expuestos se aconseja dominar
un aumento del riesgo para ello en lo sucesi- la práctica de, al menos, el diagrama de cau-
vo”. Tanto el análisis de causas como el plan sa-efecto sobre la calidad deficiente (o mejo-
de acción debe realizarse dentro de los 45 días rable) y del flujograma, si es un problema de
posteriores al suceso centinela y ser enviado tipo organizacional o implica una secuencia
a la JCAHO, que lo revisará y determinará si de actividades.
• 79 •
BIBLIOGRAFÍA
• Banks NJ. Constructing algorithm flowcharts for clinical performance measurement. Int J Qual Health Care 1996; 8(4):395-400.
• Ishikawa K. Introducción al control de calidad [cap. 4]. Madrid: Diaz de Santos, 1994: 221-310.
• JCAHO. Root cause analysis in health care: tools and techniques, 4th ed. Oakbrook Terrace: Joint Commission Resources, 2010.
• Leebov W, Ersoz CJ. The health care manager´s guide to continuous quality improvement [ch. 11]. AHA 1989:143-187.
• Manual de Herramientas básicas para el análisis de datos. Methuen: GOAL/QPC, 1990: 9-13; 17-23; 25-29; 36-43.
• United States Department of Energy. Root cause analysis guidance document. Washington DC: DOE, 1992. Disponible en: http://
www.nmenv.state.nm.us/aqb/documents/DOERootCauseAnalysisGuidanceManual.pdf (consultado: septiembre de 2015).
• 80 •
Capítulo 4
La construcción de criterios
para evaluar la calidad
1. Introducción
2. ¿Qué es un criterio? Concepto de criterio para medir calidad

3. Tipos de criterios
4. ¿Cómo se construye un criterio?
5. Excepciones y aclaraciones a los criterios
6. Validez de los criterios
Anexo 4.1. Trabajo práctico recomendado: la construcción de criterios
para evaluar la calidad. Análisis de validez

2 Identificación
Monitorización
Elaboración
o indicadores para Capítulo
Capítulo 4 4
medir calidad


Capítulo 8 Diseño
de intervención



Contenido general
El siguiente paso en el ciclo de mejora, sea cuál sea el curso de acción que decidamos tras analizar
el problema (capítulo 3), es la construcción de los criterios, indicadores, herramientas o referentes
con los que vamos a medir la calidad en la situación de partida, y que luego emplearemos para
documentar la mejora conseguida. Además de otras consideraciones, los criterios o indicadores a
emplear deben ser herramientas válidas y fiables, para lo cual es preciso abordar su construcción
con un rigor metodológico que se detalla en este capítulo.
Este capítulo está enfocado a:

1. Desarrollar criterios o requisitos para medir la calidad de un determinado producto o servi-
cio, o de un aspecto del mismo
2. Distinguir los criterios aislados, transversales, de los secuenciales
3. Distinguir los criterios empíricos de los normativos
4. Discutir las ventajas y las desventajas de la ponderación de los criterios
5. Establecer mecanismos para asegurarse la validez de los criterios a utilizar
6. Describir los enunciados de los criterios acompañados de excepciones y aclaraciones de los
términos empleados
7. Explicar el significado de las excepciones al criterio a la hora de medir la calidad
8. Determinar si las excepciones han de ser tratadas aparte o conjuntamente con los casos
normales
9. Estar alerta de la posibilidad de que las excepciones sean un factor de confusión si se tratan
conjuntamente con los casos normales
La construcción de criterios Capítulo
para evaluar la calidad 4
“Todo tiene que medirse y lo que no se puede medir,

hay que hacerlo medible” (Galileo).
1. Introducción calidad que queremos que se cumpla. De ahí la

tremenda importancia que tiene el que sean re-
Paso a paso hemos avanzado por el ciclo de levantes, realistas y que puedan ser aceptados
mejora. Después de la identificación del pro- sin controversia por todos los profesionales im-
blema de calidad (capítulo2) y el análisis del plicados en su consecución. Una correcta ela-
problema seleccionado (capítulo 3), en este boración y selección de criterios es probable-
capítulo llegamos a una parte crucial: la cons- mente, junto a una priorización adecuada del
trucción de instrumentos, requisitos, criterios tema a evaluar, el principal factor determinante
o indicadores, con los cuales medir la calidad. del éxito o fracaso de los ciclos de mejora.
Vamos a ver que hay diferentes tipos de Por ejemplo, supongamos que nos preocu-
criterios con implicaciones metodológicas pe pe el nivel de calidad alcanzado en el progra-
culiares para su medición. Propondremos rea- ma de atención al cáncer en la mujer. No habría
lizar las evaluaciones preferentemente con cri- que discutir mucho para acordar que uno de
terios explícitos y normativos y estableceremos los aspectos más relevantes para una atención
las precauciones a tomar para asegurarnos de correcta, de calidad, es la detección precoz.
que tengan validez y fiabilidad. Así, de una manera general, la existencia o no
de un programa de screening para el cáncer fe-
2. ¿Qué es un criterio? Concepto de menino es una medida de calidad. Sin embar-
criterio para medir calidad go, un criterio estructural como es la existencia
de programa para la detección precoz rara vez
Los criterios son las herramientas o referen- es suficiente. Lo habitual es que haya que es-
tes con los cuales se mide la calidad; así como pecificar además cómo se ha de llevar a cabo
aspectos esenciales y relevantes de la aten- el proceso, cuál es la traducción operativa de
ción sanitaria en torno al problema o área que la satisfacción de las necesidades de salud que
queremos evaluar. Ese aspecto relevante de la queremos cubrir. Siguiendo con nuestro ejem-
atención sanitaria será medido para conocer plo, la detección precoz ha de consistir en la
su grado de cumplimiento; de forma que su práctica de citologías vaginales con una pauta
ausencia, presencia o grado de cumplimiento, determinada, y la realización también explíci-
nos está indicando, a su vez, la presencia o los tamente pautada de exploraciones mamarias.
diferentes niveles de actuación correcta, es de- El criterio o herramienta de medida sería, en
cir, diferentes niveles de calidad. este caso, el cumplimiento o incumplimiento
Un criterio se deriva de la reflexión sobre de las pautas de actuación acordadas como
cómo han de ser los requisitos de los distintos concretas. De igual manera podríamos ir re-
servicios para que sean acordes con las necesi- flexionando sobre cuáles serían los requisitos
dades y expectativas de quienes los van a reci- para que no hubiera problemas de accesibili-
bir. En este sentido, es a la vez un objetivo de dad, atención centrada en el paciente, etcéte-
• 85 •
ra. La figura 4.1 contiene el resumen de este 2.1. Características de los criterios
esquema básico de razonamiento para definir
criterios de calidad. Con cualquiera de los servicios o aspectos de
Es adecuado recordar que los términos cri- los mismos que consideremos como problema
terio, indicador, requisito, norma, estándar, con de calidad y queramos evaluar su nivel, el lis-
ceptualmente emparentados, no son siempre tado de criterios que podríamos construir es
utilizados de la misma manera en la literatura normalmente grande. Es conveniente, sin em-
sobre calidad asistencial, más bien son utiliza- bargo, priorizar y prestar atención a un cier-
dos de forma intercambiable y a veces confu- to número de características esenciales que
sa. La distinción terminológica tiene, sin em- distinguen los criterios buenos de los no tan
bargo, una traducción práctica generalmente buenos. Entre estas características que deben
irrelevante. Lo importante para diseñar una cumplir los criterios (cuadro 4.1), ya hemos
evaluación no es tanto el nombre que le demos hablado de la relevancia, una característica
a la herramienta de medida, sino la secuencia inherente al concepto mismo de criterio que
consciente del razonamiento que nos lleva a hace referencia a su importancia y a que sea un
definirla y a tener claro el concepto de lo que aspecto esencial del problema a evaluar. Tam-
vamos a medir. bién hemos hablado de la conveniencia de que
Proveedor Servicio Necesidades y expectativas del usuario Requisitos de calidad
Centro de salud Prevención de cáncer Calidad científico-técnica • Existencia de programas de screening de cáncer
femenino • Citologías realizadas según pautas determinadas
• Diagnóstico precoz • Mamografías realizadas según pautas determinadas
• Prevención primaria • Calidad citológica adecuada
• Tratamiento adecuado • Calidad adecuada de mamografía
• Seguimiento adecuado • -
• -
Accesibilidad • -
• Inexistencia de barreras culturales
• No hay lista de espera
• Horario conveniente
• -
• -
-
Satisfacción
• Trato considerado
• Exploraciones suficientes y comprensibles
• -
• -
-
Base de los requisitos de calidad
Figura 4.1. Ejemplo de aplicación del esquema de razonamiento básico para definir criterios para evaluar calidad
• 86 •
La construcción de criterios para evaluar la calidad
Cuadro 4.1
es incorrecto establecerlos después de una pri-
Características de los criterios para evaluar calidad mera evaluación.
En algunos ámbitos, el concepto de están-
l Relevantes l Medibles dar no es diferente al de criterio. Por ejemplo,
l Realistas l Fiables
al referirse a los requisitos que se deben exigir y
l Aceptables l Pocos
que se va a comprobar si están presentes al rea-
l Válidos
lizar una auditoría para acreditar o certificar, se
emplea con frecuencia el término estándar.
2.3. Indicadores de calidad
Un tercer tipo de referente es aquel que va- Los criterios han de ser
dichos criterios sean realistas y aceptables, en relevantes, realistas,
cuanto a que sea algo que el centro sanitario mos a emplear no tanto para evaluar el nivel
de calidad, sino para concluir si hay o no un aceptables, medibles,
y sus pacientes se pueden permitir (realistas) pocos, válidos y fiables.
y que los profesionales y la bibliografía los problema de calidad que evaluar. Es decir, una
sustente como científicamente comprobados herramienta para hacer cribaje de problema
en cuanto a niveles de calidad (aceptables y de calidad más que un diagnóstico del nivel
válidos). Hay que añadir a los requisitos que de calidad. A este referente le llamamos indica-
deben cumplir un criterio el que sea medible, dor, y lo vamos a utilizar en la monitorización
se debe de poder cuantificar el nivel de cali- de la calidad. Un indicador en realidad es un
dad. También es aconsejable que sean pocos criterio, sólo que especial, porque tiene que re-
criterios, los menos posibles; algunos autores presentar o resumir al máximo la calidad de lo
dan menos de 10 como referencia útil. Otra ca- que queremos monitorizar. En este sentido po-
racterística fundamental de los criterios, que demos decir que todos los indicadores son cri-
veremos más a detalle en el siguiente capítulo, terios, aunque no todos los criterios son bue-
es que sean fiables. Fiabilidad y validez van a nos indicadores. Por ejemplo, para evaluar la
ser dos características de los criterios a los que calidad del servicio de hipertensión podemos
vamos a prestar un interés especial. utilizar toda una serie de criterios en relación a
todos los pasos del proceso asistencial; pero si
2.2. Estándares de calidad lo que queremos es controlar periódicamente
que el servicio se mantenga a un nivel acep-
Si existen datos de estudios previos sobre los table, vamos a elegir solamente unos pocos
criterios de un determinado problema objeto criterios; cuanto menos mejor, pero que repre-
de evaluación, estos nos permitirán establecer senten adecuadamente la calidad del servicio;
unos estándares o niveles óptimos de cumpli- a estos pocos criterios/resumen, son a lo que
miento del criterio, los cuales se fijarán antes llamamos indicadores. Por ejemplo, la realiza-
de iniciar la evaluación, de acuerdo con la si- ción o no de los controles analíticos en el hiper-
tuación asistencial concreta del ámbito donde tenso en programa puede ser un buen criterio
se realice. Podemos definir estándar como el de calidad (a medir dentro de un listado más El estándar (nivel de
nivel de cumplimiento patrón que separa lo amplio) pero no un buen indicador porque re- cumplimiento patrón) de
aceptable de lo no aceptable, es decir, un refe- sume mal la existencia o no de problemas de los criterios puede fijarse
rente para enjuiciar el grado de aceptabilidad calidad en el servicio en su conjunto, mientras antes o después de evaluar.
de la calidad encontrada. Es un límite que esta- que la proporción de hipertensos con cifras
blecemos como nivel exigible de cumplimien- normalizadas sí podría ser un buen indicador
to del criterio. En algunos casos vamos a exi- a monitorizar, debido a su relevancia y porque
gir un 100% como estándar, y en otros (como resume en sí mismo el efecto del cumplimiento
generalmente ocurre en lo relativo a criterios de otros muchos criterios. El nivel de cumpli-
de resultado), puede que consideremos están- miento del indicador, que separa la existencia
dares más bajos como aceptables. Aunque es o no de problema de calidad, se suele cono-
aconsejable establecer estos estándares antes cer como umbral del indicador; un concepto
de evaluar, tal como hemos señalado, tampoco paralelo a lo que hemos llamado estándar en
• 87 •
relación a los criterios. El término indicador 3.1. Según estén o no especificados: implícitos
es muy frecuente encontrarlo como sinónimo o explícitos
de criterio, pero parece conveniente distinguir
los conceptos de los dos tipos de referente que l Criterios implícitos: son aquellos en los
representan (uno para evaluar niveles de ca- que no se especifica cuáles son los criterios
lidad: criterio; y otro para hacer screening de de calidad que se valoran; se perfilan en
problemas de calidad: indicador), sea con esta función de los conocimientos del sujeto
o con otra terminología. que realiza la evaluación. No es recomen-
dable utilizar este tipo de criterio de forma
3. Tipos de criterios exclusiva. Pueden emplearse más como
mecanismo de detección de problemas
Al hablar de criterios de calidad podemos en- o de segunda revisión de los casos clasi-
contrar diferentes tipos (cuadro 4.2): ficados de calidad deficiente. Ejemplo de
criterio implícito: evaluar si el diagnóstico
l Criterios implícitos: son aquellos en los es correcto sin que se especifique cuál es el
que no se especifica cuáles son los criterios concepto de buen diagnóstico que emplea
de calidad que se valoran, se perfilan en el evaluador.
función de los conocimientos del sujeto l Criterios explícitos: son aquellos en los
que realiza la evaluación. No es recomen- que se describe en qué consisten. Se acon-
dable utilizar este tipo de criterio de forma seja utilizar este tipo de criterio. Permite
exclusiva. Pueden emplearse más como tener claro cuáles han sido los referentes
mecanismo de detección de problemas para la medición, que pueden ser critica-
o de segunda revisión de los casos clasi- dos o justificados, si es preciso. Ejemplo de
ficados de calidad deficiente. Ejemplo de criterio explícito: la toma de tensión arte-
criterio implícito: evaluar si el diagnóstico rial se realizará con esfigmomanómetro de
es correcto sin que se especifique cuál es el mercurio, con el paciente en reposo y sin
concepto de buen diagnóstico que emplea que haya fumado ni tomado café en 30 mi-
el evaluador. nutos previos a la medición.
3.2. Según su origen: empíricos o normativos

Cuadro 4.2 l Criterios empíricos: no dicen cómo tienen
Tipos de criterios
que ser las cosas para ser de calidad. Des-
Implícitos: no descritos criben cómo es la realidad y se acepta como
válido lo más frecuente. Por ejemplo, dar
Explícitos: descritos
como referente de la estancia media ade-
Empíricos: de base estadística (lo que se hace) cuada en el hospital para una determina-
da patología la media de los hospitales de
Normativos: de base científica (lo que se debe hacer) una determinada área o región.
l Criterios normativos: dicen explícitamente
Secuenciales: el cumplimiento de uno se realiza en la
población que cumple el anterior como tienen que ser las cosas, según la evi-
dencia científica existente, para que sean
Transversales: se valoran independientemente de calidad aceptable. Son generalmente
los más adecuados.
Isovalentes: todos importan igual
Ponderados: a unos se les da más importancia que a otros 3.3. Según su dependencia o no de otros
criterios: secuenciales o transversales
Genéricos: aplican a varios servicios
Específicos: referentes de un solo servicio

l Longitudinales, secuenciales o encade-
nados: el criterio secuencial es aquel que
• 88 •
precisa para su evaluación de los datos o La ponderación suele ser arbitraria y

cumplimiento de otro criterio anterior. Se discutible, por lo que en general es preferi-
evalúa después del precedente. Su distin- ble evitarla.
ción es importante por las implicaciones
que tienen para su medición; más concre- 3.5. Según el número de servicios a los que
tamente para los esquemas de muestreo, al incluyen
tener que asegurarnos un número mínimo
de casos para poder evaluar todos los cri- l Genéricos: incluyen a varios productos o
terios, tal como veremos en el capítulo 5. servicios diferentes. Los criterios pueden
Por ejemplo: para evaluar el Screening de l Específicos: solamente afectan a un solo clasificarse en función a
diversas características.
cáncer de cérvix podemos tener lo siguien- servicio o producto.
De todas ellas destacamos
te: 1er criterio: toda mujer entre 35 y 65 como más adecuados
años deberá tener realizada la citología y Esta distinción es semejante a la que vimos a la los criterios explícitos,
registrado el resultado (normal o no) en la hora de hablar de problemas de calidad en el normativos, isovalentes y
historia clínica. 2º criterio: si la citología es capítulo 1. De hecho, si el problema es genéri- específicos.
anormal, la mujer deberá ser derivada al co, va a tener que ser evaluado con toda proba-
ginecólogo para el estudio de seguimien- bilidad con criterios genéricos. Algunos ejem-
to. Para que se pueda evaluar el 2º criterio plos: “no deben existir reacciones adversas a
previamente se ha de evaluar y cumplir el medicamentos” (o con un cierto estándar), se-
1º; el 2º criterio es un criterio secuencial o ría criterio genérico de calidad de prescripción;
encadenado al 1º. si lo referimos a un tipo de enfermedad concre-
l Transversales: se evalúan todos de forma ta sería específico: “no debe haber reacciones
independiente el uno del otro. alérgicas a la penicilina en el tratamiento de la
amigdalitis”.
3.4. Según que se ponderen o no: isovalentes
o ponderados 4. ¿Cómo se construye un criterio?
l Isovalentes: a todos los criterios se les da el El proceso de elaboración y selección de crite-

mismo valor como requisitos de calidad. rios es algo que atañe a todos los implicados
l Ponderados: al resumir la evaluación se en su eventual cumplimiento. Todo el personal
le da a algunos criterios más valor que a sanitario debe participar en la selección de cri-
otros. Ejemplo: criterio 1: a todo paciente terios, en la medida en la que estén involucra-
hipertenso se le realizará un ECG en el año dos en el servicio a evaluar, y en particular en
del diagnóstico. Criterio 2: a todo paciente el cumplimiento de los criterios que se decida La elaboración o adaptación
hipertenso se le realizará anamnesis sobre utilizar en la evaluación. de criterios es conveniente
antecedentes familiares de hipertensión, En instituciones grandes no es operativo que sea participativa y
cardiopatía, y dislipemia. Criterio 3: Todo que todo el personal participe en la selección asegurándose su idoneidad
paciente hipertenso se considera bien con- de criterios y ésta puede delegarse al grupo de por el equipo que lo va a
trolado si su TA≤140/90 en los tres últimos mejora. Para ello pueden utilizarse técnicas de utilizar, así como su validez
controles. Si nosotros a la hora de evaluar toma de decisiones en grupo. Se ahorra tiempo y fiabilidad.
decimos que el criterio 3 vale el doble que el si se elabora un borrador previo sobre los cri-
1 y el 2, estamos ante un criterio ponderado; terios que hay que discutir y luego se consen-
si por el contrario, todos nos parecen igual suan con el resto de los profesionales.
de importantes, serían criterios isovalentes. A continuación se sugieren algunas reco-
La forma más frecuente de ponderación es, mendaciones para la elaboración de criterios:
al aplicar un listado cerrado de criterios, ha- l Manejar criterios simples.
cer que todos sumen 100 o la unidad y pon- l Limitar el número de criterios (el menor
derar cada uno en función del porcentaje o número posible. Máximo 10 criterios).
proporción que se supone importa sobre la l Incluir sólo los mínimos parámetros esen-
valoración global que se haga. ciales.
• 89 •
l Elaborar criterios que se adapten a los re- son las excepciones a los criterios de diagnósti-
cursos de los profesionales y el entorno. co, en caso de que el diagnóstico sea antiguo o
l Asegurar el consenso y la aceptabilidad por haya sido realizado en otro nivel.
parte de quienes los tienen que cumplir. Las excepciones al criterio, no deben ser
l Asegurarse de que el contenido esté actua- muchas ni frecuentes y deben de tratarse con
lizado y sea válido. cuidado a la hora de evaluar la calidad, ya que
l Prestar atención cuidadosa a las excep- pueden ser un factor de confusión para las
ciones y aclaraciones de los términos em- comparaciones; sobre todo si las consideramos
pleados (explicados más adelante en este como cumplimiento del criterio, como vere-
capítulo). mos más adelante.
l Asegurar la fiabilidad mediante pilotaje, so-
bre todo si va a haber más de un evaluador. 5.2. Frecuencia de las excepciones
Previo a la elaboración de criterios hay que Si a la hora de evaluar un criterio vemos que
revisar y actualizar la bibliografía existente, aparecen muchas excepciones, debemos elimi-
consensuar con el grupo de trabajo, ver si son nar ese criterio; ya que corremos el riesgo de
factibles y realizables en nuestro medio y con que no tenga validez como criterio de calidad
nuestras características peculiares. Copiar crite- o que dificulte la evaluación exigiendo dise-
rios ya elaborados sin tener en cuenta estas re- ños muestrales complicados. Por ejemplo; un
flexiones puede resultar contraproducente para criterio puede ser: debe constar en la HC de
el ciclo de mejora en el que se quieran emplear. toda gestante que se da consejo sobre tabaco
Si hacemos referencia a las clasificaciones en el embarazo. Excepción: paciente en cuya
de criterios que vimos en el apartado 3, en la historia consta que no fuma. A la hora de eva-
elaboración de criterios, debemos tender a que luar o medir el número de veces en que se da
sean explícitos, normativos, isovalentes y es- consejo a una gestante sobre tabaco, si son mu-
pecíficos, que son los que resultan en general chos los casos en que aparecen excepciones, no
más útiles y entendibles para iniciar activida- sabremos realmente si se da el consejo en un
des de mejora de la calidad. número suficiente de casos (porque tenemos
una muestra menor, solamente de aquellas que
5. Excepciones y aclaraciones a los realmente fuman). Probablemente habría que
criterios rediseñar el criterio dirigiéndolo solamente a
las que fuman o encadenándolo a la explora-
Una primera y elemental precaución para que ción sobre el hábito tabáquico.
los criterios sean válidos y fiables (es decir, que Si tenemos muchas excepciones, corremos
sean interpretados de igual manera por todos el riesgo de terminar no midiendo aquello para
los evaluadores) es definir lo más exhaustiva- lo que diseñamos el criterio.
mente posible las excepciones y aclaraciones
que los acompañan. 5.3. Las excepciones ¿son cumplimientos o
incumplimientos de los criterios?
5.1. Excepciones a los criterios
Otro problema que plantean las excepciones es
Hay circunstancias en las cuales no es exigi- la forma de valorarlas en la evaluación: Si a la
ble el cumplimiento del criterio, a estas cir- hora de la evaluación, las excepciones que apa-
cunstancias se las llama excepciones al criterio. recen las consideramos como cumplimiento
Por ejemplo, si el criterio es “los pacientes con del criterio, estamos perdiendo la información
otitis media aguda deberán ser tratados con real de lo que se está haciendo (no estamos mi-
amoxicilina y clavulánico en 1ª instancia”, una diendo aquello que queríamos medir). Vol-
clara excepción sería pacientes alérgicos a la viendo a nuestro ejemplo del consejo antitabá-
penicilina. Está claro que aunque la amoxici- quico en la embarazada, si evaluamos una HC
lina es el fármaco de elección, no debe darse de una paciente gestante que no fuma (excep-
a un paciente alérgico. Otro ejemplo frecuente ción), y lo consideramos como cumplimiento
• 90 •
del criterio, la evaluamos igual que si fuera cientemente detallada para que la persona que
una gestante fumadora a la que se dio consejo evalúa no tenga que hacer ningún juicio perso-
antitabáquico. En el primer caso no estamos nal sobre si un caso cumple o no un criterio de-
valorando el cumplimiento del criterio al dar terminado. Por ejemplo, un criterio sería: “los
consejo antitabáquico a la gestante (no estamos pacientes con urocultivo positivo deberán ser
midiendo aquello que queríamos medir). Por tratados en los tres días posteriores al cultivo.
otra parte, si no consideramos a las excepcio- Excepción: “paciente tratado en la visita ini-
nes como cumplimientos y les damos el mismo cial. Aclaración: urocultivo positivo significa
tratamiento que si no cumple el criterio, tam- ±100.000 o 105 colonias/cc registrado en el in- Es mejor, en general,
poco refleja la realidad de los hechos, ni deja forme del cultivo”. De esta forma, el evaluador considerar a las excepciones
ninguna opción de mejora. En nuestro ejem- no tiene que interpretar qué significa “urocul- como casos aparte, no como
plo, si en esas mujeres que no fuman decimos tivo positivo” cumplimientos del criterio.
que no cumplen con el criterio, tampoco esta- Ejemplo: criterio de exploración física: De lo contrario, pueden
mos reflejando fielmente la realidad porque “tener realizada una auscultación cardio- ser un importante factor
seguramente no se les dio consejo por no ser pulmonar y pulsos periféricos”. Al no haber de confusión al comparar
parte del grupo de riesgo. aclaraciones, este criterio también puede ser mediciones.
¿Qué decisión adoptar? Lo que parece problemático. Si sólo tiene realizada la auscul-
más lógico, en general, es considerarlas como tación y no los pulsos ¿cumple el criterio?; ¿es
cumplimiento de los criterios; sin embargo, suficiente poner normal o un símbolo alusivo
lo más recomendable es considerarlas aparte. o hay que detallarla?; ¿es suficiente con una lo-
De no hacerlo así, pueden ser un importante calización?
factor de confusión para las comparaciones en- Criterio de seguimiento de pacientes con
tre evaluaciones y entre centros; piénsese que alto riesgo cardiovascular: “tener realizado e
un cumplimiento alto de un criterio podría ser informado un ECG en los dos últimos años”.
debido a una proporción alta de excepciones, Sin aclaraciones, no está lo suficientemente cla-
más que a la realización concreta del criterio ro: ¿qué se entiende por ECG informado?; ¿es
en sí; podría incluso darse la paradoja de que suficiente poner normal o patológico?
en los pocos casos reales del criterio a medir, La existencia o no de aclaraciones, cuando
no se hiciera correctamente, mientras que en estas son necesarias, y la suficiencia de las mis-
otro centro o servicio con menos excepciones mas repercute directamente en la fiabilidad de
el cumplimiento real fuese mayor, pero apare- los criterios. La fiabilidad podemos definirla
cer disminuido por la baja proporción de ex- como el grado de reproducibilidad de los re-
cepciones. Un ejemplo claro, frecuente y real sultados cuando el criterio es utilizado por ob-
es comparar la calidad de los diagnósticos de servadores diferentes. Criterios sujetos a inter-
padecimientos crónicos, considerando como pretación diversa por distintos evaluadores no
cumplimiento de los criterios si el diagnóstico van a poder ser utilizados de forma fiable para
es antiguo o se ha realizado en otro nivel; la comparar evaluaciones ni dentro de los centros Las aclaraciones correctas
diversa proporción de estas excepciones entre ni entre centros. y exhaustivas evitan que
los diferentes centros a comparar, confunde la persona que evalúa
claramente el criterio de calidad que queremos 5.5. Inclusión de las excepciones y aclaraciones tenga que “interpretar” el
medir, si lo consideramos como cumplimiento. en el diseño de los criterios criterio; de este modo las
aclaraciones contribuyen a
que el criterio sea fiable.
5.4. Importancia de las aclaraciones Las excepciones pueden influir en la fiabilidad
y en la validez de los criterios como factores
Se entiende por aclaración al criterio la desde confusión y las aclaraciones influyen en la
cripción inequívoca de cualquier término que fiabilidad. Validez y fiabilidad son dos atribu-
aparezca en el criterio o sus excepciones que tos importantísimos para los criterios a medir.
pueda estar sujeto a interpretaciones. Para En consecuencia, además de que consideremos
garantizar el empleo exacto y repetible de los adicional y específicamente tanto validez como
términos técnicos, hay que definirlos explíci- fiabilidad, es muy aconsejable utilizar un for-
tamente. Hay que dar una definición lo sufi- mato para la descripción de criterios que inclu-
• 91 •
ya explícitamente excepciones y aclaraciones. 6.1. Validez facial, de contenido y de criterio

En caso de no ser necesarias se consignará así,
pero es conveniente asegurarse de que, al me- La validez facial, lógica o aparente hace re-
nos, reflexionamos sobre la necesidad de cons- ferencia a que el criterio parezca importante
tatarlas. Este formato de descripción de crite- para el problema a evaluar sin que sea preciso
rios que incluye excepciones y aclaraciones es dar muchas explicaciones; es su grado de re-
el que se describe en la figura 4.2. Si se utiliza es levancia obvia. No es un aspecto de la validez
La validez es el principal más probable que construyamos criterios váli- que determine la validez real, pero sí es una
atributo exigible a los dos y fiables, pero es conveniente considerar buena guía para priorizar y excluir criterios
criterios. El análisis aparte y explícitamente estas dos característi- obviamente no válidos. Los criterios tienen
de su presencia en un cas antes de dar por aceptado el criterio. que tener que ver con el problema de calidad
criterio puede realizarse a evaluar. Por ejemplo, el estado vacunal o los
considerando diversos tipos 6. Validez antecedentes de cáncer en la familia no parece
de validez de entre los que que sean relevantes como criterios de calidad
vamos a destacar la validez Un criterio válido es aquel que mide aquello para la anamnesis en el hipertenso.
facial, de contenido y de que está pensado que mida; es decir, aquel que La validez de contenido hace referencia a
criterio. mide realmente la calidad del servicio evalua- que el criterio mida el concepto que se quiere
do, de forma que su presencia es equivalente medir; en nuestro caso, sería asegurarnos que
a presencia de calidad, y sus diferentes valores está en relación con la calidad; es decir, que se
o niveles son sinónimos también de diferentes refiere a algunas de las dimensiones con las
niveles de calidad. En general, para ser válido que hemos definido calidad, y se relaciona con
debe estar clara su influencia en el resultado de las necesidades y expectativas de los usuarios.
la atención (cumplimiento de expectativas y ne- La valoración de este tipo de validez no dejará
cesidades de los usuarios del servicio) y deben de ser, sin embargo, de tipo fundamentalmente
de tenerse en cuenta los posibles factores de subjetivo, igual que la de la validez facial, pero
confusión (que hacen variar por sí solos el cum- también nos puede servir para descartar crite-
plimiento del criterio, sin que responda esta varios no claramente relacionados con el concep-
riación a actuaciones realmente diferentes). to o aspecto de calidad que queramos medir.
La validez es probablemente el principal Por ejemplo, si no hemos incluido la satisfac-
atributo exigible a un criterio. Para evaluar la ción del profesional como una de las dimensio-
calidad, no se trata de tener muchas medidas de nes del servicio que se ofrece al cliente externo,
validez y fiabilidad dudosa, sino de disponer de un criterio que la mida no tiene validez de con-
medidas clave válidas y fiables. La validez es un tenido para evaluar la calidad del servicio que
concepto ligado al error sistemático: si el criterio recibe el usuario externo. De igual manera, si
no es válido vamos a estar sistemáticamente mi- queremos medir la calidad científico-técnica,
La validez facial o aparente diendo una cosa diferente a la prevista. no serán válidos criterios que hagan referencia
hace referencia a la
relevancia del criterio a
primera vista. Debe ser
obvia su importancia sin
demasiadas explicaciones. Criterio Excepciones Aclaraciones
Descripción del referente Especificación de las situaciones Definición detallada de cualquier

que se va a utilizar como medición en las que es aceptable que el término del criterio, las excepcio-
(contenido del criterio) criterio no se cumpla nes, o de algo que pueda ser
interpretado de más de una
forma a la hora de evaluar
Figura 4.2. Formato para la descripción de criterios
• 92 •
a aspectos estructurales que tengan relación proponen como útiles para la valoración de re-
básicamente con la accesibilidad. comendaciones sobre decisiones terapéuticas,
La validez de criterio es el grado en que la de diagnóstico, preventivas, de pronósticos,
variable escogida se correlaciona con un crite- etc., pero en general la base común es valorar
rio de referencia objetivo, fiable y que esté am- el tipo y rigor de los estudios en que se basan.
pliamente aceptado como una buena medida En este sentido, uno de los primeros sistemas
del fenómeno de interés. En nuestro caso sería de valoración de la evidencia científica, aún de
la relación probada con un mejor resultado, si utilidad, es el que propuso la Canadian Task
es un criterio de proceso, con diferencias en el Force on Preventive Health Care (cuadro 4.3).
proceso si es un criterio de resultado y con fac- Esta clasificación fue modificada, amplián-
tibilidad del proceso si es un criterio de estruc- dola en la AHRQ, quedando como se muestra
tura. En ausencia de una medida de referencia, en el cuadro 4.4.
valorar una adecuada validez es un tema com- De todas formas, no es un tema cerrado y
plejo. Muchas veces resulta imposible usar este sigue trabajándose sobre ello a nivel interna-
abordaje por falta de estudios que lo avalen. cional. Merece la pena, en este sentido, citar la
Sin embargo, es de una gran importancia y de-
bemos procurar siempre reflexionar sobre ella.
La forma de realizarlo es evaluando la eviden-
cia científica que justifica los criterios. Lo ideal
es que pueda estar especificado el método em- Cuadro 4.3
Clasificación del nivel de evidencia científica
pleado para revisar las evidencias científicas
cuantitativas en las que se fundamenta; y que I. Evidencia obtenida de al menos un ensayo diseñado apropiadamente, aleatorizado
consten las fuentes de información utilizadas. y controlado.
Para evaluar el nivel de evidencia científica se II. Evidencia a partir de estudios no aleatorizados o no controlados.
han desarrollado diferentes sistemas de gra- II.1.- Evidencia obtenida de ensayos controlados bien diseñados, sin aleatorización.
duación que se basan generalmente en el tipo II.2.- Evidencia obtenida de estudios analíticos bien diseñados de cohortes o caso-
y calidad de los estudios de los que se derivan control preferiblemente de más de un centro o grupo de investigación.
II.3.- Evidencia obtenida de series múltiples de tiempo con o sin la intervención. Los
las recomendaciones clínicas o decisiones más resultados muy llamativos en experimentos no controlados pueden ser considera-
adecuadas en los distintos pasos del proceso dos también como evidencia de este tipo.
que se hayan analizado. Dado que estas mis-
III. Opiniones de expertos basadas en experiencia clínica, estudios descriptivos o infor-
mas recomendaciones, o decisiones más co-
mes de comités de expertos. Éste es el grado más bajo de validez.
rrectas, son las que podemos utilizar para cons-
truir los criterios que evalúen la calidad de la
atención, estos mismos sistemas de valoración
de la evidencia científica de las recomendacio-
nes clínicas nos van a ser útiles para referenciar
la validez de los criterios que midan la realiza- Cuadro 4.4
ción o no de esas recomendaciones. Clasificación del nivel de evidencia propuesto
Actualmente existen numerosos sistemas por la AHRQ
de valoración de la evidencia científica para Ia. La evidencia científica procede a partir de meta-análisis de ensayos clínicos contro-
respaldar la fuerza de las recomendaciones clí- lados y aleatorizados.
nicas. Una revisión realizada en el marco de la Ib. La evidencia científica procede de al menos un ensayo clínico controlado y aleato-
AHRQ estadounidense (http://archive.ahrq. rizado.
gov/clinic/epcsums/strengthsum.pdf) IIa. La evidencia científica procede de al menos un estudio prospectivo controlado,
encontró 109 documentos que proponían al- bien diseñado y sin aleatorizar.
gún tipo de sistema para valorar la calidad y el IIb. La evidencia científica procede de al menos un estudio casi experimental, bien
grado de evidencia correspondiente de los ar- diseñado.
tículos científicos, aunque muchos de ellos re- III. La evidencia científica procede de estudios descriptivos no experimentales, bien
feridos a un determinado tipo de estudio, y un diseñados como estudios comparativos, de correlación o de casos y controles.
total de siete sistemas de gradación general de IV. La evidencia científica procede de documentos u opiniones de expertos y/o expe-
la fuerza de la evidencia. Hay sistemas que se riencias clínicas de autoridades de prestigio.
• 93 •
iniciativa GRADE, que parece estar convirtién- utilizado por varios evaluadores o para más de
dose en un referente.* una evaluación.

Obviamente, es muy poco práctico anali- Para medir la fiabilidad se utilizan diver-
zar de forma exhaustiva la validez de todos los sos índices de acuerdo, generalmente fáciles de
criterios a utilizar; sin embargo, es necesario calcular e interpretar: índice kappa, índice de
al menos reflexionar sobre ello y cuestionarse concordancia general e índice de concordancia
aquellos que se hacen exclusivamente por con- específica. Si el criterio es fiable, estos índices
senso. Por otra parte, muchas de las decisiones deben ser elevados. El más extendido es pro-
a tomar en los procesos asistenciales no están, bablemente el estadístico kappa de Cohen que
no ya probadas sino ni siquiera estudiadas; no se usa para corregir el acuerdo debido al azar y
es incorrecto entonces basarse en el consenso permite estimar la significación estadística. Va-
para elaborar criterios, pero sabiendo que semos a ver cómo se calculan e interpretan cada
rían en cierto modo criterios provisionales. uno de ellos.
Cuando lo que vamos a explorar no son cri-
terios ya probados como requisitos de calidad, 6.3. Índice Kappa
sino lo que hemos llamado causas hipotéticas,
el propio diseño del estudio nos va a informar El índice kappa (k) mide la concordancia to-
(al medirlas concurrentemente con el criterio o tal que existe si excluimos la debida al azar,
indicador que representa el problema a evaluar) o el acuerdo real más allá del azar. Su cálculo
si tienen al menos validez interna; es decir, para responde a la fórmula general:
el entorno en que se realiza el ciclo de mejora.
Una vez hemos reflexionado sobre la vali- Po – Pe
dez, hasta dónde nos sea posible, lo que hemos k=
La fiabilidad se mide con de asegurarnos es que los criterios a emplear 1 – Pe
diversos índices como el sean fiables. Tenemos que considerar que el
kappa, la concordancia indicador o criterio que elijamos para repre- donde Po es la concordancia observada, y Pe
general y la concordancia sentar el problema a evaluar es efectivamente es la concordancia esperada debida exclusiva-
específica. válido y fiable, antes de la medición. mente al azar. El valor de k va de 0 a 1, aunque
pueden resultar también valores negativos,
6.2. Fiabilidad siendo 0 el valor que representa la concordan-
cia por azar, y 1 el valor de concordancia máxi-
Como ya hemos indicado más arriba, la fiabili- mo, que respondería a una fiabilidad perfecta.
dad podemos definirla como el grado de repro- Una vez calculados Po y Pe, el cálculo de k
ducibilidad de los resultados cuando el criterio puede realizarse según la fórmula indicada por
es utilizado por observadores diferentes. Crite- Fleiss tanto para parejas de evaluadores como
rios sujetos a interpretación diversa por distin- para el caso de evaluadores múltiples. Existen
tos evaluadores no van a poder ser utilizados otras alternativas, al parecer estadísticamente
de forma fiable para comparar evaluaciones más correctas que las fórmulas de Fleiss, para
ni dentro de los centros ni entre centros. Una el caso de que sean más de dos evaluadores,
descripción sin ambigüedades de todos los tér- pero considerablemente más complejas.
minos empleados en la definición del criterio o Veamos un ejemplo de cálculo del índice
indicador, así como una especificación clara de kappa para una pareja de evaluadores:
las excepciones y forma de medición, contribu- l Para obtener los datos necesarios, el cri-
yen a que los criterios o indicadores sean fia- terio cuya fiabilidad queremos conocer
bles. Sin embargo, es conveniente, o incuso im- es utilizado de forma independiente por
prescindible, que la fiabilidad sea comprobada dos evaluadores para evaluar las mismas
empíricamente, antes de generalizar el uso del historias clínicas. Vamos a suponer que
criterio o indicador. Particularmente si va a ser seleccionamos una muestra de 30; con los
resultados de los dos evaluadores pode-
* Dichas propuestas pueden consultarse en su página web: http://www.
mos construir una tabla en la que se refle-
gradeworkinggroup.org/ jan las veces que han coincidido en que el
• 94 •
criterio se cumple o que no se cumple. La Según el evaluador 2, la proporción de incum-

tabla, ya con los datos obtenidos en nues- plimiento es 15
tro ejemplo simulado, sería la siguiente: = 0.5
30
El producto de ambas = 0.67 x 0.5 = 0.335 es
igual a la suma de ambos productos
Evaluador 2
= 0.165 + 0.335 = 0
Evaluador 1 Cumple No cumple Con ello podemos calcular el índice Kappa
Cumple 9 1 10 Po – Pe 0.77-0.5
= = 0.54
No cumple 6 14 20 1 – Pe 1-0.5
Las prevalencias extremas
15 15 30 ¿Qué podemos concluir ante valores como hacen que el índice kappa
tienda a ser cero y su valor
este?, ¿es el criterio fiable o no? En esencia,
no se puede interpretar en
¿qué valores de kappa son adecuados? Como la forma habitual.
Esto quiere decir que, según el evaluador 1, respuesta, existen diversas escalas de valora-
10 historias cumplen el criterio y 20 no; mien- ción en la literatura pero en general, la mayoría
tras que para el evaluador 2, 15 historias cum- de los autores coinciden en dar por aceptables
plen el criterio y 15 no. Las celdas de la tabla kappas mayores de 0.4. Para ser buenos debe-
indican la distribución de los que cumplen y rían de ser mayores de 0.6. Por ejemplo, según
no cumplen según cada evaluador, en función criterio de Fleiss se considera que un kappa
de lo que dijo el otro. Así por ejemplo, de los traduce buena fiabilidad si es mayor o igual a
20 casos en los que el evaluador 1 dijo que el 0.6. Según Landis y Kock, un kappa negativo
criterio no se cumplía, en 14 coincidió con el o igual a cero indica acuerdo bajo o inexisten-
evaluador 2, y en 6 no coincidió porque el eva- te, hasta 0.2 acuerdo ligero, por encima de 0.4
luador 2 dijo que sí cumplía el criterio. acuerdo moderado, a partir de 0.6 acuerdo no-
La concordancia observada (Po) es el total table, a partir de 0.8 acuerdo alto y 1 acuerdo
de coincidencias, dividido por el total de casos absoluto. Según todos los autores, los kappas
evaluados. Según los datos de la tabla por debajo de 0.4 no son aceptables. El kappa
9 + 14 de nuestro ejemplo sería aceptable.
Po= = 0.77 es decir un 77%. ¿Y cuál
30
sería Pe, la concordancia esperada por puro 6.4. Circunstancias a valorar en la
azar? Pe se calcula sumando el producto de las interpretación del índice Kappa
proporciones de cumplimiento que han dicho
los dos evaluadores al producto de la propor- A pesar de su extendido uso, el índice kappa Para interpretar
ciones de incumplimiento. no está exento de inconvenientes. El valor y adecuadamente el índice
En nuestro ejemplo, según el evaluador 1, la interpretación del índice kappa deben ex- kappa, hay que tener en
la proporción de cumplimiento es presarse con algunas cautelas en relación con cuenta la prevalencia de lo
10 diversos factores que pueden hacerlo variar que mide el criterio que se
= 0.33 evalúa.
30 con independencia de la fiabilidad real del ins-
Según el evaluador 2 la proporción de cumpli- trumento (criterio o indicador) valorado. Estos
mento es factores son la prevalencia de la cualidad que
15
= 0.5 el instrumento mide, la sensibilidad y especifi-
30 cidad de los diversos evaluadores, y la propia
El producto de ambas = 0.33 x 0.5 = 0.165 adecuación de la fórmula aplicada cuando se
analiza la fiabilidad de más de dos evaluado-
Según el evaluador 1, la proporción de incum- res simultáneamente.
plimiento es La influencia de la prevalencia (o propor-
20 ción verdadera de presencia de la característica
= 0.67 evaluada) en el valor de kappa es que para pre-
30
valencias (expresadas en nuestro caso como
• 95 •
proporción de cumplimientos de los criterios) mejor medida es construir el instrumento de

cercanas a 1 o a 0, kappa tiende a ser cero con valoración con unas especificaciones para su
independencia del grado de acuerdo entre los manejo (excepciones, aclaraciones, mecánica
evaluadores, a menos que éste sea total, en de evaluación) lo suficientemente detalladas
cuyo caso el valor de kappa para prevalencia para que sea necesariamente fiable en las con-
de 1 o 0 es infinito. A la vista de los cálculos si- diciones normales de aplicación.
mulados realizados por diversos autores para El cálculo del valor de kappa para múltiples
diversas prevalencias, manteniendo constante evaluadores merece también un comentario. El
en cada caso la sensibilidad y especificidad de hecho de que la valoración del cumplimiento de
El índice kappa es los evaluadores, parece evidente que, como re- los criterios la efectúen más de dos observadores
relativamente sencillo
gla práctica general, el valor de kappa no debe aumenta la complejidad del cálculo y se pueden
de calcular, con base en
ser interpretado de la forma habitual para pre- utilizar modelos jerárquicos, o bien la fórmu-
el conocimento de la
concordancia observada y valencias menores de 0.15 o mayores de 0.85 la de Fleiss para más de dos observadores. La
la esperada por azar. Para En nuestro caso, como puede ser el caso en fórmula propuesta por Fleiss es cuestionada por
ser aceptable ha de tener la práctica la mayoría de las veces en que se pi- algunos autores, pero la complejidad del cálculo
un valor mayor de 0.4; para lote y evalúe la fiabilidad de los criterios o inde las fórmulas alternativas para varios evalua-
ser bueno ha de ser mayor dicadores para medir la calidad, la prevalencia dores, junto al hecho de que el kappa para dos
de 0.6 es inicialmente desconocida; lo que propone- evaluadores sigue sin cuestionar, aconseja basar
mos hacer, es estimarla con base en calcular nuestros cálculos rutinarios en los valores de ka-
la media de las prevalencias (proporciones de ppa por parejas. Si el pilotaje se realiza con más
cumplimiento) que propone cada evaluador. de dos evaluadores, puede calcularse kappa
Está claro que lo ideal es conocer previamente para las diversas combinaciones de parejas.
la prevalencia (proporción de cumplimientos Finalmente, la correcta interpretación del
real); sin embargo, aunque puede haber consi- índice kappa precisa del cálculo de su intervalo
derables desviaciones en relación al valor real, de confianza, de forma que daremos por acep-
las situaciones extremas van a ser identifica- tables sólo los kappas cuyo límite inferior del
das. En resumen y como norma, una correcta correspondiente intervalo de confianza sea ma-
interpretación de un índice kappa bajo necesi- yor de 0.4. El lector interesado puede encontrar
ta del conocimiento, o al menos de un cálculo la fórmula para calcular el intervalo de confian-
estimado, de la prevalencia de lo que valora el za para el índice kappa en el libro de Fleiss, in-
instrumento analizado; el valor de kappa sólo cluido en la bibliografía de este capítulo; tam-
deberá ser concluyente por sí solo si es alto: en bién puede dirigirse al sitio web.*
kappas bajos debemos asegurarnos de que no Después de todas estas aclaraciones y con
estamos ante prevalencias extremas.* sideraciones sobre las particularidades del ín
Unas correctas La sensibilidad y especificidad de los eva- dice Kappa vamos a ver los otros índices para
especificaciones de los luadores en relación a lo evaluado, general- valorar la fiabilidad.
criterios (excepciones, mente no es posible conocerla ni estimarla de
aclaraciones, mecánica
antemano, pero es, sin embargo, un factor tam- 6.5. Índice de concordancia general
de evaluación) ayudan a
evitar los problemas de
bién de potencial influencia en los valores de
las distintas sensibilidad kappa. De hecho, según cálculos simulados pu- Indica la concordancia de los evaluadores al
y especificidad de los blicados, si la sensibilidad de un evaluador (ca- clasificar el criterio. Se define como la propor-
evaluadores. pacidad de ver la existencia de la cualidad o ciónde casos en que el juicio de ambos evalua-
criterio si realmente está) fuese inferior al 70%, dores coincide. Se calcula dividiendo el núme-
el valor de kappa va a resultar necesariamente ro de acuerdos de ambos observadores por el
inferior a 0.4, porque la baja sensibilidad con- total de casos evaluados. Es equivalente a Po
duce por sí misma a discordancias. La manera o proporción de acuerdo observado, en la fór-
más común de normalizar (y elevar) la capaci- mula del cálculo de kappa.
dad discriminatoria de los evaluadores es en- Para su interpretación aislada para valorar la
trenándolos. En ausencia de entrenamiento, la fiabilidad hacen falta valores muy altos para que
* Una explicación detallada, así como la fórmula de ajuste del kappa por la prevalencia estimada puede verse en: http://www-users.york.ac.uk/~mb55/msc/
clinimet/week4/kappa.htm#seci (consultado en noviembre de 2015).
• 96 •
sea considerada buena. Según proponen Palmer 6.7. Procedimiento práctico para evaluar
y Banks concordancias >95% van a ser siempre la fiabilidad
sinónimos de herramientas fiables. Estos niveles
de concordancia son exigibles, así como kappas Una forma simple, intuitiva y pragmática para
como mínimo buenos (>0.6) cuando el criterio o la valoración de la fiabilidad es basarla inicial-
indicador se va a generalizar y utilizar para com- mente en el cálculo de la concordancia simple,
parar diversos centros en programas externos. y sólo si ésta no es alta (<95%) calcular el ín-
dice kappa, ya que en ocasiones concordancias El índice de concordancia
6.6. Índice de acuerdo específico sólo moderadamente altas van unidas a kappa general es la concordancia
aceptables. Además, el índice kappa debería observada. Son exigibles
valores muy elevados
Es el acuerdo al clasificar como negativo un acompañarse, como hemos visto, de un cono-
(mayores o iguales a
criterio (concordancia al decir que no se cum- cimiento previo o una estimación de la preva- 95%) para utilizarlo con
ple). Se calcula dividiendo el número de casos lencia de la cualidad que evalúa el instrumento seguridad como medida
en que ha habido acuerdo al decir que el cri- cuya fiabilidad queremos analizar. aislada de fiabilidad.
terio no se cumple, por el número de casos a La figura 4.3 contiene un esquema, en
los que al menos un observador ha dicho que forma de algoritmo, que proponemos para
no se cumple. Tiene interés cuando nos inte- valorar la fiabilidad de los criterios e indica-
resa especialmente que no se clasifique como dores, con base en la discusión que acabamos
incumplidores a quienes puedan estar hacién- de exponer.
dolo bien. Su interpretación es semejante a la
de la concordancia general.
Muestra de casos evaluada

de forma independiente
por dos o más evaluadores
(1)
Calcular concordancia
La valoración de la
¿≥95%?
Sí No fiabilidad puede exigir
la consideración de la
Indicador fiable Calcular kappa concordancia, el kappa
y la prevalencia, en una
secuencia práctica que
explicita la figura 4.3.
¿k - IC95%>0.4?
Sí No
Indicador fiable Considerar prevalencia
¿Es extrema?
Sí
No
(2)
Muestra de casos
de prevalencia conocida Indicador no fiable
y no extrema
(1): punto de inicio si la prevalencia es desconocida

(2): punto de inicio si conocemos previamente la prevalencia. Alternativamente puede ajustarse el valor kappa por la prevalencia
estimada
IC: intervalo de confianza
Figura 4.3. Procedimiento de análisis de la fiabilidad de los indicadores para medir calidad
• 97 •
BIBLIOGRAFÍA
• Fleiss JL. Statistical Methods for rates and proportiones. New York: John Willey & Sons, 1981. Cap 13.
• Hernández Aguado I, Porta Serra M, Miralles M, García Benavides F, Bolúmar F. La cuantificación de la variabilidad en las observa-
ciones clínicas. Med Clin (Barc) 1990; 95: 424-429.
• Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics 1977;33:159-174.
• Palmer RH. Evaluación de la asistencia ambulatoria. Principios y práctica. Madrid: Ministerio de Sanidad y Consumo, 1990. Cap. 8.
• Saturno PJ. Cómo diseñar una evaluación sobre la calidad asistencial en atención primaria. En: IV Congreso de la Sociedad Anda-
luza de Medicina Familiar y Comunitaria. Sevilla: Consejería de
• Salud, 1992.
• Thompson WD, Walter SD. A reappraisal of the kappa coefficient. J Clin Epidemiol 1988; 41(10): 949-958.
• 98 •
Anexo 4.1
Trabajo práctico recomendado: la construcción de criterios para evaluar la calidad. Análisis de validez
Se recomienda realizar un análisis de al menos un criterio para razonar y justificar su validez, siguiendo las siguientes indicaciones:
Paso 1. Construcción de criterios

Para comenzar, construir el listado de criterios que definen la calidad del servicio o aspecto del servicio a evaluar utilizando el
formato que incluye excepciones y aclaraciones (figura 4.2 de este capítulo). A continuación, seleccionar un criterio del listado
que se propone. Consignar este criterio seleccionado en el formato que se adjunta, en el cual se irán anotando también los
resultados de los pasos sucesivos del trabajo práctico que son los siguientes.
Paso 2. Reflexionar sobre la validez facial, de contenido y de criterio

l Validez facial: ¿se entiende la relevancia del criterio a primera vista? Justificar brevemente por qué son importantes los
criterios elegidos para la calidad del servicio o aspecto del servicio a evaluar.
l Validez de contenido: ¿se refiere claramente a algunas de las dimensiones del concepto de calidad?, ¿su
cumplimentación satisface algunas de las necesidades o expectativas de los usuarios?
l Validez de criterio: ¿conocemos alguna fuente o estudio en donde se demuestre la evidencia científica del criterio? ¿qué
tipo de evidencia es, según la clasificación señalada en este capítulo?
Paso 3. Excepciones y aclaraciones.

l ¿Son suficientes? En caso negativo, completar el criterio elegido hasta que contenga las excepciones y aclaraciones que
se consideren necesarias para que tenga el máximo de objetividad.
l Si se va a realizar el trabajo en grupo, discutir y acordar con todos los implicados hasta lograr una descripción definitiva
de los criterios seleccionados, con excepciones y aclaraciones.
l Pensar en situaciones en las que es aceptable que el criterio no se cumpla (excepciones) y si todos los términos del
criterio y las excepciones se pueden interpretar de forma unívoca a la hora de emplearlas para evaluar.
• 99 •
Capítulo 5
Diseño de estudios de nivel de calidad
y la investigación de causas.
Componentes de una evaluación
Contenido general y objetivos específicos 10. Muestreo aleatorio simple. Metodología, ventajas e inconvenientes
1. Introducción 11. Muestreo sistemático. Metodología, ventajas e inconvenientes
2. Estudios del nivel de calidad y estudios de causas de la calidad 12. Muestreo estratificado. Metodología, ventajas e inconvenientes
deficiente 13. Muestreo de conveniencia. Metodología, ventajas e inconvenientes

3. Diseño de estudios del nivel de calidad: componentes por 14 Tipo de evaluación, según relación temporal con la acción evaluada
especificar 15. Tipo de evaluación, según quién toma la iniciativa
4. Criterios, dimensiones y tipos de datos 16. Tipo de evaluación, según quién obtiene los datos
5. Definición de las unidades de estudio Anexo 5.1. Número de casos necesarios para asegurarse un determinado
6. Fuentes de datos intervalo de confianza de 95%, según diversos valores esperados de la
7. Identificación y muestreo de las unidades de estudio. Determinación variable que se mide
del marco muestral. Ventajas e inconvenientes del muestreo Anexo 5.2. Intervalo (i) para un grado de confianza de 95%, según
8. Número de casos necesarios. Representatividad, precisión y estimación puntual y tamaño muestral
confianza de la muestra Anexo 5.3. Práctica recomendada. Formato para el diseño del estudio de
9. Métodos de muestreo nivel de calidad

2 Identificación
Monitorización
Elaboración
medir calidad

Capítulo 10 Evaluación del nivel de evaluación del nivel Capítulo 5 5
Capítulo

Capítulo 8 Diseño
de intervención



Contenido general
Una vez establecidos los criterios o requisitos de calidad de los aspectos por evaluar, hemos de
diseñar cuidadosamente su medición. Veremos en este capítulo que los estudios de evaluación de
la calidad pueden tener diversos niveles de complejidad, pero que podemos agruparlos en dos que
denominamos, a falta de una terminología mejor, estudios del nivel de calidad y estudios de causas
de calidad deficiente. Se explica más en detalle el primero de ellos, que consiste en medir el nivel de
presencia de los criterios o requisitos de calidad preestablecidos, característico de las evaluaciones
de la calidad de la atención clínica. Se ofrece asimismo un esquema detallado de los componentes
del estudio que deben quedar bien definidos sea cual sea el servicio o producto objeto de
evaluación. En otro capítulo se abordan las características de los estudios de causas, más adecuados
para problemas de tipo organizativo o gerencial, en los que no hay más criterios, requisitos o
indicadores de calidad que el que represente el problema que se va a analizar.
1. Diferenciar los diversos tipos de estudio que pueden diseñarse para evaluar la calidad, en
especial, aquéllos que miden requisitos de calidad, por un lado, y aquéllos que buscan causas
de calidad deficiente, por el otro.
2. Definir las características de las unidades de estudio (casos) en las que se va a realizar la medi-
ción.
3. Distinguir entre marco temporal para el muestreo de los casos y periodo de tiempo en el que
los criterios deben cumplirse.
4. Determinar si todos los criterios se miden en idénticas unidades de estudio o no.
5. Definir cuáles van a ser las fuentes de los datos que se necesitan en el estudio.
6. Determinar el número de casos que se van a evaluar.
7. Valorar las ventajas e inconvenientes de utilizar diversos tamaños de muestra.
8. Explicar en qué consiste una muestra representativa.
9. Distinguir muestreos aleatorios de muestreos de conveniencia.
10. Escoger el método de muestreo que más se ajuste al contexto de su centro.
11. Desarrollar paso a paso la metodología para extraer la muestra.
12. Definir quién debe encargarse de recoger los datos.
13. Resumir, en el diseño del estudio, las decisiones tomadas en relación con la dimensión de la
calidad que se va a evaluar y los tipos de datos que se van a utilizar.
Diseño de estudios de nivel de calidad Capítulo
y la investigación de causas. 5
Componentes de una evaluación
En este capítulo se avanza

1. Introducción nal o gerencial (tiempo de espera, descoordina-
un paso más en el ciclo de
ciones en el equipo, procesos innecesariamente
mejora: el diseño de estudio
En previos capítulos, hemos tomado decisio- complicados, etc.). Podemos incluso tenerlo ya para medir calidad.
nes importantes y se han resumido las implica- medido en términos de lo que representa el
ciones teóricas y prácticas en relación con los problema de calidad, pero para su mejora tene-
primeros tres pasos de los ciclos de mejora: la mos que averiguar las causas que lo provocan.
identificación del problema de calidad u opor- Esta situación también puede darse después
tunidad de mejora (capítulo 2), el análisis del de los estudios de nivel de calidad, si no sabe-
problema seleccionado (capítulo3) y la elabo- mos qué hacer para mejorar un determinado
ración de criterios válidos y fiables para medir criterio clínico que no se cumple. En ambos
la calidad (capítulo 4). Este capítulo aborda el casos, lo que tenemos es una serie de causas
paso siguiente: diseñar adecuadamente la re- hipotéticas que investigar, pero no la certeza
cogida de datos para estudiar y cuantificar el de que su presencia o ausencia vaya unida a la
problema de calidad. presencia o ausencia de calidad, como ocurre
en los estudios que hemos llamado del nivel
2. Estudios del nivel de calidad y estudios de calidad. Por ejemplo, si determinamos que
de causas de la calidad deficiente el tiempo de espera para la consulta es crite- En los estudios de causas
rio de calidad y queremos medir la proporción hipotéticas no sabemos si
Hay dos grandes grupos de estudios cuyos de pacientes que esperan más de un cierto éstas influyen o no en la
resultados nos van a servir para decidir qué tiempo, diseñaríamos un estudio de nivel de calidad.
hacer para mejorar: los estudios del nivel de calidad. Si, por el contrario, ya sabemos que
calidad y los estudios de causas hipotéticas de el tiempo de espera es excesivo y no tenemos
la calidad deficiente. Con los primeros medi- idea de por qué es así, diseñaríamos un estudio
mos el grado de cumplimiento de los criterios para averiguar, de todas las causas hipotéticas
o requisitos de calidad previamente definidos, (dependientes del paciente, de la organización
cuyo grado de presencia o ausencia sabemos del centro, de los horarios, de las normas, etc.),
que equivale al grado (o nivel) de calidad de cuáles se asocian a tiempos de espera prolon-
lo que vamos a evaluar. Normalmente, éste es gados en nuestro caso concreto. En los estu-
el caso de las evaluaciones de calidad de pro- dios de causas hipotéticas es necesario medir
blemas de atención clínica, con los cuales com- concurrentemente con las posibles causas, el
probamos si estamos haciendo las cosas de criterio o los criterios que nos representan la
forma correcta. En estos estudios medimos di- calidad del aspecto en estudio. Por ejemplo, no
rectamente lo que sabemos que son requisitos podemos averiguar las causas de los tiempos En los estudios del nivel de
(transformados en criterios o indicadores) de de espera prolongados si no medimos a la vez calidad medimos criterios
calidad. las causas por indagar y los tiempos de espe- de los cuales se sabe de
Una situación diferente ocurre cuando el ra a los que se asocian. Por esto, el estudio de antemano que están
problema no es de tipo clínico sino organizacio- causas debe ir precedido de la definición de los relacionados con la calidad.
• 105 •
En este capítulo nos criterios o indicadores de calidad del problema - número de casos
ocuparemos del diseño en estudio; estos mismos criterios o indicado- - método de muestreo
de un estudio de nivel de res son los que tendremos que medir tras la 7. Tipo de evaluación
calidad. intervención para asegurarnos de que hemos - según relación temporal
mejorado. - según quién tomó la iniciativa
En este capítulo, se detallan los compo- - según quién obtiene los datos
nentes de un estudio de nivel de calidad con
el objetivo de averiguar hasta qué punto se Varios de estos componentes han sido vistos
cumplen o no los criterios de calidad elegidos; en capítulos anteriores y haremos una breve
sabremos de antemano que la ausencia de es- reseña de los mismos; revisaremos los demás
tos criterios es directamente causa de calidad con mayor detalle.
deficiente. Los aspectos metodológicos son se-
mejantes en los estudios de causas hipotéticas 4. Criterios, dimensiones y tipos de datos
en lo que se refiere al estudio del nivel de ca-
lidad del que se parte, aunque difiere el análi- Para diseñar nuestra evaluación, hay que em-
sis de datos para el cual necesitamos ver, en el pezar por definir estos tres componentes. Los
caso de los estudios de causas hipotéticas, la criterios, traducción de los requisitos de cali-
relación del nivel de calidad con las diversas dad, han sido tratados en el capítulo 3 y las
causas hipotéticas en estudio. Los estudios de dimensiones, en el capítulo 1. Es aconsejable
causas hipotéticas son el objeto del capítulo 6. revisar estos capítulos, aunque a continuación
vayamos a recordar los puntos más relevantes
3. Diseño de estudios del nivel de calidad: para el diseño del estudio.
componentes por especificar
Se propone un esquema 4.1. Criterios
de componentes que Los estudios sobre calidad han de ser una acti-
conviene definir separada y vidad rigurosa, planificada y factible. Para ase- Los criterios son la herramienta con la cual me-
exhaustivamente. gurarnos de que es así, resulta útil seguir una diremos la calidad. Su aplicación nos sirve para
cierta sistemática, que nos ayude a considerar discernir entre buena y mala calidad y entre los
todos los aspectos que son relevantes en su diferentes niveles de ésta. Hay que recordar
realización. Adicionalmente, la especificación que, en la práctica, aceptar unos criterios deter-
homogénea de los componentes del estudio minados, equivale a establecer y a aceptar asi-
sirve para poder replicarlo y para comparar mismo unos determinados objetivos de calidad
evaluaciones posteriores de un mismo centro en la asistencia que prestamos. Un criterio es
o realizadas en centros distintos. a la vez un requisito de calidad que queremos
El esquema que proponemos tiene sus que se cumpla; de ahí la tremenda importancia
raíces en el Programa Ibérico, modificado con de que sean relevantes, realistas y con posibi-
base en experiencias posteriores. Consta de lidad de ser aceptados sin controversia por to-
una serie de componentes, la mayoría de los dos los profesionales implicados. Una correcta
cuales están interrelacionados; sin embargo, elaboración y selección de criterios es, junto a
conviene considerarlos aisladamente y procu- una priorización adecuada del tema que se va
rar su definición exhaustiva. Una vez defini- a evaluar, el principal factor determinante del
dos todos, queda también definido el diseño éxito o del fracaso del ciclo de mejora.
de la evaluación. Estos componentes son: En el capítulo 4 revisamos una serie de
1. Criterios para evaluar la calidad características que hay que considerar en re-
2. Dimensión estudiada lación con los criterios. En este punto es con-
El primer componente 3. Tipos de datos veniente revisarlas de nuevo y explicitar las
es la descripción de los 4. Unidades de estudio que definitivamente queremos medir, como
criterios que se van a 5. Fuentes de datos el primero de los componentes del diseño de
utilizar, especificando las 6. Identificación y muestreo de las unidades nuestro estudio. Es importante que no olvide-
excepciones y haciendo las de estudio mos considerar su validez, las excepciones y
aclaraciones necesarias. - marco muestral las aclaraciones pertinentes.
• 106 •
Diseño de estudios de nivel de calidad y la investigación de causas. Componentes de una evaluación
4.2. Dimensiones En el diseño del estudio hay que hacer El segundo componente
explícita la dimensión que hemos decidido es aclarar qué dimensión
A la vista del aspecto que se va a evaluar y de medir. Con ello aclaramos también cuál es la o dimensiones (calidad
los criterios que vamos a medir, hemos de des- dimensión concreta que intentamos mejorar científico-técnica,
y avisamos implícitamente sobre las dimen- accesibilidad, atención
cribir cuál de las varias dimensiones de la cali-
centrada en el paciente,
dad vamos a valorar. siones que van a escapar a nuestra medición;
seguridad) habremos de
Como vimos en el capítulo 1, proponemos es decir, sobre las que no podremos afirmar si evaluar.
el uso de un listado de seis dimensiones (efec- están o no presentes, ni si conseguiremos o no
tividad, eficiencia, seguridad, atención centra- mejorar. Naturalmente, se asume que, aunque
da en el paciente, accesibilidad equidad) o de no haya cambios en las otras dimensiones, la
uno reducido de cuatro dimensiones (calidad mejora de una de ellas supone un salto cualita-
científico-técnica, seguridad, accesibilidad y tivo en el servicio que ofrecemos.
atención centrada en el paciente).
La mayoría de las evaluaciones que rea- 4.3. Tipos de datos
lizan los profesionales incluyen la medición,
muchas veces como única dimensión, de algún Los criterios por utilizar van a estar referidos
aspecto de la calidad científico-técnica. Esto es a datos de estructura, proceso o resultado.
así no sólo porque es la dimensión más amplia Hacerlo explícito como uno de los componen-
y con más subcomponentes; también influye el tes del diseño permite recordar la necesaria
que sea la que se ve más cercana a la actua- reflexión sobre los problemas de validez que
ción de los profesionales y sobre la que más puedan plantear cada uno de ellos. También
directa y fácilmente podemos actuar. Es tam- es conveniente constatarlo para dejar claro que
bién la dimensión más comúnmente aceptada sabemos de la existencia de otros datos po-
como indiscutible para caracterizar la calidad tencialmente relevantes que no se tomarán en
de la atención prestada. Sin embargo, no debe cuenta.
olvidarse la importancia de garantizar asimis- La distinción de estructura, proceso y re-
mo unos niveles adecuados de accesibilidad y sultado, propuesta por Donabedian y profu-
satisfacción: accesibilidad tanto interna (en el samente utilizada en el sector salud, no forma
sentido de la existencia o inexistencia de barre- parte de la terminología utilizada normal-
ras a la continuidad de cuidados) como exter- mente en sectores de la industria pero reviste
na, si pensamos que actuamos sobre poblacio- un gran interés por las diferentes precaucio-
nes y no exclusivamente sobre pacientes que nes que hay que tomar en cuanto a su validez,
nos visitan; y atención centrada en el paciente y para tener argumentos en las discusiones El tercer componente es la
unida a la satisfacción, como un resultado por que periódicamente aparecen dando prefe- constatación explícita del
conseguir para garantizar la adecuada y nece- rencia a uno u otro tipo de datos. El resumen tipo de datos (estructura,
saria colaboración de los pacientes y población de estos tres tipos de datos se describe en el proceso, resultados) que
en los programas y tratamientos. cuadro 5.1. vamos a utilizar.
Cuadro 5.1
Validez, facilidad de obtención y utilidad inmediata de los diferentes tipos de datos
Tipo de dato Validez Facilidad de obten- Utilidad inmediata
ción
Estructura Es condición necesaria pero no suficiente +++ +++
Proceso Depende, ver relación con el resultado ++ +++
Resultado - Depende, ver relación con el proceso

+ +
- Es preciso ajustar para eliminar factores de confusión
• 107 •
Las unidades de estudio 5. Definición de las unidades de estudio del proceso asistencial, tiempo de contacto
se delimitan definiendo o relación entre cada caso que entra en el
las características de la La descripción de la unidad de estudio para estudio y el nivel asistencial evaluado, en
población que recibe la el cual queremos que se vea cumplido el
la evaluación es el equivalente a la definición
atención evaluada, los criterio de calidad que vamos a medir. Por
de caso por evaluar. Se trata, en esencia, de
proveedores de la atención
determinar cuáles son las características de la ejemplo, podemos definir que en nuestro
y el tiempo en que la
atención tiene que haber unidad básica, más desagregada, sobre la que programa de detección precoz de cáncer de
sido prestada a cada vamos a efectuar la medición de los criterios mama, la exploración de mama debe rea-
paciente. de calidad asistencial. lizarse en la primera visita de toda mujer
Habitualmente, tendremos que especificar incluida el grupo de edad que hemos defi-
tres aspectos: nido. De este modo, el periodo de tiempo
l Características del paciente o población que en- que define nuestra unidad de estudio es
tra en la evaluación, coincidente con el gru- una visita, y más concretamente, la primera
po población objeto o receptor de la aten- visita a nuestro centro, de manera que al
ción que evaluamos. Este grupo puede obtener los datos para nuestra evaluación
ser definido en función de su edad, sexo, no vamos a fijarnos en las actuaciones rea-
pertenencia a determinado grupo de ries- lizadas en visitas sucesivas. En otros casos,
go, diagnóstico de determinada enferme- especialmente en el seguimiento de enfer-
dad, sometido a determinado tratamiento medades crónicas, podemos plantearnos
o intervención, etc. Por ejemplo, en el caso evaluar la atención prestada en un año,
de la evaluación de la atención preventiva en las visitas siguientes al diagnóstico, etc.
del cáncer femenino, podemos decidir que Otros criterios pueden no tener referencia
será objeto de estudio la atención recibida temporal, como es el caso de muchos de
en este sentido por toda mujer mayor de los criterios de estructura.
18 años residente en nuestra área de co-
bertura, o bien que haya acudido al menos En una evaluación con varios criterios, es per-
una vez a nuestro centro sanitario; para la fectamente posible que cada uno de ellos se
detección de hipertensos, todos los adscri- refiera a periodos de tiempo o segmentos del
tos a nuestro centro y que pertenezcan a proceso diferentes.
ciertos grupos de edad, etcétera. Normalmente se define un marco tempo-
l Características de los profesionales y nivel asis- ral más amplio (por ejemplo, el último año de
tencial evaluado. Por ejemplo, un médico de funcionamiento del centro), para acotar de ma-
un determinado centro o servicio, todos nera general la extracción de casos para la eva-
los médicos de un centro o servicio, el per- luación pero que no define el periodo evaluado
sonal de enfermería, el personal de fisio- en cuanto a la atención prestada en el proble-
Para evitar la confusión terapia, todo el equipo de atención prima- ma concreto que queremos evaluar. Hay que
entre el periodo de tiempo ria, todos los centros de un área, etcétera. hacer un esfuerzo por reflexionar ante cada
como marco temporal para Como en el caso anterior, esta característi- criterio si lleva o no un periodo de tiempo con-
definir el universo de donde ca es excluyente: sólo vamos a considerar creto, dentro del proceso asistencial, en el que
extraer los casos (un año, aquellos casos poblacionales de caracterís- evaluamos si se cumple o no. Puede coincidir
seis meses, etc.) y el periodo ticas determinadas que además hayan de- o no con el marco temporal que definimos para
de tiempo como fragmento el marco muestral, es decir, para la extracción
pendido, en relación con el problema, de
del proceso asistencial en de casos por evaluar.
una determinada instancia o nivel asisten-
el que vamos a comprobar
cial, que es el que evaluamos. La experiencia nos ha mostrado que este
si el criterio se cumple (una
visita, un cierto tiempo l Periodo de tiempo evaluado. Coordenada aspecto de la definición de la unidad de estu-
tras el diagnóstico, etc.) que no hace referencia necesariamente al dio es el más difícil de entender y especificar,
es conveniente reflexionar tiempo físico convencional (un año deter- especialmente cuando se quiere evaluar la
sobre ello criterio a criterio. minado, un mes, etc.), sino al segmento atención en casos de pacientes crónicos.
• 108 •
6. Fuentes de datos dos como un medio más para lograr una buena A continuación hay que
asistencia y no como un fin en sí mismos. describir de qué fuente
En nuestro diseño tenemos que hacer explícito vamos a identificar los casos
de dónde va a ser posible extraer los datos que 7. Identificación y muestreo de las (listados, libros de registro,
unidades de estudio. Determinación censos, etc.) y de dónde
necesitamos para la evaluación. En evaluacio-
extraer los datos para la
nes retrospectivas, muy probablemente vamos del marco muestral. Ventajas e
evaluación. Hay que evitar,
a utilizar las historias clínicas o cualquier otro inconvenientes del muestreo en lo posible, crear fuentes
sistema o soporte de registro de datos en rela- de datos.
ción con el tema evaluado. Otra fuente de datos Una vez definida la unidad de estudio, nos
frecuente (a veces obligada por el tema o por la hemos de plantear los mecanismos para iden-
inexistencia de registros sobre el dato de inte- tificar los casos de pacientes o población que
rés, o porque lo que nos interesa es lo que pue- responden a la definición de caso, y el marco
de decirnos el usuario) son las encuestas ad hoc. muestral o universo de donde extraeremos, en
En otras ocasiones (habilidades manuales, téc- su caso, una muestra representativa de éstos
nicas de entrevista clínica, etc.), la evaluación para su evaluación. Los mecanismos de iden-
sólo es posible mediante observación directa. tificación de casos y la facilidad relativa para
En cualquier caso, una regla que hay que realizar un muestreo varían según el tipo de
seguir siempre es procurar comenzar diseñan- atención por evaluar y según las características
do criterios que puedan ser cualificados con de cada centro.
los datos o sistemas de registro ya existentes. Frecuentemente, sobre todo en los casos
En aras de la factibilidad (y su correspondien- en los que la atención que se va a evaluar se
te repercusión en el éxito de la implantación encuadra en un determinado programa o gru-
de las actividades de GC), hay que procurar po bien definido (hipertensión, diabetes, enca-
no empezar con evaluaciones que precisen el mados en domicilio, niño sano, pacientes con
montaje de nuevos registros o la realización de cervicalgia etc.), existen ficheros específicos
encuestas complicadas. que facilitan el muestreo e identificación de
Desafortunadamente, el relativo déficit de los casos por evaluar. Otras veces, es posible
buenas fuentes de datos limita con frecuencia utilizar a tal efecto los registros de morbilidad,
las posibilidades y la extensión de las evalua- o cualquier otro registro rutinario en el que
ciones de la calidad asistencial. En relación con conste explícitamente la característica que de-
ello, es común encontrar, como la primera o fine la unidad de estudio. Otras veces, el uni-
una de las primeras actividades de GC en los verso para muestreo e identificación de casos
centros sanitarios, la evaluación de la calidad han de ser directamente las historias clínicas o
de los registros e historias clínicas. Sin quitarle un muestreo aleatorio de la población cubierta
mérito a esa actividad, pensamos que, una vez o atendida. Todo depende del tema concreto
garantizada la existencia de registros, es más que se va a evaluar, la definición que hagamos
efectivo que los déficits que tengan aparezcan de la unidad de estudio y las características es-
evidentes en función de su repercusión en la tructurales de cada centro.
buena o mala asistencia que se presta a un pro- Es aconsejable tener presentes, muy en
blema de salud determinado (por ejemplo, re- primer término, las posibilidades de identifi-
Es aconsejable tener
gistro de edad y sexo para saber si la persona cación de casos y obtención de los datos perti-
muy claro en el diseño la
es susceptible de entrar en un Programa de de- nentes al escoger el tema y diseñar los criterios delimitación del universo
tección precoz de cáncer femenino, registro de para evaluar: en primera instancia es preferible o marco muestral y
peso y talla y resultados de la analítica en pa- abordar evaluaciones con criterios aplicables a la factibilidad de los
cientes cuyo diagnóstico, tratamiento o segui- casos de identificación posible y fácil, aunque mecanismos para la
miento adecuados dependen precisamente del resulten menos atractivas que otras para las obtención de los casos a
conocimiento explícito de esos valores, etc.); que el proceso de identificación de casos pue- evaluar y los datos para la
de hecho los registros han de ser contemplada resultar costoso o complicado. evaluación.
• 109 •
Evaluar con muestreo es Si el total de casos (universo o marco decidido si nos interesa que sea un profesional
una manera eficiente y muestral) que responde a la definición de uni- individual, un equipo, todo el centro, etcétera;
útil de tener datos, que se dad de estudio es pequeño o disponemos de con ello hemos contribuido a definir también
convierte en obligatoria si el toda la información en base de datos informa- el marco muestral. Sin embargo, esta decisión
universo de casos o marco tizados, podemos plantearnos la posibilidad tiene además una gran trascendencia para de-
muestral es muy grande.
de evaluarlos todos; sin embargo, por lo gene- terminar el tamaño de la muestra: el número
ral es más conveniente extraer una muestra. de casos que decidamos extraer nos va a per-
El muestreo, aparte de ser el proceder de mitir obtener conclusiones sobre la calidad al
elección cuando el universo de unidades de nivel organizativo que previamente hayamos
estudio es relativamente grande, y obligatorio decidido, pero no a un nivel inferior. Es decir:
cuando es muy grande, tiene la ventaja de que una muestra pensada para evaluar la calidad
es menos costoso (por lo menos en tiempo) que de atención al nivel de centro sanitario no va
evaluar la totalidad de casos, y permite obte- a servir para evaluar a cada profesional por
ner resultados útiles a corto plazo. Los incon- separado. Si queremos evaluar cómo lo hace
venientes, si es que puede llamárselos así, son, cada médico, enfermero o fisioterapeuta, va-
por un lado, que para hacerlo correctamente mos a necesitar el mismo tamaño de muestra
hay que manejar con cierta soltura unos con- pensado para el centro, pero para cada uno de
ceptos estadísticos básicos; por otro, que puede los profesionales individuales. Es factible la
haber escépticos que no terminen de dar crédito agrupación de muestras pensadas para nive-
a los resultados por el simple hecho de ser una les organizativos más bajos para evaluar nive-
muestra. Es muy aconsejable prepararse para les superiores (por ejemplo, agrupar los datos
En las evaluaciones de afrontar estos dos inconvenientes porque las de cada médico para evaluar el centro), pero
calidad solemos utilizar ventajas superan con mucho los esfuerzos que no al revés. Hay que tener esto muy claro y
inicialmente muestras puede suponer el poder evaluar con muestras. muy en cuenta al diseñar el estudio.
manejables, relativamente
pequeñas (50 a 60 o hasta 8. Número de casos necesarios. 8.2. Representatividad, precisión y confianza
100 casos) pero no exentas Representatividad, precisión y confianza de la muestra
de rigor científico. de la muestra
Estos tres conceptos, con estos y otros nom-
La definición del número de casos o unidades bres, suelen considerarse relacionados con el
de estudio necesarios para la evaluación es uno tamaño de la muestra y se utilizan a veces de
de los puntos que más angustia produce al di- forma confusa e intercambiable, aunque son
señar una muestra. Es también un punto en el diferentes. Vamos a aclarar su significado.
cual, el enfoque aconsejable para los estudios Supongamos que estamos interesados
de evaluación de la calidad puede diferir sus- en saber la altura media de los pacientes que
tancialmente del recomendado para trabajos de están en un determinado día en las salas de
investigación de otro tipo. Podemos adelantar espera de un centro de salud grande. Si qui-
que un tamaño de muestra manejable y habi- siéramos saberlo con toda exactitud, mediría-
tualmente suficiente es de 50 a 60 casos, y como mos la talla de todos ellos y calcularíamos la
máximo 100, pero conviene entender por qué media; en este caso, como no es una muestra,
y aprender a extraer la muestra de forma que no habría problema de representatividad, pre-
sea representativa. Para ello, tras decidir cuál cisión ni confianza del resultado. Pero, ¿y si
es el nivel o unidad organizativa para la cual son cientos de personas? Podemos considerar,
queremos extraer conclusiones, hay que tener entonces, la posibilidad de hacer una estima-
El tamaño de muestra
claros los conceptos de confianza, precisión y ción midiendo la talla sólo en una muestra de
decidido para evaluar
niveles organizativos representatividad de la muestra. estas personas. Al ser una muestra, el resulta-
superiores (por ejemplo, do que obtengamos está sujeto a errores, pero
centro sanitario) no sirve 8.1. Unidad organizativa para la que queremos esos errores pueden conocerse y controlarse
para evaluar niveles más extraer conclusiones de manera que los tengamos en cuenta a la
desagregados (por ejemplo, hora de dar los resultados de nuestro mues-
cada médico del centro). Al definir la unidad de estudio en lo relativo treo. Estos errores son de tres tipos y se rela-
al proveedor del servicio que se evalúa, hemos cionan con la representatividad, la precisión y
• 110 •
la confianza de los resultados o estimaciones tra con un intervalo de valores, dentro del cual La representatividad, la
de la muestra. sabemos (por la teoría de la probabilidad) que precisión y la confianza
El primer error que podemos tener es hacer está el valor real de lo que estamos midiendo, representan tres tipos de
una selección sesgada de las personas que in- aunque no sepamos a ciencia cierta cuál de errores diferentes que
cluimos en la muestra. Por ejemplo, suponga- los valores incluidos en el intervalo es el real podemos tener al medir con
muestreo.
mos que seleccionamos todos de las consultas (¡para eso tendríamos que medir a todos, no
de pediatría. Obviamente, esta muestra no es a una muestra!). Cuanto más pequeño sea el
representativa de los pacientes que esperan en intervalo que nos resulta, más precisa será
las consultas del centro de salud, y esto con in- nuestra estimación, es decir, más pequeño será
dependencia de cuántos niños hayamos incluido este error de muestreo. Lógicamente, la esti-
en la muestra. El problema, el error, es que en mación va a ser más precisa con intervalo de
nuestra muestra los niños están sobrerepresen- posibles valores reales más pequeño (menos
tados, hayamos medido muchos o pocos. Para error) cuanto más grande sea la muestra. En
ser representativa tendríamos que haber hecho nuestro ejemplo, a cuanta más gente midamos
la selección de casos para la muestra de manera la talla, más se acercará nuestra estimación al
La representatividad hace
que todos los pacientes de todas las consultas valor real; los cálculos matemáticos oportunos
referencia al error de sesgo
hubieran tenido la misma oportunidad de en- nos mostrarían que podemos dar nuestra esti- y no depende del tamaño
trar en la muestra, y no únicamente los de pe- mación con intervalos de valores posibles cada de la muestra sino del
diatría. El control del error de sesgo para que la vez más pequeños. método de obtención de la
muestra sea representativa depende del méto- Pero aún nos queda otra posibilidad de misma.
do de muestreo, no del tamaño de la muestra. error: ¿hasta qué punto estamos seguros de que
La muestra va a ser representativa (no sesgada) el valor real está realmente comprendido en
si se ha realizado de forma aleatoria, lo cual el intervalo de valores que hemos calculado?
equivale a decir que se le da a todas las unida- Está claro que sólo tendremos 100% de certeza
des del universo muestral la misma oportuni- si medimos a todos los pacientes que esperan.
dad de entrar en la muestra. Otra cosa es, una Como hemos obtenido una muestra, tenemos
vez que nos aseguramos de que la muestra no una cierta probabilidad de equivocarnos si
es sesgada, en qué grado las estimaciones que afirmamos que los resultados obtenidos en la
hagamos con nuestra muestra responden o no muestra serían los que obtendríamos si midié-
al valor real que tiene, en el universo muestral, ramos a todos los pacientes. Esta probabilidad La precisión de los datos
lo que estamos midiendo con una muestra. Es de estar o no equivocados al afirmar que el va- medidos en una muestra
decir, siguiendo con nuestro ejemplo, hasta qué lor real es uno de los valores del intervalo que se refiere a un error de
punto podemos inferir la altura media real de hemos calculado para saber la precisión, es lo muestreo que podemos
todos los que están esperando en las consul- que se conoce como significación o grado de calcular y reconocer
tas a partir de una muestra representativa (no confianza de la estimación que hemos obtenido dando el resultado de la
evaluación con un intervalo
sesgada) de los mismos. Para saberlo, tenemos con el muestreo. La confianza en el resultado
de valores, dentro del cual
que tener en cuenta los otros dos errores que, del muestreo aumentará, naturalmente, si au-
está el valor real.
éstos sí, varían con el tamaño de la muestra. mentamos el tamaño de la muestra, pero tam-
Una de las cosas que nos va a preocupar bién si decidimos dar el resultado con menos
es la precisión de la estimación. Sabemos que precisión (con un intervalo de valores más am-
el valor que encontramos en la muestra puede plio). Pensemos en nuestro ejemplo: si decimos
no ser el real pero, ¿y si, a partir de la estima- que, según los resultados de la muestra repre-
ción de la talla media que hemos obtenido en sentativa (es decir, sin sesgo, extraída de forma
la muestra y teniendo en cuenta la variación aleatoria), la altura media estimada es de 160
(dispersión) de valores diferentes y el tamaño cm y que la media real está en un intervalo de
de la muestra, tuviéramos un medio para afir- ±20 cm en torno a esa media estimada (es decir,
mar que el valor real se encuentra entre unos entre 140 y 180 cm), tendremos menos posibi- La precisión aumenta (es
determinados límites? Así podríamos conocer lidades de equivocarnos (más confianza) para decir, el intervalo de valores
la magnitud de este error. Pues bien, el medio un mismo tamaño de muestra, que si afirma- posibles disminuye) a
de calcularlo existe, y la forma de reconocerlo mos que el valor real está entre 160 cm ±5 cm medida que aumenta el
y controlarlo es dar el resultado de la mues- (es decir, entre 155 y 165). tamaño de la muestra.
• 111 •
Dado que ambos errores (representados z2 • p • (1 - p)

por la precisión y la confianza), aunque dife- n=
rentes, están indisolublemente unidos y ambos i2
dependen del tamaño de la muestra, cuando Si la variable que se va a medir es cualitativa;
se dan los resultados de mediciones con base es decir si en cada unidad de estudio se mide
en una muestra se suelen (en realidad se deben) la presencia o ausencia de algo (una cualidad
La confianza es una medida acompañar de la medida de estos dos errores, determinada), y el resultado de toda la mues-
de otro posible error del que es lo que se conoce conjuntamente como tra se resume en proporción o porcentaje de in-
muestreo y representa intervalo de confianza del resultado obtenido. El dividuos que tienen esa cualidad; por ejemplo,
la probabilidad de que intervalo hace referencia a la precisión y se ex- cumplimiento o incumplimiento de un deter-
el resultado que hemos presa como ± una cierta cantidad, que hay que minado criterio.
obtenido con la muestra sumar y restar al valor estimado que hemos z2 • σ2
(precisión incluida) sea obtenido en la muestra, y la confianza hace re- n=
cierto. Esta confianza o ferencia al grado de certeza del resultado que i2
probabilidad de certeza se hemos obtenido (intervalo incluido) y se suele
expresa en porcentaje y,
expresar en porcentaje. Este porcentaje expre- Si la variable es cuantitativa; es decir si lo que
como valor aceptable, se
sa la probabilidad de que el valor real sea de medimos en cada individuo de la muestra es
suele establecer 95%.
verdad uno de los que está incluido en el inter- la magnitud o cantidad en que la variable en
valo; por ejemplo un intervalo de confianza de estudio está presente (por ejemplo, peso, talla,
95% quiere decir que estamos un 95% seguros tiempo de espera, etc.), y el resultado de toda
de que el valor real está dentro del intervalo o, la muestra se resume como cantidad media
lo que es lo mismo, que la probabilidad de que (peso medio, talla media, tiempo de espera
el valor real sea un valor de fuera del intervalo medio, etc.).
es sólo de 5%. En nuestro ejemplo, si el resul-
tado de la medición de la talla en la muestra En estas fórmulas:
representativa es de 160 cm ± 10 cm, para una n= tamaño de la muestra que necesitamos
confianza de 95% (o lo que es lo mismo, el in- z= un número que depende de la confianza
tervalo de confianza de 95% es 160 ± 10 cm), que queremos tener en el resultado. Este
quiere decir que hay 95% de probabilidades de número representa valores de la distri-
que sea cierto que la talla media real está entre bución normal que se busca en las tablas
150 cm y 170 cm (o 5% de probabilidades de correspondientes, y es 1.96 para una con-
que el valor real, el que resultaría de medir a to- fianza de 95%, que es la más habitual en
dos, sea inferior a 150 cm o superior a 170 cm). estudios muestrales.
Una vez entendido el significado de los i= el intervalo o precisión, expresado en pro-
tres errores que hay que tener en cuenta al me- porción (tanto por uno), para las variables
dir con muestra y cómo uno de ellos (el ses- cualitativas, y en unidades de medida de
go, traducido como representatividad) no de- la variable en estudio, para las cuantitati-
pende del número de casos de la muestra sino vas. Representa la precisión deseada. Por
del método de muestreo, podemos volver a la ejemplo 0.1 si queremos que el valor real
En los trabajos de cuestión ¿cuántos casos hacen falta para que la esté en el intervalo comprendido entre lo
investigación suelen evaluación sea útil, es decir, suficientemente que resulte en la muestra ±0.1 (equivale a
emplearse fórmulas para precisa y confiable? ±10%).
calcular el número de casos El proceder habitual en los trabajos de p= la proporción esperada de lo que se va a
necesarios que garantice investigación es calcular, mediante fórmulas, medir. Como habitualmente no se sabe,
una precisión y confianza el tamaño de la muestra habiendo fijado an- se pone 0.5 (equivalente a 50%), que es el
previamente definidas. tes la precisión y la confianza, de forma que valor de p que da un número mayor de n,
los resultados tengan el nivel de interpreta- para garantizar que en cualquier caso la
bilidad buscado. Las fórmulas que se em- muestra tendrá la precisión y la confianza
plean con más frecuencia son las siguientes:* prefijadas.
σ= la desviación estándar que se espera va a te-
* El lector que no esté interesado puede obviar la lectura de este aparta- ner la variable que se va a medir, expresada
do, puesto que no es estrictamente necesario para llevar a la práctica el
contenido de este capítulo. en unidades de medida de esa variable.
• 112 •
Si el universo o marco muestral (que se repre- relación con las necesidades de introducir La muestra de 50 a 60 casos
senta como N) es suficientemente pequeño medidas correctoras. Piénsese, por ejem- se extrae de forma aleatoria
(como regla, si la n que hemos calculado es plo, en que quisiéramos un cumplimiento para que sea representativa
mayor a 10% de N), se calcula un tamaño de de determinado criterio en al menos 75% y después calculamos el
muestra más reducido (n´), pero que mantiene de los casos, y que en la muestra nos sale intervalo de confianza del
resultado obtenido.
la misma precisión y confianza. Para esto, se 30% ± 20; igualmente tendríamos que ac-
usa la fórmula tuar si la proporción real de cumplimiento
n fuese de 10% que si fuese de 50%, que son
n’ =
n-1 los dos extremos del intervalo de valores
1+
N posibles. El anexo 5.2 muestra los inter-
valos de confianza de 95% para diversos
Dado que los criterios para evaluar el nivel de tamaños de muestra y estimaciones pun-
calidad son habitualmente variables cualitati- tuales del nivel de cumplimiento.
vas, se presenta un cuadro (anexo 5.1) con el l Importancia de la factibilidad del proyecto: en
número de casos necesarios para asegurarnos GC, tanto al inicio como para el manteni-
En las evaluaciones de
una confianza de 95% y diferentes intervalos miento de las actividades, es de gran tras- la calidad, estimaciones
(precisión), para diversas proporciones de cendencia mantener niveles lo más altos no muy precisas dan
cumplimiento esperadas (p). En este cuadro se posible de factibilidad de los proyectos. información suficiente para
ha destacado la columna que corresponde a la No hay que sacrificar la factibilidad a la decidir.
proporción esperada de 50% y el intervalos de precisión del muestreo, aunque sí combi-
±0.05. nar ambas características sabiendo que la
Sin embargo, para las evaluaciones de cali- primera va a ser determinante del éxito de
dad se aconseja hacer caso omiso de estos cál- la implantación rutinaria de las activida-
culos y utilizar un tamaño de muestra mane- des. Con muestras relativamente peque-
jable, que garantice la factibilidad del estudio. ñas, las estimaciones pueden resultar poco
Aconsejamos que este tamaño inicialmente precisas pero, si el muestreo está bien he-
sea de 50 a 60 casos aunque pueden efectuarse cho y se ha respetado la aleatoriedad, tam-
evaluaciones con tamaños aún más pequeños bién sabemos que la estimación nos aporta
(mínimo 30). información válida. Los proyectos de mejora
Utilizar esta regla práctica para determi- l Importancia de evitar muestreos ineficientes: de calidad deben de ser
nar el tamaño de la muestra pareciera restar en las fórmulas habituales, para calcular el factibles. Muestras grandes
cientifismo a las evaluaciones de la calidad número necesario de casos en la muestra pueden impedir que el
asistencial. Sin embargo, una vez realizado el –por ejemplo, para una variable cualitativa proyecto se lleve a cabo
muestreo aleatorio de este número relativa- que es lo más frecuente en GC–, hay que por el esfuerzo inicial que
mente pequeño de casos, nada impide enmen- introducir no sólo la precisión que busca- supone.
dar la falta de cientifismo y calcular a posteriori mos y el nivel de confianza que queremos
el intervalo de confianza que corresponde a obtener, sino también el valor estimado a
los valores encontrados (como veremos en el priori que tiene la variable en estudio en la
capítulo 7). Muy probablemente, estaremos población de donde se extrae la muestra.
suficientemente satisfechos con la información Habitualmente no tenemos esta estimación
obtenida por las siguientes razones: al estudiar por primera vez un tema concre-
l Necesidad relativa de estimaciones muy preci- to en GC. Como consecuencia, es habitual
sas: en GC por lo general no es de primor- calcular la fórmula situándonos en el peor de
dial interés tener una gran precisión sobre los casos, es decir aquel valor esperado (p)
Utilizar en principio
el grado de cumplimiento de los criterios, de la variable en estudio que precisaría de
muestras pequeñas evita
sino tener una idea aproximada que ilus- un número más elevado de casos para ser muestreos ineficientes.
tre sobre todo si nos encontramos muy por medida con una muestra, con resultados Respetando la aleatoriedad,
debajo o notablemente por encima. Inter- que tengan intervalos de confianza no más siempre tendremos la
valos de hasta ±0.15, es decir, ±15 en por- grandes que el previamente fijado. En va- opción de ampliar el
centaje (o a veces más) no nos van a mo- riables cualitativas, el peor de los casos es tamaño de la muestra si es
dificar las conclusiones sobre el tema en que la variable tenga un valor estimado de necesario.
• 113 •
Si queremos detectar p=0.5 (50%). En el campo de la GC, la apli- de ellos ha de cumplirse en todo un grupo de
diferencias pequeñas en cación de esta regla, sumamente extendi- población (por ejemplo, detección de cáncer en
la reevaluación, conviene da en los trabajos de investigación que no mujeres de edad determinada), mientras que
utilizar muestras más pueden permitirse realizar muestreos que los siguientes aplican sólo a sectores incluidos
grandes. produzcan resultados de una precisión re- en el primer grupo (por ejemplo, criterios de
lativamente baja, conduce a la realización seguimiento en caso de encontrar citología o
de un trabajo extra, al muestrear un núme- exploración mamaria positivas). En estos casos
ro de casos mayor que el necesario para de- el universo de referencia para cada criterio es
cidir, y que no se traduce en unos mejores diferente: en nuestro ejemplo, una muestra rea-
resultados para el programa. lizada para evaluar la posible realización de las
actividades de screening, difícilmente va a ser-
Si se tienen los recursos suficientes (ganas y virnos también para evaluar adecuadamente el
tiempo), nada impide emplear las fórmulas cumplimiento de los criterios de seguimiento.
habituales para calcular el tamaño de la mues- Como consecuencia, puede ser conveniente
tra; con ello nos garantizamos una precisión realizar muestreos diferentes para el estudio
determinada. Sin embargo, para una evalua- de cada criterio (con referencia a su universo
ción de calidad asistencial que inicia un ciclo específico de aplicación) o realizar un muestreo
de mejora, es preferible realizar de entrada una amplio hasta cubrir un mínimo de 30 casos en
muestra pequeña (máximo de 100 casos), cal- los que pueda evaluarse el criterio aplicable al
cular a posteriori el intervalo de confianza y, en subgrupo de población más pequeño. Siempre
caso de que la información obtenida no resulte pensando en la factibilidad de los proyectos, es
satisfactoria para los objetivos de GC, ampliar aconsejable evitar en las primeras evaluaciones
En las evaluaciones con el número de casos de la muestra. Para esto úl- criterios que sólo sean aplicables a subgrupos
criterios secuenciales timo, ya dispondremos como mínimo de una de pacientes o población de número reducido
(encadenadas), es estimación del valor de p, que va a ser mejor, y que no puedan ser fácilmente identificados
importante considerar un en cuanto al tamaño de la muestra necesario, para su muestreo.
muestreo que nos garantice que situarnos en el peor de los casos.
un mínimo de 30 casos para 9. Métodos de muestreo
el criterio que se evalúa 8.3. Inconvenientes de las muestras pequeñas
en el último eslabón de la Ya hemos señalado que la representatividad de
cadena.
Aparte de los problemas de precisión ya cola muestra depende del método de muestreo,
mentados, el principal inconveniente que y más concretamente de que éste no sea sesga-
puede tener el evaluar la calidad con base en do y esté hecho de manera que todos los ele-
muestras pequeñas es que, al comparar los re- mentos del universo o marco muestral tengan
sultados iniciales con evaluaciones posteriores, la misma oportunidad de ser incluidos en la
sólo vamos a encontrar significativas las dife- muestra; es decir que el muestreo sea aleatorio.
rencias importantes. Las variaciones pequeñas Existen diversos métodos de muestreo que
no van a ser detectadas o, si aparecen en los respetan la aleatoriedad. Los más comunes y
resultados, probablemente carecerán de sig- útiles para los estudios de calidad son el mues-
nificación estadística. Con base en lo alejados treo aleatorio simple, el sistemático, el estrati-
que se encuentren de nuestro estándar los pri- ficado y combinaciones de ellos (por ejemplo
meros resultados, podremos decidir ampliar estratificado y sistemático).
la muestra para la segunda evaluación o para Los métodos que respetan la aleatoriedad
ambas. Revisamos este punto en el capítulo 9. nos aseguran la representatividad estadística,
Otra circunstancia frecuente e importante pero hay otros métodos de muestreo, encua-
que puede complicar el muestreo es el hecho de drables en lo que se conoce como muestreos de
que los diferentes criterios que vayamos a utili- conveniencia, relativamente frecuentes y útiles
zar en la evaluación no sean aplicables a la mis- pero sobre cuyas limitaciones debemos estar
Para que la muestra sea ma unidad de estudio sino a subunidades. Por avisados.
representativa, el muestreo ejemplo, en el caso de utilizar criterios secuen- Vamos a revisar las características y me-
debe ser aleatorio. ciales, encadenados, en los cuales el primero cánica de todos ellos. En el diseño del estudio
• 114 •
hay que dejar bien claro cuál es el método que fijo de casos. Este intervalo, conocido como in- Para el muestreo aleatorio
vamos a utilizar, a menos que midamos todos tervalo de muestreo (k), se calcula dividiendo simple, todos los elementos
los casos, lo cual debe ser también consignado. el número total de casos del marco muestral del universo han de
(N) entre el tamaño de la muestra (n). Para que estar numerados y ser
10. Muestreo aleatorio simple. sea aleatorio, el primer caso tiene que extraerse de localizables.
Metodología, ventajas e inconvenientes manera aleatoria, de entre todo el universo o, lo
que es más cómodo, de entre los primeros k
En el muestreo aleatorio simple, cada caso de casos.
la muestra se extrae al azar y de forma inde-
pendiente. Para ello se utilizan tablas de nú- En el ejemplo anterior N=500; n=50:
meros aleatorios u otra forma de generarlos 500
(calculadoras, listas de lotería, etc.). Para rea- k= = 10  elegimos un número
50
lizarlo es preciso que todos los elementos del al azar del 1 al 10 y ésta será la primera histo-
universo o marco muestral estén numerados y ria para la muestra; a continuación escogemos
que cada número sea fácilmente localizable. La sistemáticamente una historia de cada 10. Es de-
forma en que funciona es la siguiente: cir, contando nueve historias entre caso y caso
1. Se determina el tamaño de la muestra (n). para nuestra muestra.
2. Se dispone de un universo o marco mues- Este proceder es mucho más cómodo que
tral (N) previamente definido y en el que el muestreo aleatorio simple, pero, dado que
todos sus elementos estén numerados (de los casos se extraen de forma cíclica, tenemos
1 a N) y localizables. que estar seguros de que el universo no está
3. Con una tabla de números aleatorios, u ordenado de forma también cíclica con base
otra manera de generar números aleato- en alguna variable o factor que influya en el
rios, se van seleccionando n números que criterio que queremos medir. Por ejemplo, su-
han de estar comprendidos entre 1 y N. pongamos que queremos medir la proporción
4. Estos números corresponden a los casos de visitas a la que se le toma la tensión y que
El muestreo sistemático es
que hay que extraer del universo de ca- utilizamos como marco muestral las hojas de muy cómodo de realizar,
sos y que van a componer la muestra. Por morbilidad o un registro similar de los pacien- sólo exige saber el total del
ejemplo, supongamos que tenemos un tes atendidos cada día; supongamos además universo y el número de
universo de 500 historias clínicas y que- que algunos de los profesionales del centro tie- casos que queremos. Con
remos sacar una muestra aleatoria simple nen por costumbre tomar tensiones los miér- ello se calcula el intervalo
de 50 historias. Para ello, generamos 50 coles. Si realizamos un muestreo sistemático de muestreo. Hay que estar
números aleatorios comprendidos entre 1 sobre las hojas de consulta de –digamos– un alerta, en cambio, a los
y 500 (o entre los 500 números que le ha- mes, puestas en orden cronológico día tras día, factores que intervienen
yamos asignado a las historias) y extrae- corremos el riesgo de sobrestimar o subestimar en la forma en que está
remos para evaluar las 50 historias que la variable que queremos medir porque en el ordenado el universo para
tengan asignadas los números aleatorios universo va a estar sistemáticamente agrupa- evitar sesgos.
obtenidos. da en determinados días que pueden saltarse
sistemáticamente o ser incluidos sistemática-
El principal inconveniente del muestreo alea- mente en la muestra. En este caso el muestreo
torio simple es la necesidad de que el universo sistemático no sería aconsejable.
esté numerado y de que cada número sea fá-
cilmente localizable (piénsese que los números 12. Muestreo estratificado. Metodología,
aleatorios pueden saltar de una parte a otra del ventajas e inconvenientes
universo).
El muestreo estratificado es aquel en el que
11. Muestreo sistemático. Metodología, la muestra (n) se subdivide en estratos o
ventajas e inconvenientes submuestras extraídas cada una de los dife-
rentes estratos en que a su vez está dividido
El muestreo sistemático se realiza extrayendo el universo o marco muestral. Los estratos
un caso para la muestra cada cierto intervalo del universo o marco muestral se definen en
• 115 •
En el muestreo estratificado función de las categorías o posibilidades de la

la muestra se subdivide en 200
variable o factor por el que nos interesa estra- médico 3: = = 0.4  40%
submuestras que se extraen tificar, el cual habitualmente influye en lo que 500
de los correspondientes queremos medir y, por lo tanto, nos interesa
estratos en que se ha 150
controlar su representatividad en la muestra. médico 4: = = 0.3  30%
dividido el universo. Los 500
En el ejemplo anterior, dado que sabemos
es tratos son agrupaciones
de los casos en función
que el día de la semana influye en la propor-
de la variable (por ción de pacientes a los que se les toma la ten- La muestra se divide entonces en estratos pro-
ejemplo, médicos) que sión, nos interesaría hacer un muestreo estra- porcionales a estos mismos valores. Así:
queremos controlar con la tificado por días de la semana, de forma que
estratificación. dividiríamos la muestra en cinco submuestras de los pacientes del médico 1 se extrae 20% de
(exceptuamos sábado y domingo) y cada una 60 12 casos,
se extraería de entre los pacientes atendidos en de los pacientes del médico 2 se extrae 10% de
cada uno de los cinco días de la semana en los 60 6 casos,
que hay consulta normal. de los pacientes del médico 3 se extrae 40% de
Otra situación muy frecuente que aconseja 60 24 casos,
la estratificación es la que ocurre cuando quede los pacientes del médico 4 se extrae 30% de
remos que nuestro muestreo sea representati- 60 18 casos.
vo de todo el centro o servicio, pero sabemos
o sospechamos que puede haber grandes di- En el muestreo estratificado no proporcional
ferencias en el cumplimiento de los criterios se extrae un número fijo o un porcentaje de
entre los diferentes médicos o profesionales la muestra fijo de cada estrato, con indepen-
individuales implicados en el cumplimiento dencia del tamaño del estrato. El que se haga
El muestreo estratificado de los criterios. En este caso conviene tam- proporcional o no influye en los cálculos nece-
puede ser proporcional o bién asegurarnos de la representatividad de la sarios para valorar el resultado, como veremos
no proporcional al tamaño muestra, considerando a cada profesional in- en el capítulo 7.
de los estratos. En cada dividualizado como un estrato y realizando un A su vez, hay que extraer cada submuestra
estrato el muestreo ha muestreo estratificado. (la muestra de cada estrato) de forma aleatoria,
de ser aleatorio, simple o La estratificación de la muestra puede rea- sea simple o sistemática. El muestreo estratifi-
sistemático. lizarse de forma proporcional o no proporcio- cado y sistemático es muy frecuente en los es-
nal a la contribución de cada estrato al total del tudios del nivel de calidad.
marco muestral. Para la estratificación propor- Una cuestión común a todos los tipos de
cional, se ha de calcular primero en qué propor- muestreo y que hay que tener prevista tam-
ción contribuye cada estrato al total del univer- bién en el diseño del estudio es el mecanismo
so o marco muestral. Por ejemplo, supongamos de sustitución de los casos cuando éstos no se en-
que queremos estratificar por médico, que en cuentran (por ejemplo, historias que no están)
el centro trabajan cuatro médicos, y que el total o no contienen datos válidos. El mecanismo de
de casos del universo es 500, pero que a estos sustitución debe explicitarse de antemano y
500 casos, el médico 1 contribuye con 100, el ser siempre el mismo en todo el muestreo. Una
médico 2 con 50, el médico 3 con 200 y el mé- forma común es elegir el número o la historia
dico 4 con 150. Supongamos además que que- que aparece en el listado inmediatamente des-
remos extraer una muestra de 60 casos y que pués de la que ha fallado.
Los muestreos de la queremos estratificar de forma proporcional.
conveniencia, aunque Calcularemos entonces en qué proporción con- 13. Muestreo de conveniencia.
puedan aportar información tribuye cada médico al universo: Metodología, ventajas e inconvenientes
de interés, generalmente
no son estadísticamente 100
representativos y hay que
médico 1: = = 0.2  20% El muestreo de conveniencia es de fácil obten-
500 ción pero no garantiza la representatividad es-
acompañarlos de una
reflexión sobre el grado de tadística. Se trata de una forma de muestreo en
50
generalización de lo que médico 2: = = 0.1  10% la que se eligen los casos que están más a la
estamos midiendo.
500 mano, para tener una idea de si hay o no pro-
• 116 •
blema; por ejemplo, si decidimos evaluar los estas evaluaciones estriba en aprovechar esta
pacientes que vengan hoy, o los que vinieron información para diseñar intervenciones que
ayer, o la semana pasada, o las primeras vein- eviten que el problema vuelva a ocurrir.
te historias, etc. Normalmente se establece de En las evaluaciones concurrentes, puesto
antemano un número de casos también cómo- que se realizan antes de que se dé por termi-
do (muestreo tipo cuota) e incluso se aplican nada la acción que se evalúa, es posible intro-
metodologías semejantes a la estratificación ducir las medidas correctoras antes de que se
(muestreos a propósito) eligiendo cuotas de consume un acto asistencial de mala calidad.
casos extraídos a conveniencia de grupos di- Por ejemplo, si evaluamos la calidad de la in-
ferentes de pacientes (de diferentes médicos, formación que recibe el paciente sobre su tra-
por ejemplo) sobre los que se quiere saber si tamiento, con base en un diseño de encuesta
existen o no diferencias. realizada a los usuarios antes de que abando-
No es un muestreo de primera opción para naran el centro de salud o consultorio someti-
los estudios de nivel de calidad, pero no es in- do a evaluación, y en la evaluación encontra-
frecuente que se realice este tipo de muestreos mos que el paciente no tiene claros algunos
(por ejemplo, evaluar los casos atendidos en criterios empleados en la evaluación (dosis,
el último mes, o en los últimos seis meses). pauta, contraindicaciones, tiempo de duración
En estos casos hay que reflexionar hasta qué del tratamiento), entonces éstos se le aclaran y
punto es o no una muestra representativa de nos aseguramos de que los comprenda antes
lo que queremos medir; es decir, si hay sufi- de que abandone la institución. En la asistencia
cientes elementos como para asumir que la hospitalaria hay más ejemplos de evaluación
forma de prestar el servicio que se reflejará en concurrente, algunos de ellos realizados de
el muestreo de conveniencia va a representar forma rutinaria aunque no siempre con crite-
la forma común o habitual de actuar. A veces, rios de evaluación explícitos. Citemos como En el diseño de la
aunque parezca un muestreo de convenien- ejemplos relativamente rutinarios la solicitud evaluación hay que decir
cia sí es representativo, y al revés: muestreos de segundas opiniones antes de proceder a qué tipo de evaluación,
que se suponen representativos son en rea- determinada intervención o exploración, la retrospectiva o concurrente,
lidad de conveniencia; esto depende de si el práctica de aprendizaje supervisada por un vamos a realizar.
marco muestral escogido para el muestreo docente que interviene en caso necesario mo-
de conveniencia representa razonablemente dificando un curso de acción determinado que
la población o marco muestral más amplio al le parece erróneo, o la realización de biopsias
que queremos generalizar los resultados de intraoperatorias antes de proceder a la reali-
la medición. Por ejemplo, si los pacientes de zación de determinadas intervenciones qui-
la última semana representan los que podían rúrgicas. Las evaluaciones concurrentes, si se
verse en cualquier semana del año, los resul- encuentra la ocasión y la oportunidad de ser
tados pueden ser generalizados a todo el año. realizadas, pueden convertirse con facilidad en
La reflexión sobre la representatividad de la parte integrante del proceso asistencial en sí.
muestra (control del error de sesgo) debe de El término de evaluación prospectiva (antes
hacerse siempre en el momento del diseño del de que ocurra lo que se evalúa) es equívoco y
estudio. preferimos no utilizarlo al hablar de estudio
de nivel de calidad, puesto que más bien res-
14. Tipo de evaluación, según relación ponde a actividades de diseño de la calidad, tal
temporal con la acción evaluada como vimos en el capítulo 1.
Si lo que se evalúa ha ocurrido ya, es una eva- 15. Tipo de evaluación, según quién toma
luación retrospectiva; si está ocurriendo a la vez la iniciativa
que se evalúa, es concurrente. La mayoría de
las evaluaciones del nivel de calidad son re- Existen dos tipos complementarios de orga-
trospectivas: se evalúa algo que ha ocurrido ya nización de las actividades de GC: programas
y, por lo tanto, si ha habido problema o defec- internos y programas externos. El esquema
to de calidad, es ya inevitable. La utilidad de metodológico es en esencia el mismo, pero se
• 117 •
También hay que explicitar

diferencian en quienes toman la iniciativa de 16. Tipo de evaluación, según quién
si la evaluación es
interna, decidida por los
las evaluaciones y demás actividades del pro- obtiene los datos
profesionales evaluados, o grama: en los programas internos, la respon-
externa. sabilidad de las actividades y la iniciativa de Ya hemos visto que la iniciativa de la evalua-
las mismas recae en los propios profesionales ción puede ser interna o externa, y que este
cuya asistencia se evalúa; en los programas ex- punto debe ser consignado en el diseño del
ternos, la responsabilidad de las actividades y estudio. Adicionalmente, hay que considerar y
la iniciativa de las mismas recae en organismos explicar quién se encarga de obtener los datos
externos a los centros o profesionales evalua- y de qué forma.
dos. Estas instancias externas pueden ser ni- En las evaluaciones internas, es impor-
veles superiores de la organización adminis- tante considerar si la evaluación será cruzada
trativa del sistema de salud u organizaciones (un profesional evalúa la actuación de otro) o
profesionales de carácter independiente. si será una autoevaluación (cada uno recoge los
Merece la pena aclarar que el hecho de que datos de su propia actuación). Esta segunda
la evaluación sea interna no significa necesaria- modalidad no es totalmente desdeñable en los
mente que sean los propios profesionales del estudios de calidad porque se supone que na-
centro los que lleven a cabo la recogida física die está interesado en engañarse a sí mismo,
de datos: en determinadas situaciones estruc- sino en saber en qué debe mejorar; sin embar-
turales favorables es perfectamente posible –y go, al menos en los primeros proyectos, quizá
a veces deseable– que la recogida de datos la sea más aconsejable la evaluación cruzada o
realice personal ajeno al centro, administrati- mixta. También puede ser realizada por perso-
La evaluación puede
vo o contratado para éstas y otras tareas ma- nal ajeno al proceso evaluado.
realizarse de forma cruzada, yormente rutinarias. Una revisión interna se Todo lo expuesto hasta aquí, toma cuerpo
por personal ajeno o caracteriza por responder a un diseño y llevar real y sentido al aplicarlo en la práctica. Como
evaluándose uno mismo los a una explotación de los resultados para mejo- ayuda adicional, se incluye en este capítulo
propios datos. El proceder rar la asistencia, que responden a la iniciativa (anexo 5.3) un formato que resume lo que hay
concreto debe consignarse consciente y responsable de los profesionales que describir en el proyecto de evaluación del
en el diseño del estudio. de la institución. nivel de calidad.
BIBLIOGRAFÍA
• Argimon Pallás JM, Jiménez Villa J. Métodos de Investigación clínica y epidemiológica. 2a ed. Madrid: Harcourt-Brace, 2000.
• Briones G. Métodos y técnicas de investigación para las ciencias sociales. México: Trillas, 1990.
• Lemeshow S, Hosmer DW, Klar J. Lwanga SK. Adequacy of sample size in health studies. Sussex: WMO/John Wiley & Son, 1992.
• Palmer RH. Evaluación de la asistencia ambulatoria. Principios y práctica. Madrid: Ministerio de Sanidad y Consumo, 1990.
• Saturno PJ. Cómo diseñar una evaluación sobre la calidad asistencial en atención primaria. En: IV Congreso de la Sociedad
Andaluza de Medicina Familiar y Comunitaria. Sevilla: Consejería de Salud, 1992.
• 118 •
Anexo 5.1
Número de casos necesarios para asegurarse un determinado intervalo (i) para una confianza de 95%, segúnsegún diversos
valores esperados de la variable que se mide
• 119 •
Anexo 5.2
Intervalo (i) para un grado de confianza del 95%, según estimación puntual y tamaño muestral
• 120 •
Anexo 5.3
Práctica recomendada. Formato para el diseño del estudio de nivel de calidad.
Se aconseja realizar el ejercicio de diseñar un estudio sobre nivel de calidad especificando cada uno de los componen-
tes del esquema que se explica en este capítulo.
Continúa.../
• 121 •
/... continuación
• 122 •
Capítulo 6
Diseño de estudios
para la investigación de causas
1. Introducción
2. Métodos generales para los estudios de causas hipotéticas

3. Búsqueda de causas hipotéticas sin datos
4. Búsqueda de causas con datos: comprobación de hipótesis
5. Análisis estratificado
6. Correlación y diagrama de dispersión
7. Combinando métodos: las siete herramientas
Anexo 6.1. Indicaciones para la aplicación práctica de los contenidos de este capítulo
2 Identificación
Monitorización
Elaboración
medir calidad


Capítulo 8 Diseño
de intervención

Experimentación Capítulo 6 6
Capítulo


Contenido general
Este capítulo complementa al anterior, detallando las características y metodología de los

estudios de causas hipotéticas en los que no se miden una serie de requisitos o criterios de
calidad, sino más bien uno solo, que representa el problema de calidad a estudiar y las causas
que hipotéticamente pueden estar asociadas a su existencia. Se revisan métodos con y sin
datos para identificar las causas sobre las que intervenir para mejorar. Para el estudio de causas
con datos se indican los métodos, test estadísticos y herramientas graficas que más conviene
utilizar en función del tipo de variables (cuantitativa o cualitativa) con las que se miden las
causas hipotéticas y los criterios o indicadores de calidad. El acercamiento metodológico de este
capítulo es el adecuado para problemas organizacionales y de gestión, o de otro tipo, que precise
del estudio de causas hipotéticas.
En este capítulo se describen los métodos para:

1. Identificar el tipo de estudio que conviene para avanzar en el ciclo de mejora, según las cau-
sas a indagar.
2. Distinguir métodos de estudio de causas hipotéticas con y sin datos.
3. Diseñar y analizar una encuesta de causas.
4. Diseñar y analizar una votación múltiple sobre causas hipotéticas.
5. Identificar el tipo de variable que corresponde a los factores hipotéticos a indagar.
6. Seleccionar el test estadístico que corresponde a cada tipo de variables.
7. Describir el fundamento de los análisis de estratificación.
8. Describir el fundamento de los análisis de correlación y regresión.
9. Utilizar e interpretar adecuadamente un diagrama de dispersión.
10. Realizar la prueba de los signos en un diagrama de dispersión.
Diseño de estudios Capítulo
para la investigación de causas 6
1. Introducción que para su mejora tenemos que averiguar las En este capítulo nos vamos
causas que lo provocan; una situación parecida a ocupar de los estudios
Tras seleccionar la oportunidad de mejora o a la que tendríamos después de los estudios de de causas hipotéticas de
problema de calidad (capítulo 2) nos pregun- nivel de calidad si no sabemos qué hacer para la mala calidad: aquellas
que no son requisitos
tamos de qué forma podemos abordarlo para mejorar un determinado criterio o indicador
de calidad (criterios)
conseguir su resolución. Para ello requerimos clínico que no se cumple. En ambos casos, lo pero que pensamos que
indagar sobre sus causas. En consecuencia, que tenemos es una serie de causas hipotéticas pueden influir en que esos
realizamos un análisis estructurado de la opor- que investigar y es necesario medir concurren- requisitos se den o no.
tunidad de mejora (capítulo 3). Al realizar este temente con las posibles causas el criterio o los
análisis, lo más probable es que nos encontre- criterios que representan la calidad del aspecto
mos con diversos tipos de causas frente a las en estudio. En ambos casos, también es nece-
cuales la acción más oportuna es también dife- sario tener definido el criterio o criterios que
rente. Los dos cursos de acción a los que nos va nos miden el nivel de calidad del problema a
a guiar el análisis del problema son la interven- analizar y mejorar.
ción directa y/o el diseño de estudios para un En los estudios de causas hipotéticas, lo Las causas hipotéticas no
conocimiento cuantificado de las causas sobre más conveniente sería diseñar estudios que las son requisitos de calidad
las cuales basar la intervención. cuantifiquen. Sin embargo, en la práctica de la sino factores que pueden
Los estudios para un conocimiento cuan- evaluación y mejora de la calidad en los ser- influir en ellos. Para
tificado de las causas pueden definirse en dos vicios de salud se han aplicado también otros estudiar si esta influencia
grandes grupos de acuerdo a que las causas a métodos que aprovechan de forma estructu- es cierta hay que diseñar
indagar sean criterios o requisitos de calidad rada el conocimiento que pueden tener sobre estudios que miden a la vez
(estudios de nivel de calidad, capítulo 6) o bien el problema sus propios protagonistas. Son los requisitos de calidad
factores hipotéticos que pueden o no relacio- métodos como la encuesta de causas o la vo- (traducidos a criterios o
indicadores) y las causas
narse con el problema de calidad analizado tación múltiple que parten o se complementan
hipotéticas.
(estudios de causas hipotéticas). Este último con los de análisis del problema y en los cuales
tipo de estudios es el contenido fundamental se “cuantifican” las causas según la impresión
de esta unidad. subjetiva de los proveedores.
Cuando queremos que la cuantificación
2. Métodos generales para los estudios sea objetiva, podemos recurrir a un diseño de
de causas hipotéticas investigación que no se diferencia de los habi-
tuales estudios de evaluación de servicios de
La valoración de la
Los estudios de causas hipotéticas son los que salud. Pero a veces procedimientos más sim-
importancia de las causas
realizamos cuando el problema a analizar y ples, respetuosos pero con el rigor científico, hipotéticas puede hacerse
mejorar no es de tipo exclusivamente clínico pueden ser suficientes para el grado de cono- de forma subjetiva
sino organizacional (tiempo de espera, des- cimiento que necesitamos. De todos estos mé- (sin datos empíricos)
coordinaciones en el equipo, etc.), problema todos de estudio (tanto con datos como sin da- o cuantificándolas
que podemos tener incluso ya medido, pero tos), más propios del campo de la evaluación objetivamente.
• 127 •
y mejora de la calidad, tratan los siguientes La encuesta se pasó a personal de Urgencias (n=65),
apartados de este capítulo. pidiendo su valoración en una escala de tres opciones*
3. Búsqueda de causas hipotéticas sin Listado de posibles causas de demora

datos (en el orden en que figuran en la encuesta)
1. Pocos recursos humanos para el traslado del paciente hasta la UCI

Tras la identificación de posibles causas de un 2. Tiempo de preparación del paciente para el traslado (bala de
La encuesta de causas y determinado problema de calidad por medio oxigeno, desfibrilador, etc.)
la votación múltiple son de métodos de consenso u otras como el dia- 3. Inadecuada estructura física de comunicación Urgencias-UCI
los dos métodos más 4. Interpretación del ECG por residentes
grama de causa y efecto realizados sin datos, 5. Necesidad de interconsulta residentes/staff
comunes para cuantificar la lo lógico sería diseñar un estudio que cuanti- 6. Demora por evaluación de pruebas complementarias (CPK, etc.)
valoración subjetiva de las
ficase su importancia relativa. Sin embargo, en 7. Inadecuado sistema de telefonía interna para comunicación
causas hipotéticas. Urgencias-UCI
algunos casos, por lo complicado del diseño, 8. Demora por realización de diversas técnicas o exploraciones (Rx,
por la urgencia o la seguridad que puede tener vía venosa, etc.)
el grupo en el conocimiento que tienen del pro- 9. Demora por no priorización
blema, se puede proceder a señalar cuáles son 10. Demora en el ingreso en UCI por ocupación
11. Otras causas
las principales causas a remediar por medio de
métodos que tratan de cuantificar ese conoci- %
miento subjetivo. Para ello se realiza un listado 160 100
90
de las causas hipotéticas según el resultado del 140
80
análisis realizado y se someten a encuesta o a 120
Núm. de menciones
80.4% 70
“muy importante”
votación múltiple. 100 60
80 50
40
3.2. Encuesta sobre causas 60
30
40
20
20
En este enfoque, el listado de causas hipotéti- 10
0 0
cas se convierte en un listado de preguntas, se- 2 3 5 8 6 4 1 11 10 7 9
mejante a lo que se realiza en las encuestas de Posibles causas
La encuesta sobre causas opinión, pidiendo al personal implicado que

pide al personal implicado valore la importancia de cada una de ellas, con Posibles causas Núm. de menciones % %
en el problema a evaluar escalas de varias opciones (“no importante”, de demora como "muy importante" acumulado
que señale la importancia “poco importante”, “importante” o con más 2 35 21.3 21.3
relativa de cada una de las opciones). 3 30 18.3 39.6
posibles causas, sobre la Tanto el formato de las preguntas como la 5 19 11.6 51.2
base de su conocimiento escala de valoración pueden ser de varios ti- 8 17 10.4 61.5
directo del problema. pos, pero lo que se persigue es tener una cuan- 6 16 9.8 71.3
tificación/priorización de las diversas causas 4 15 9.1 80.4
en relación a su importancia. El resultado de 1 14 8.5 89.0
la encuesta puede presentarse y analizarse con 11 14 8.5 97.5
10 4 2.4 100.0
un diagrama de Pareto (explicado en detalle en
7 0 0.0 100.0
el capítulo 7), en donde se subrayen y prioricen
9 0 0.0 100.0
las causas sobre las que diseñar la intervención Total 164 100.0
en función de la valoración recibida.
Este método ha sido empleado en algunos
de los proyectos pioneros de aplicación a siste- Figura 6.1. Encuesta de causas de retraso en la
mas de salud de los métodos de evaluación y aplicación de trombolíticos
mejora de la calidad propios de la industria.
La figura 6.1 contiene un ejemplo real de
resultado de encuesta de causas del retraso in- cuantificación, aunque subjetiva, fue acertada
trahospitalario en la aplicación de trombolíti- y la intervención diseñada sobre esta base fue
cos en el infarto de miocardio. En este caso, la efectiva. La figura 6.2 contiene un ejemplo de
• 128 •
Diseño de estudios para la investigación de causas
la lista que se haya elaborado. Consiste en una

Listado de posibles causas de no disponer
de la historia clínica en la consulta
serie de votaciones entre los implicados en el
proceso a mejorar, cada una de las cuales redu-
ce la lista, hasta que quedan seleccionadas las
1. No tiene historia clínica causas sobre las que intervenir.
2. No se identifica bien de qué profesional son las historias Los pasos a seguir son los siguientes:
3. Retraso en la comunicación del cambio de médico al personal
administrativo 1. Preparar el listado de causas.
4. La historia no está archivada 2. Tras examinarlo, cada persona implicada
5. La historia está siendo utilizada por otro profesional en otra entrega una lista en la que ha seleccionado
consulta
un tercio de las causas de la lista (por ejem-
6. La historia está siendo utilizada para trabajos de investigación
7. La historia no se encuentra por estar incorrectamente archivada plo, si el listado tiene 30 causas, selecciona
8. El nombre de la cita y el de la historia no coinciden 10; si tiene 15, selecciona 5, etc.).
3. Se cuentan los “votos”, viendo el número
%
de menciones para cada causa de la lista,
60 100 y se eliminan aquellas con menos mencio-
90
nes, reduciendo la lista. El número míni-
80
mo de votos para mantener la causa en la
Núm. de menciones
70
“muy importante”
40
71.6% 60 lista depende del tamaño del grupo que
50 vota; la regla general es eliminar aquellas
40
20 30 que tienen un número de votos inferior a
20 1/3 del tamaño del grupo.
10 4. Se repiten los pasos 1 a 3 hasta que el lis- La votación múltiple
0 0
8 7 5 4 3 6 2 tado sea lo suficientemente reducido e im- busca el consenso de los
Posibles causas
portante como para ser objeto de diseño de implicados en el problema
intervención para contrarrestar las causas evaluado sobre cuáles
que contiene. son las causas principales,
Posibles causas Núm. de menciones % % a través de un proceso
de demora como "muy importante" acumulado La votación múltiple no deja de ser una técnica estructurado de votación y
8 17 28.3 28.3
de consenso que tiene el riesgo, como todas las reducción consecuente del
7 16 26.7 55.0
técnicas que no manejan datos, de equivocarse listado de causas inicial.
5 10 16.7 71.6
si las percepciones del grupo no son las correc-
4 8 13.3 85.0
3 4 6.7 91.6
tas. La reevaluación de la calidad con base en el
6 3 5.0 96.6 criterio/indicador que representa el problema,
2 2 3.3 100.0 y su comparación con la situación (medición)
Total 60 100.0 de partida va a ser la única forma de saber si el
grupo estuvo acertado o no.
Figura 6.2. Encuesta de causas de no tener la historia Todos estos métodos, al igual que otras téc-
clínica en la consulta nicas de consenso como el grupo nominal (ca-
pítulo 2) o el diagrama de afinidades (capítulo
8), pueden utilizarse tanto para priorizar cau-
sas como para diseñar la estrategia o interven-
cuantificación mediante encuesta, también real, ción para mejorar; corriendo eso sí, el mismo
de las causas de no tener la historia clínica en riesgo de equivocarse.
la consulta que no resultó acertada, a tenor del
escaso efecto de la intervención diseñada con es- 4. Búsqueda de causas con datos:
tos datos. comprobación de hipótesis
3.2. Votación múltiple Los componentes de los estudios para cuan-
tificar las posibles causas de un problema de
La votación múltiple es también un método calidad y averiguar su asociación con el crite-
para seleccionar las causas más importantes de rio o indicador con el que lo medimos no son
• 129 •
El diseño de los estudios diferenciables en cuanto a su diseño de los que dística de las dos variables (indicador de cali-
para cuantificar las causas pueden ponerse en marcha para evaluar el nidad y causa) cuya asociación queremos ver. Si
hipotéticas es idéntico al vel de calidad (capítulo 5). La diferencia es que quisiéramos considerar simultáneamente más
de los estudios de nivel en la muestra de casos en las que evaluamos la de una posible causa, utilizaríamos entonces
de calidad; si bien en cada calidad (normalmente mediante un solo crite- técnicas de análisis multivariable, sin embar-
caso hay que medir tanto
rio o indicador que define el problema de cali- go, en la práctica normal de los ciclos de mejo-
el criterio o indicador de
calidad como las causas en
dad, por ejemplo retraso en la fibrinólisis o % ra es frecuente no llegar a utilizar estos análisis
consideración. La mayor de consultas sin historia, en los ejemplos de las estadísticos un tanto más complejos.
diferencia entre los dos figuras 6.1 y 6.2) se miden también las causas, En la práctica, los estudios de causas hi-
tipos de estudios radica en características o factores que sospechamos son potéticas pueden resumirse en tres tipos de
el análisis estadístico de de interés. Con estos datos lo normal sería pro- situaciones y los análisis en dos enfoques prin-
los datos. ceder a valorar la asociación entre el indicador cipales: estratificación y correlación, cada uno
de calidad y sus posibles causas; para ello, se- de ellos adecuado según el tipo de variables de
gún el esquema de la figura 6.3, disponemos las que se trate. Tanto la estratificación como la
de una serie de test estadísticos (correlación de correlación pueden acompañarse o no de aná-
Pearson, correlación de Spearman, ANOVA, lisis de significación estadística, utilizando en-
χ2) a elegir y utilizar según la naturaleza esta- tonces el test que resulte más apropiado según
Averiguar relación
entre dos variables
Sí ¿Las dos variables No

son cuantitativas
contínuas?
No ¿Las dos Sí Sí
¿Una cuantitativa
con distribución contínua y otra cualitativa
normal? (categórica)?
Correlación no Análisis
Correlación No
paramétrica de varianza
(Pearson)
(Spearman?) (Anova)
No Sí
¿Ordinales?
Las dos Correlalción

categóricas no paramétrica
(Spearman)
Análisis
( χ 2)
de tablas de
contingencia
Figura 6.3. Test estadisticos para asociación entre dos variables (Indicador de calidad y una probable causa)
• 130 •
el algoritmo de la figura 6.3. Las tres posibles (iii) La causa o factor a indagar es una variable
situaciones que podemos tener se definen en cuantitativa porque se mide así en cada indi-
función de la caracterización de las causas a in- viduo de la muestra (por ejemplo el tiempo de
vestigar y son las siguientes: espera, nº de visitas, etc.) o porque las unida-
(I) Las causas hipotéticas son una serie o con- des de estudio son agrupaciones de individuos
junto de características, circunstancias o factores y lo que se mide es la proporción de una deter-
de carácter cualitativo, dicotómico, de forma que minada cualidad (por ejemplo la proporción
mediremos su presencia o ausencia de manera de consultas a demanda en un día, siendo el
similar a como lo haríamos si fuese un listado día la unidad de estudio tanto para el indica-
de criterios de calidad. Por ejemplo, suponga- dor de calidad como para el posible factor o
mos que por medio de un flujograma como el causa asociada). En estos casos se analizará la
de la figura 6.4 hemos identificado una serie correlación con el indicador de calidad si este
de puntos problemáticos en el proceso de pe- es de tipo cuantitativo, o se realizará análisis
tición, realización y remisión de analítica que estratificado de la probable causa según las
pueden provocar vueltas atrás al flujo normal dos posibilidades (cumple/no cumple) del
de actividades y, por tanto, causar repeticiones indicador de calidad, si este es de tipo cuali-
y retrasos; en nuestro estudio de causas medi- tativo. La correlación puede analizarse gráfica-
remos la frecuencia de cada una de estas posi- mente por medio de un diagrama de dispersión
bles vueltas atrás (presencia/ausencia) cuando (Scatter Diagram).
se ha producido un retraso problemático (pre- Cuando el criterio de calidad
viamente definido como problema de calidad). Es conveniente señalar también que todos esque representa el problema
Para estar más seguros podemos medir si estas tos tipos de análisis pueden combinarse; de he- es dicotómico (cumple/
vueltas a atrás se producen también en casos cho, en ocasiones combinarlos es lo más ade- no cumple) y las causas
que no se atrasan y comparar las frecuencias cuado a medida que queremos profundizar en hipotéticas son asimismo
en ambos grupos. Adicionalmente, si el flujo- el análisis de las posibles causas. Por ejemplo un listado de características
grama es correcto y todos los puntos proble- un análisis de correlación puede ir seguido o dicotómicas (presencia/
máticos son indeseables, su presencia puede acompañado de análisis de correlación estra- ausencia) su análisis puede
ser considerada como defectos de calidad y tificado, si la reflexión sobre las causas así lo realizarse con un diagrama
de Pareto de las veces
analizados con diagrama de Pareto (descrito aconseja porque la considerada en primer lu-
que cada causa ha estado
en detalle en el capítulo 7) para priorizar las gar resume una probable variabilidad interna presente en casos con
intervenciones para mejorar. Un caso semejan- que encubre la verdadera causa (por ejemplo: defecto de calidad.
te sería el análisis a efectuar sobre las causas de una media diaria puede encubrir diferencias
insatisfacción a través de encuesta; cada posi- importantes por horas, turnos, médicos, etc.).
ble causa se traduce en una pregunta que es un Vamos a ver con más detalle en qué con-
factor o variable que puede considerarse como siste la estratificación (útil para la situación (ii)
satisfactoria o insatisfactoria y realizar un aná- descrita más arriba) y el análisis con diagrama
lisis con diagrama de Pareto para evidenciar de dispersión (útil para la situación (iii)).
cuáles son los factores/causa más frecuente-
mente valorados como insatisfactorios. 5. Análisis estratificado
(ii) La causa o factor a indagar es una variable La estratificación puede ser definida como un
cualitativa, categórica, con dos o más valores. método para identificar la fuente o causa de va-
Los casos más típicos son tipos de centros mé- riación en los criterios o indicadores de calidad
dicos diferentes dentro de un equipo, turnos, clasificando las mediciones según las categorías o
tipo de consulta, tipo de especialista, días de posibilidades (estratos) del factor a indagar; un fac-
la semana, etc. El análisis oportuno en estos tor que pensamos puede causar diferencias en
casos es la estratificación o análisis estratificado el indicador de calidad. De esta forma se des-
del indicador de calidad según los diversos va- cribe de manera sistemática el cumplimiento o
lores del factor o causa a indagar. Este método los valores del criterio o indicador en cada uno
se explica más adelante en este capítulo. de los estratos, con lo que obtendremos una
• 131 •
El médico pide el análisis
La enfermera acepta el pedido

y rellena el formulario
No ¿Está claro
el pedido?
Sí
Preparación del material

requerido para el análisis
No ¿Hay jeringa y agua

adecuadas?
Sí
Preparación del juego

de tubos
No
No
¿Se tomó
¿Se dispone de los la muestra según
tubos correctos? lo pedido?
Sí Sí
Recolección
del material ¿Es aceptable No
la muestra?
Envío al Sí
laboratorio
Se analiza
la muestra
Entrega del material Sí
en el laboratorio
¿Se realizó No No
¿Queda algo
correctamente
del material?
el análisis?
Sí
No
¿Resultado No ¿Es creíble

normal? el resultado?
Sí
Sí
Se registra Envío El centro recibe

el resultado al centro el análisis
Conclusión: Identificadas las posibles causas del retraso (bucles hacia atrás) diseñamos un
estudio para medir cómo es de frecuente cada una y si se asocian o no al problema analizado
(no tener a tiempo el análisis).
Figura 6.4. Flujograma del circuito de petición y realización de análisis para identificar causas de retraso
• 132 •
comprensión más detallada de la estructura y

funcionamiento del proceso analizado. Un es- 90
trato puede ser definido como un segmento o
categoría que se diferenciará, probablemente, 85
del resto de categorías con respecto a la carac-
terística de calidad que se está analizando.
Supongamos que nos interesa mantener 80
un balance entre las consultas a demanda y las
programadas, y elegimos como indicador para 75
medir este balance el porcentaje de consultas
a demanda sobre el total de consultas o visitas
del día. Tenemos la sensación de que son po- 70
cas las consultas programadas y que actuamos L M X J V L M X J V L M X J V L M X J V L M X J V
sólo a demanda. Para valorar el nivel de este
indicador hemos recogido los datos diarios de p= Proporción media de la serie
las últimas cinco semanas y nos ha resultado DE= Desviación estándar
una media de 80.5% y los valores diarios que
figuran en el cuadro 6.1.
Una primera forma de analizar los datos Figura 6.5. Porcentaje de consultas a demanda sobre total consultas. Evolución de
los resultados diarios en las últimas cinco semanas. Gráfico de control
sería ver si la media es estable o existe una
gran dispersión, lo que indicaría; o bien un pa-
trón rígido, insensible a las diferencias o alti-
bajos que puede tener la demanda día a día, o propio número diario de consultas a demanda
bien la inexistencia de un patrón de conducta (la hipótesis sería que mantenemos un núme-
establecido. Este análisis puede hacerse con un ro adecuado diario de consultas programadas,
gráfico de control (una metodología útil tanto pero las diferencias se dan por las fluctuacio-
para analizar problemas como para monitori- nes de la demanda, que no conocemos bien y
zarlos) que en nuestro ejemplo ha resultado ser no tenemos en cuenta), etc.
como el que se muestra en la figura 6.5. En él Si nos fijamos primero en el primer factor
puede verse que la proporción de consulta a mencionado, influencia del día de la semana,
demanda es muy variable; con grandes altiba- haríamos una estratificación de los datos se-
jos y diferencias con respecto del valor medio gún el día de la semana (con el resultado que
de la serie. Para intentar explicar esta variabili- puede verse en el cuadro 6.2, apuntando a una
dad podemos pensar en varios factores o causas mayor demanda en lunes y viernes), y proce-
hipotéticas como: el día de la semana, porque deremos a comprobar si hay o no diferencia
sabemos que la demanda varía por días, el significativa entre ellos (por ejemplo, con una
Cuadro 6.1
Porcentaje de consultas a demanda sobre total consultas. Resultados diarios en las últimas cinco semanas
% % % % %
82.0 Lunes 90.7 Lunes 90.0 Lunes 78.0 Lunes 82.0
78.0 Martes 78.0 Martes 80.0 Martes 82.0 Martes 84.0
86.7 Miércoles 78.0 Miércoles 89.3 Miércoles 84.0 Miércoles 82.0

_
76.0 Jueves 84.0 Jueves 80.0 Jueves 80.0 Jueves 77.3 p =80.5
84.0 Viernes 84.0 Viernes 82.0 Viernes 90.0 Viernes 84.0
• 133 •
La estratificación del Cuadro 6.2 deras causas sobre las que el Departamento de
nivel de calidad según Porcentaje de consultas a demanda sobre total consultas. Carreteras decidió actuar, mostrándose des-
los diversos factores o Análisis estratificado según dias de la semana pués una drástica reducción en el número de
causas hipotéticas nos accidentes de tráfico.
puede indicar cuál de ellas Porcentaje de consultas a demanda
se asocia a diferencias
Lunes 85.1 6. Correlación y diagrama de dispersión
significativas en el nivel
de calidad. Sin embargo Martes 80.2
la utilidad del análisis va a La correlación es un análisis estadístico para
depender en primer lugar Miércoles 83.0 comprobar la asociación entre dos variables de
de una correcta selección o tipo cuantitativo. El resultado se expresa por
Jueves 79.1
identificación de las causas medio de un coeficiente llamado coeficiente de
a analizar. Viernes 84,5 correlación (r), que puede ir en valores abso-
_ lutos de 0 a 1; expresando 1 el grado máximo
p =80.5 de correlación, que si es positiva (cuando una
variable aumenta, la otra también) se tradu-
ce en valores también positivos para el coefi-
χ2). También podríamos hacer un análisis grá- ciente de correlación, y si es negativa (cuando
fico, aprovechando que ya tenemos nuestro una variable aumenta, la otra disminuye) dará
gráfico de control, si bien su comprensión pre- valores negativos para el coeficiente de corre-
cisa del conocimiento y manejo de este tipo de lación. La regresión es un análisis semejante,
gráficos (explicados en detalle como método pero en el que estamos interesados no sólo en
de monitorización). la existencia o no de asociación sino también
Podemos seguir un procedimiento similar en cuantificar en qué medida la diversificación
con cualquier otro factor (médicos, enferme- de una variable (que llamamos independien-
ras, fisioterapeutas, tipo de centro, etc.) que te) provoca variación en la otra (que se llama
nos parezca de interés, siempre que éste sea dependiente), para lo cual se construye un mo-
una variable categórica (de varias opciones). delo o ecuación que represente esa relación de
Si el factor o causa de interés es cuantitativa, dependencia y que puede llevarse a un gráfico
como sería en nuestro ejemplo en vez del día por medio de la línea que resulte al aplicar a la
de la semana, la influencia de la fluctuación en ecuación las parejas de valores que hemos ob-
el número de consultas a demanda, el análisis tenido para las dos variables en estudio. Este
lo haríamos por medio de correlación, y, a ni- acercamiento tiene una intención predictiva,
vel gráfico, con un diagrama de dispersión, tal (encontrar la fórmula con la cual pueden pre-
La correlación o asociación
como veremos más adelante. decirse los valores de la variable dependiente
entre un criterio de calidad Cuál de los factores por los que queremos en función de los que tenga la variable inde-
cuantitativo (por ejemplo estratificar va a mostrarse relevante es algo pendiente), mientras que en la correlación so-
tiempo de espera) y una que no se sabe hasta que se realiza el análi- lamente estamos interesados por la existencia
causa hipotética también sis. En los manuales sobre control de calidad de asociación; como si ambas variables fuesen
cuantitativa (por ejemplo se encuentran ejemplos a veces tan llamativos variables “dependientes” entre sí.
número de pacientes de como el análisis provocado por un incremento En los análisis que se realizan en los ciclos
consulta a demanda) se inusual de los accidentes de tráfico en Japón de mejora es más frecuente el enfoque de corre-
puede valorar mediante en 1970; como en los impresos sobre los acci- lación que el de regresión, pero en ambos ca-
un análisis estadístico dentes había un apartado llamado “causa” se sos, el análisis puede plasmarse e incluso reali-
(coeficiente de correlación) realizó un primer análisis viendo cuál era la zarse de forma gráfica. De hecho, es un consejo
y también mediante un
más frecuente; ésta resultó ser “conducción muy extendido y aceptado que antes de aplicar
diagrama de dispersión,
que puede adicionalmente
imprudente”. Sin embargo, estratificando cada ningún cálculo estadístico se debe observar la
analizarse calculando el “causa” por las características de la carretera y distribución gráfica de las mediciones.
coeficiente de correlación y la localización específica de los accidentes, se Al plasmar nuestras mediciones en un grá-
su significación estadística, evidenciaron frecuencias significativamente fico (llamado gráfico de correlación o gráfico
o mediante la prueba de los más elevadas según determinadas localizacio- de dispersión), utilizamos un eje de coordena-
signos. nes y condiciones de las carreteras: las verda- das, siendo lo habitual el que en el eje de orde-
• 134 •
nadas (y) se represente el criterio o indicador dio) se representa como un punto en el gráfico.
de calidad que estamos analizando como pro- Como resultado podemos encontrarnos, en ge-
blema, y en el de abscisas (x) la causa o factor neral, con los patrones que se reproducen en
influyente potencial; cada pareja de datos (va- la figura 6.6. Si queremos ser más detallados
lor del indicador y valor de la causa en estu- en el análisis, puede calcularse el coeficiente de
Indicador Indicador
y y
6 6
4 4
2 2
0 0
0 2 4 6 x 0 2 4 6 x
Causa Causa
Posible correlación positiva Posible correlación negativa
Indicador Indicador
y y
6 6
4 4
2 2
0 0
0 2 4 6 x 0 2 4 6 x
Causa Causa
Posible correlación positiva Posible correlación negativa
Indicador Indicador
y y
6 6
4 4
2 2
0 0
0 2 4 6 x 0 2 4 6 x
Causa Causa
No correlación Relación no lineal
Figura 6.6. Posibles patrones de los gráficos de dispersión
• 135 •
correlación y su correspondiente significación Cuadro 6.3

estadística, o bien realizar una prueba no pa- Porcentaje de pacientes que esperan más de 45 min (y),
ramétrica sencilla basada en el simple conteo y porcentaje de consultas a demanda (x)
de los puntos en referencia a su posición en el Fecha y x
gráfico (prueba de los signos). Mayo 1 8.6 88.9
2 8.9 88.4
6.1. Análisis de la correlación: prueba de los
signos 3 8.8 87.4
4 8.8 89.1
Supongamos que nuestro indicador de cali- 5 8.4 87.4
dad es la proporción de pacientes que esperan 8 8.7 88.6
más de 45 minutos para ser atendidos y que 9 9.2 91.1
pensamos que a pesar de nuestros esfuerzos 10 8.6 91.2
por mantenerlo bajo, la propia variabilidad
11 9.2 89.5
de la demanda influye en que nuestro indi-
12 8.7 89.6
cador varíe, de forma que si hay más deman-
da, la proporción de pacientes que tienen que 15 8.4 89.4
esperar más se eleva. Si esto es así, debemos 16 8.2 86.4
intentar controlar mejor la demanda o estable- 17 9.2 92.2
cer mecanismos organizativos que tengan en 18 8.7 90.9
cuenta sus fluctuaciones para que no influyan 19 9.4 90.5
en el tiempo de espera de los pacientes. Para 22 8.7 89.2
estudiar esta relación entre tiempo de espera y
23 8.5 87.7
porcentaje de consultas a demanda, recogemos
los datos de ambas variables cada día durante 24 9.2 88.5
un cierto tiempo (queremos tener al menos 30 25 8.5 86.6
mediciones) con el resultado que figura en el 26 8.3 89.6
cuadro 6.3. 29 8.7 89.6
El correspondiente diagrama de dispersión 30 9.3 92.8
es la figura 6.7, en el cual parece que, efectiva- 31 8.9 88.6
mente, hay una relación positiva. Pero, ¿cómo
Junio 1 8.9 90.8
podemos saber si es o no significativa? Por
2 8.3 88.1
una parte, podemos calcular el coeficiente de
correlación y ver su significación estadística, 5 8.7 88.2
lo cual nos lo hará el ordenador con cualquier 6 8.9 90.4
paquete estadístico u hoja de cálculo de que 7 8.7 91.2
dispongamos, pero también podemos realizar 8 9.1 92.5
este análisis visualmente si no disponemos de 9 8.7 87.2
esos recursos o si, como ocurre con frecuencia,
tenemos un número pequeño de mediciones.
Para ello seguimos los siguientes pasos:
1. Trazamos una línea vertical a nivel de la
mediana de los valores de la causa poten- zado. En nuestro ejemplo, el indicador de
cial (representada en el eje de abscisas, x), calidad es la proporción de pacientes que
de forma que deja a cada lado la mitad de esperan más de 45 minutos, la mediana es
los valores para esta variable en nuestra 8.7, valor que deja la mitad de valores por
serie. Para nuestro ejemplo, la mediana de encima y la mitad por debajo.
esta causa potencial (el porcentaje de con- 3. Al trazar estas líneas tendremos el gráfico
sultas a demanda) es 89.1. dividido en cuatro cuadrantes (n1, n2, n3,
2. Trazamos una línea horizontal a nivel de n4). Procedemos entonces a contar el nú-
la mediana de valores del indicador anali- mero de puntos en cada cuadrante, y su-
• 136 •
mamos los que hay en los cuadrantes con- y

9.5
trapuestos (n1+n3 y n2+n4, ver figura 6.7).
En estos cálculos no se debe incluir ningún 9.3
punto que esté justo en cualquiera de las 9.1
dos medianas.
4. La menor de estas dos sumas se compara 8.9 n2=4
n2 n3=8
con los valores del cuadro que se reprodu- 8.7
ce como cuadro 6.4, y si este valor es igual o n1
n1=6 n4
menor que el que aparece en el cuadro para 8.5 n4=3
el correspondiente número total de puntos 8.3

del gráfico, concluiremos que la correlación
8.1 x
es significativa. Adicionalmente, si n1+n3 es 86 87 88 89 90 91 92 93 94
mayor que n2+n4 la correlación es positiva,
mientras que si n1+n3 es menor que n2+n4
la correlación es negativa, aunque esto es
Figura 6.7. Relación entre la proporción de pacientes que esperan más de 45 min
visible a simple vista en el gráfico.
(y) y la de consultas a demanda (x) (según datos del cuadro 3)
En nuestro ejemplo, sin contar los puntos que
coinciden con cualquiera de las dos medianas,
tenemos:
n1=6 n2= 4 n3= 8 n4= 3
Cuadro 6.4
Cuadro de la prueba de los signos
n1+n3=14 n2+n4=7
n 0.01 0.05 n 0.01 0.05 n 0.01 0.05
La suma más pequeña es 7. Buscamos en el 20 3 5
cuadro 6.4 el valor que corresponde para n= 21 4 5 46 13 15 71 24 26
30, y como 7 es igual o menor (en este caso me- 22 4 5 47 14 16 72 24 27
nor) que 9, que es el valor correspondiente al 23 4 6 48 14 16 73 25 27
nivel de significación ≤ 0.05 (e incluso igual al 24 5 6 49 15 17 74 25 28
correspondiente a significación ≤ 0,01) conclui- 25 5 7 50 15 17 75 25 28
remos que ambas variables están significativa- 26 6 7 51 15 18 76 26 28
mente correlacionadas. 27 6 7 52 16 18 77 26 29
Es preciso recordar, sin embargo, que en- 28 6 8 53 16 18 78 27 29
contrar correlación entre dos variables no quie- 29 7 8 54 17 19 79 27 30
re decir que la relación sea causal; puede que 30 7 9 55 17 19 80 28 30
la relación se establezca a través de terceros 31 7 9 56 17 20 81 28 31
factores y, en cualquier caso, la relación de cau- 32 8 9 57 18 20 82 28 31
salidad va a precisar de otro tipo de estudios; 33 8 10 58 18 21 83 29 32
entre otras cosas, el resultado que obtengamos 34 9 10 59 19 21 84 29 32
en la reevaluación una vez hayamos actuado
35 9 11 60 19 21 85 30 32
sobre la causa potencial, nos confirmará o no si
36 9 11 61 20 22 86 30 33
la relación era causal.
37 10 12 62 20 22 87 31 33
38 10 12 63 20 23 88 31 34
7. Combinando métodos: las siete
39 11 12 64 21 23 89 31 34
herramientas
40 11 13 65 21 24 90 32 35
En la búsqueda de causas de los problemas de 41 11 13 66 22 24 100 36 39
calidad, el “viaje diagnóstico” según algunos 42 12 14 67 22 25
autores o “recorrido diagnóstico” según otros, 43 12 14 68 22 25
no hay recetas mágicas. Es frecuente tener que 44 13 15 69 23 25
utilizar sabiamente combinadas varias herra- 45 13 15 70 23 26
• 137 •
La estratificación y el mientas de una manera secuencial, razonada y Cuadro 6.5

diagrama de dispersión con sentido común. De todas las herramientas Las siete herramientas elementales
forman parte de las siete posibles, hay una cierta coincidencia en desta- para el control de la calidad
herramientas consideradas car siete como las más útiles: las Siete Herra-
por algunos autores mientas; llamadas así por los japoneses, en me- 1. Diagrama de pareto
como las básicas para el
moria de las famosas siete armas de Benkei, un 2. Diagrama causa-efecto
control de la calidad y de
conocimiento indispensable
guerrero-sacerdote japonés, con las que venció 3. Estratificación
por todo el personal de una todas sus batallas (en Estados Unidos de Nor- 4. Hoja de comprobación de presencia de defectos
organización con programa teamérica algunos autores las han rebautizado (listado de criterios para su cuantificación)
de gestión de la calidad. como los “7 magníficos”). Estas Siete Herra- 5. Histograma
mientas son las que figuran en el cuadro 6.5; 6. Diagrama de dispersión
entre ellas están, junto al listado de criterios, 7. Gráficos de control
tanto la estratificación como los diagramas de
dispersión, lo cual da una idea de su relevancia Fuente: Adaptado de Ishikawa K.
potencial. Estas herramientas son consideradas
por Ishikawa como correspondientes al nivel
elemental, dentro de los tres niveles de méto- más, según Ishikawa, indispensables para los
dos estadísticos para el control de la calidad, programas de calidad y deben de poder ser uti-
definidos en función de su dificultad. Son ade- lizadas por todo el personal de la organización.
BIBLIOGRAFÍA
• Goldfield N, Pine M, Pine J. Techniques for analyzing processes and making team decissions. En : Measuring and managing
health care quality. Gaithersburg: Aspen Pub, 1995. Vol. I, Cap. 5.
• Ishikawa K. EL enfoque estadístico y algunas herramientas estadísticas sencillas. En: Introducción al control de calidad. Madrid:
Díaz de Santos, 1994. Cap. 2.
• Rosner B. Fundamentals of Bioestatistics. 4ª ed. Belmont: Duxbury Press, 1995.
• Scholtes PR, Joiner BL, Streibel BJ. Getting started: Learning the tools. En: The team handbook. 2ª ed. Madison: Joiner Associates,
1996. Cap. 2.
• 138 •
Anexo 6.1
Indicaciones para la aplicación práctica de los contenidos de este capítulo
Nota: estas indicaciones complementan las del capítulo 5, en caso de haber elegido como problema por mejorar uno que necesite explorar la
importancia de diversas causas hipotéticas.
Indicaciones para la aplicación práctica
Puede escogerse entre medir (cuantificar) directamente las causas hipotéticas a indagar o realizar una cuantificación subjetiva mediante
una encuesta de causas. A continuación se dan las indicaciones para ambos casos, aunque normalmente se elige uno de los dos.
I. Cuantificación directa de las causas hipotéticas

I.1. Definir el listado de causas a verificar. Siguiendo el esquema de componentes del estudio que se diseñó en el capítulo
5 para el criterio o indicador que mide el problema de calidad a mejorar, completando el apartado correspondiente a
“criterios a utilizar” con el listado de “causas a verificar”.
Este listado, extraído de las encontradas en el análisis del problema (capítulo 3), contiene las causas que van a ser
medidas en el estudio.
I.2. Revisar los componentes del estudio, agrupando para cada causa el tipo de variable de que se trata (cuantitativa,
cualitativa) y de unidad de estudio. Plasmarlo en el formato adjunto.
I.3. Recogida de datos: al igual que se indica en el capítulo 5, pero midiendo en cada caso el criterio o indicador de calidad
que representa el problema a mejorar y las causas hipotéticas que contribuyen a su presencia.
II. Cuantificación subjetiva de las causas hipotéticas

II.1. Definir listado de causas a realizar. Extraer, de las causas encontradas al analizar el problema, aquellas que queremos
valorar.
II.2. Diseñar una encuesta en la que cada pregunta es la valoración de una de las causas a estudio. Puede utilizarse el
esquema de respuesta más simple (tres opciones): “muy importante”, “poco importante”, “nada importante”) o cualquier
otro que permita priorizar fácilmente sin ambigüedades.
II.3. Recogida de datos: administrar la encuesta de causas al personal implicado en el problema a valorar y mejorar.
Nota: la encuesta complementa (no sustituye) el diseño de estudio (capitulo 5) para la medición basal del criterio o indicador que representa el
problema de calidad por evaluar. La encuesta de causas tiene como objetivo identificar aquéllas sobre las que hay que intervenir, según los
implicados en el problema o proceso por mejorar.
• 139 •
Capítulo 7
Análisis y presentación
de los datos de una evaluación
1. Introducción
2. Los datos de la evaluación: estimación del nivel de cumplimiento de los criterios y cálculo de intervalos de
confianza
3. Influencia del método de muestreo en la estimación de intervalos de confianza
4. Presentación gráfica de los datos de una evaluación
5. Análisis gráficos de los datos para priorizar intervenciones: diagrama de Pareto de los defectos de calidad
(incumplimientos de criterios) encontrados
6. Análisis de los datos de estudios de causas hipotéticas
Anexo 7.1. Intervalo (i) para un grado de confianza de 95%, según estimación puntual y tamaño muestral
2 Identificación
Monitorización
Elaboración
medir calidad


Capítulo 9 de la intervención y discusión Capítulo 7 7
Capítulo
Capítulo 8 Diseño
de intervención



Contenido general
Este capítulo detalla la forma en que los datos obtenidos en el estudio del nivel de calidad
deben ser presentados y analizados desde un punto de vista estadístico, y para que sirvan
como base para diseñar la intervención que haga mejorar la calidad. Se subraya la necesidad
de calcular los intervalos de confianza de los valores encontrados, si se ha utilizado una
muestra, y se especifica paso a paso la construcción de un diagrama de Pareto para el análisis
de las deficiencias de calidad a subsanar, o también de la frecuencia de las causas hipotéticas
indagadas, si ha sido de este tipo el estudio realizado. Se muestra también la construcción
de otros tipos de gráficos (estrella, Box and whiskers) que pueden ser utilizados para la
presentación global de los datos.

1. Resumir de manera informativa los datos de una evaluación de la calidad.
2. Calcular los intervalos de confianza de las estimaciones de cumplimiento encontradas.
3. Distinguir los conceptos de “intervalo” y “confianza” e interpretar sus valores.
4. Ordenar los datos de forma adecuada para construir un diagrama de Pareto sobre las defi-
ciencias de calidad o causas hipotéticas encontradas.
5. Construir un diagrama de Pareto completo con los resultados de la evaluación.
6. Explicar los resultados de la evaluación utilizando el diagrama de Pareto.
7. Presentar gráficamente los resultados de la evaluación utilizando un gráfico tipo estrella o
radar.
8. Presentar gráficamente los resultados de la evaluación utilizando un gráfico “box and
whiskers”.
9. Describir correctamente las presentaciones tabular y gráfica de los resultados de una
evaluación
Análisis y presentación Capítulo
de los datos de una evaluación 7
“Evaluar para mejorar no para juzgar”
Los datos de una muestra

1. Introducción presentación y análisis de los datos obtenidos
representativa nos sirven
en los estudios diseñados según la metodolo-
para estimar por medio
Los capítulos 5 y 6 describen la metodología gía descrita en los capítulos 5 y 6. de inferencia estadística el
para diseñar estudios orientados a la recogi- parámetro que medimos.
da de datos sobre el nivel de calidad (cumpli- 2. Los datos de la evaluación: estimación
miento de criterios o requisitos de calidad, nor- del nivel de cumplimiento de los criterios
malmente de atención clínica, capítulo 5) del y cálculo de intervalos de confianza
aspecto o aspectos de los servicios que pres-
tamos que más nos haya interesado y, even- La mayoría de las evaluaciones del nivel de ca-
tualmente, de las causas hipotéticas de la mala lidad se realizan utilizando muestras. En estas
calidad (capítulo 6). Estos datos obtenidos se- condiciones, lo que realizamos no son medi-
gún el plan establecido en los respectivos es- ciones directas y sin error posible sino estima-
tudios son la base para decidir qué podemos y ciones de los valores reales que tiene la variable
debemos hacer para mejorar la calidad en los (criterio de calidad) que queremos evaluar. Es-
problemas evaluados. Para ello, es necesario tos valores reales, sean proporciones o medias,
analizar y presentar adecuadamente los datos se conocen como parámetros en la jerga estadís-
obtenidos, de forma que sirvan de base para la tica. Dicho de una forma más precisa, lo que
discusión de las oportunas intervenciones para hacemos (o debemos hacer) cuando medimos
la mejora. En este capítulo se revisa la forma el nivel de calidad con una muestra es realizar
de realizar en la práctica y con rigor científico una inferencia estadística sobre las características
esta presentación y análisis de los datos. Los (parámetros) de poblaciones o grupos amplios
métodos a utilizar incluyen el tratamiento de de casos, sobre la base de información aporta-
los datos para la inferencia estadística de los da por la muestra; siempre que, recordémoslo,
parámetros (esencialmente el nivel de cumpli- la muestra sea aleatoria (representativa), no
miento real de los criterios) que hemos medido sesgada, como veíamos en el capítulo 5 al ha-
mediante muestra, y la representación gráfica blar del diseño del estudio. Las estimaciones
de los mismos, destacando los niveles de cum- a inferir sobre el parámetro que nos interese La primera inferencia a
plimiento (gráfico de barras y tipo estrella), pueden ser de tipo puntual (un solo valor) o realizar es la estimación
la variabilidad y precisión de las mediciones de intervalos de valores. puntual del parámetro
(gráfico “box and whiskers”), o bien los in- (por ejemplo, proporción
cumplimientos o causas hipotéticas encontra- 2.1. Estimación puntual del nivel de de cumplimiento de un
criterio) que hemos medido.
das (según el tipo de estudio realizado) para cumplimiento de un criterio
Para ello hacemos los
priorizar los aspectos más importantes de la cálculos con los datos de la
intervención (gráfico de Pareto). La primera inferencia que podemos hacer con muestra como si se tratase
El capítulo se completa con las indicacio- los datos de la muestra es la propia estimación de la totalidad del universo
nes para la aplicación práctica de los métodos del nivel de cumplimiento que resulta en la me- de donde se ha extraído la
estadísticos y gráficos más relevantes para la dición realizada para cada uno de los criterios. muestra.
• 145 •
La estimación puntual
Por ejemplo, si hemos evaluado la proporción No debe de extrañarnos la afirmación de
puede y debe completarse
con la estimación del
de hipertensos correctamente diagnosticados que las estimaciones de cumplimiento de crite-
intervalo de confianza; un en una muestra aleatoria de 60 casos y hemos rios en base a muestras deberían incluir siempre
intervalo de valores dentro encontrado que 45 de estos cumplen el criterio la estimación del intervalo de confianza. Pero,
del cual tengamos un de diagnóstico correcto, podemos inferir o esti- ¿cómo podemos estimar este intervalo de va-
cierto nivel de seguridad mar que una proporción de 45/60 = 0.75 o un lores?; es fácil: sólo necesitamos los datos de
(confianza) de que se porcentaje del 75% de los hipertensos están co- nuestro muestreo y decidir sobre la confianza
encuentre el valor real. rrectamente diagnosticados. Esta estimación se que queremos tener en nuestra estimación.
conoce como estimación puntual del parámetro De hecho, conviene entender que, aunque re-
(valor poblacional real) que queremos medir, lacionados, el concepto intervalo de confianza
en este caso la proporción de hipertensos co- entraña dos aspectos diferentes: el intervalo y
rrectamente diagnosticados. la confianza. El intervalo es la gama de valores
Sin embargo, todos sabemos que al medir dentro de la cual estimamos que está el valor
algo por medio de una muestra el resultado real (poblacional) del parámetro evaluado (en
está sujeto a errores propios del muestreo y nuestro caso este parámetro sería la propor-
que, por tanto, la estimación puntual puede ción de cumplimientos de un criterio), mien-
no ser exactamente igual al valor real que en- tras que la confianza es la probabilidad de que
contraríamos si midiésemos no una muestra sea cierto que el intervalo contiene el valor real
El intervalo de confianza
sino todos los casos. Es más, no sólo somos del parámetro evaluado. Sin embargo, dado
implica dos aspectos que, conscientes de que la estimación puntual pue- que ambos aspectos van necesariamente uni-
aunque en la práctica de no ser igual al valor real, sino que también dos en la inferencia estadística (para una mis-
han de ir necesariamente está claro que no sabemos, dando sólo la estima muestra, si aumentamos la confianza de la
juntos, conviene entender mación puntual, lo cerca o lo lejos que puede estimación aumenta la amplitud del intervalo),
y considerar por separado; encontrarse del valor real. Para solucionar este es costumbre considerarlos como un concepto
el intervalo (conjunto de problema hemos de completar nuestro proce- único. Vamos a ver cómo se calcula.
valores entre los cuales der de inferencia estadística estimando no sólo
estimamos que está el un valor (estimación puntual) sino un inter- 2.3. Cálculo del intervalo de confianza del
valor real) y la confianza valo de valores, dentro de los cuales podamos nivel de cumplimiento de un criterio
(probabilidad de que sea tener una cierta seguridad de que se encuentra
cierto que el intervalo
el valor real, poblacional, de lo que hemos me- El razonamiento y fórmula general para esti-
contenga al valor real).
dido a través de una muestra. mar el intervalo de confianza del parámetro
medido con muestra es: estimación puntual ±
2.2. Estimación del intervalo de confianza del i, siendo
cumplimiento de un criterio i = z. Desviación estándar del parámetro esti-
mado
Esta segunda estimación es lo que se cono-
ce como intervalo de confianza de la medición donde z es un valor de la distribución normal
realizada. El intervalo de confianza expresa la (la distribución de probabilidades más conoci-
precisión o exactitud probable (¡todo en esta- da en estadística) relacionado con la confianza
dística es probabilidad!) de la medición reali- que queramos tener en la estimación (proba-
zada, en relación con el valor real; obviamen- bilidad de que el intervalo contenga el valor
El intervalo de confianza te, cuanto más amplio sea el intervalo, menos real del parámetro estimado); y la desviación
(estimación puntual ±i) se precisa es nuestra estimación. En la amplitud estándar del parámetro estimado es lo que se co-
calcula fácilmente a partir del intervalo intervienen, como luego vere- noce también como error del muestreo o error
de los datos de la muestra, mos, el tamaño de la muestra, la variabilidad estándar, que se estima con base en la desvia-
una vez fijada la confianza y
de los datos de la muestra y la confianza (cer- ción estándar de los datos de la muestra (una
estimando el error llamado
teza o probabilidad) que queramos tener de expresión de su dispersión o variabilidad) y
error estándar (i= z. error
estándar, siendo z un que sea cierto que este intervalo contiene el el propio tamaño de la muestra. Así pues, el
valor dependiente de la valor real. cálculo del intervalo de confianza entraña los
confianza).
• 146 •
Análisis y presentación de los datos de una evaluación
siguientes dos pasos previos: (1) determinar el Es habitual estimar el

valor de z y (2) calcular el error estándar. intervalo de confianza para
p (1 - p) una confianza de 95%, con
sp=
1. Determinar el valor de z. Para ello hay que n lo cual en la fórmula para su
decidir sobre la confianza que queremos tener cálculo z=1.96.
para la estimación; es decir, lo seguros que que- donde p es la estimación puntual de la propor-
ramos estar de que el valor real esté contenido ción de cumplimiento, y n es el tamaño de la
en el intervalo que vamos a estimar. Está claro muestra utilizada.
que una confianza del 100% exigiría medir to-
dos los casos, no una muestra, o bien dar como En el ejemplo empleado de la estimación de la
intervalo toda la gama posible de valores, lo proporción de hipertensos correctamente diag-
cual no tendría ninguna utilidad como estima- nosticados, teníamos una estimación puntual
ción. En consecuencia, hay que arriesgarse algo; del 75% en una muestra de 60; la estimación del
habrá que aceptar una cierta probabilidad de intervalo de confianza para el cumplimiento de
equivocarse; es decir, estimar un intervalo de este criterio sería, con una confianza de 95%:
valores con una confianza inferior al 100%.
¿Cuál debe ser esta confianza? En general, se z = 1.96 (como corresponde a una confianza de Una vez calculada la
considera una confianza aceptable si ésta es del 95%) desviación estándar del
95%. Es decir, si tenemos un 95% de probabili- parámetro estimado (error
dades de que el intervalo contenga el valor real, p = 0.75 1-p = 0.25 n = 60 estándar), se puede estimar
y sólo un 5% de probabilidades de que el valor el intervalo de confianza.
real sea un valor externo al intervalo (probabi- Este intervalo nos indica
lidad de equivocarnos en nuestra estimación). los valores mínimo y
Para una confianza de 95%, z es 1.96. Este
(0.75) (0.25) máximo entre los cuales se
sp=
valor es el que aparece en las tablas de la distri- 60 encuentra el valor real del
bución normal, para esta confianza. El cuadro parámetro estimado, con
una confianza (seguridad
7.1 contiene los valores de z, correspondientes con lo cual
de que sea cierto) prefijada
a los diversos niveles de confianza más fre- (0.75) (0.25) que habitualmente
cuentemente empleados. i = z . sp = 1.96 = 0.11 decidimos que sea del 95%.
60
y el intervalo de confianza: estimación puntual
Cuadro 7.1 ± i = 0.75±0.11
Valores de z para diversos niveles de confianza
de los intervalos estimados ¿Qué quiere decir esto?, pues que estamos un
Nivel de confianza* Z 95% seguros de que el valor real de cumpli-
90% 1.64 miento del criterio es un valor que está entre
95% 1.96
0.64 (límite inferior del intervalo: 0.75-0.11) y
0.86 (límite superior del intervalo: 0.75+0.11);
99% 2.58 en porcentaje: entre 64% y 86%.
Por otra parte, sólo con ver la fórmula para
su cálculo (n está en el denominador de sp) es
2. Calcular el error estándar o desviación es- evidente que cuanto mayor sea el tamaño de Para una misma confianza,
tándar del parámetro estimado. Anotado ha- la muestra, más pequeño va a resultar el inter- si aumentamos el tamaño
bitualmente como sp (cuando el parámetro es- valo; es decir: más precisa puede ser nuestra de la muestra, más
timado es una proporción, como ocurre en la estimación (ver anexo 7.1). De esta forma, si al precisión obtendremos al
mayoría de los criterios de calidad), o como sx estimar el nivel de cumplimiento de un deter- estimar el intervalo; es decir
(cuando el parámetro estimado es una media). minado criterio el intervalo de confianza nos más pequeña es la gama
En el caso de la estimación del nivel de calidad resulta demasiado amplio para decidir sobre de valores entre los cuales
como proporción de cumplimiento de un crite- su mejora, podemos obtener una mayor pre- estimamos que está el
rio, la fórmula de cálculo es: cisión ampliando la muestra; siempre que los valor real.
• 147 •
casos adicionales los obtengamos también de sea inferior a 600, puesto que en esos casos el
forma aleatoria y del mismo marco muestral. tamaño de la muestra (60) va a ser mayor que
El anexo 7.1 contiene los cálculos de i para las el 10% del tamaño del universo.
diversas estimaciones puntuales de porcenta- Supongamos, por ejemplo, que el total de
jes y determinados tamaños de muestra. La hipertensos diagnosticados en nuestro centro
influencia del tamaño del universo o marco (N, marco muestral o universo para nuestro
muestral es, la mayoría de las veces, irrelevan- estudio) es de 300; el intervalo de confianza,
te, tal como veremos a continuación. ajustado por el hecho de que n >10% N, sería
2.4. Influencia del tamaño del universo o 300 - 60

El tamaño del universo marco muestral i´= i . = 0.10
(N) de donde se extrae la
299
muestra (n) no influye en ¿Qué ocurre si extraemos la muestra de marcos lo cual quiere decir que podemos afirmar, con
la estimación del intervalo muestrales (total de casos, universo o pobla- una confianza del 95%, que la proporción real
de confianza a menos que n ción) de tamaños diferentes?, ¿influye el tama- de cumplimiento es un valor comprendido en-
>10% N.
ño del marco muestral en las estimaciones que tre 65% y 85% (0.75±0.10), en lugar de 64% y
podamos inferir? La respuesta es que esto no 86% como teníamos antes.
siempre sucede. Obsérvese, que para n=N (todos los casos),
En principio, el tamaño del universo mues- la fracción
N-n
tral no influye a efectos prácticos a menos de
que la muestra sea de un tamaño superior al N-1
10% del total del universo o marco muestral de es cero, lo cual es lógico porque no hablaría-
donde se ha extraído. En este caso, si bien no mos entonces de inferencia estadística sino de
hay influencia en cuanto a la estimación pun- medición directa del parámetro; de igual ma-
tual, sí que conviene recalcular la estimación nera, a medida que la diferencia entre N y n
del intervalo de confianza porque, mantenien- se agranda, la fracción de ajuste tiende a ser 1,
do la misma confianza, el intervalo va a resul- lo cual indica que el tamaño del universo no
tar más pequeño: es decir, la estimación va a va a influir en la estimación del intervalo de
ser más precisa. confianza. De hecho, como regla, no merece la
pena hacer el cálculo ajustado para cualquier
El cálculo del intervalo ajustado por el tama- n <10% N.
ño del universo se realiza multiplicando por la
fracción: 2.5. Inferencia estadística sobre medias
N-n
N-1 La mayoría de los criterios para medir nivel de
calidad son cualitativos categóricos: se mide
Si el criterio mide una donde N es el tamaño del universo y n es el en cada caso la cualidad de si lo cumple o no;
cantidad cuyo parámetro tamaño de la muestra. clasificamos los casos en estas dos categorías
resumen es una media, las (los que cumplen y los que no), y estimamos
fórmulas para la estimación
La fórmula es entonces: la proporción de una de ellas, la que más nos
puntual y del intervalo de
confianza son peculiares, N-n interese. Sin embargo, en ocasiones el nivel de
aunque el razonamiento i´= i . calidad se mide con criterios que son variables
N-1 cuantitativas cuyo parámetro característico es
estadístico es idéntico al
visto para proporciones. donde i es el cálculo realizado sin tener en una media (por ejemplo media de minutos por
cuenta el tamaño del universo, tal como hemos consulta, media de minutos que tiene que es-
visto antes. En nuestro ejemplo de estimación perar el paciente antes de ser atendido, etc.).
de la proporción de hipertensos correctamente En estos casos, aunque el razonamiento es-
diagnosticados, aplicada en una muestra de 60 tadístico es igual, las fórmulas para la inferen-
casos, realizaremos este ajuste para la estima- cia de las estimaciones tanto puntuales como
ción del intervalo de confianza siempre que de intervalo son diferentes. El cuadro 7.2 con-
el tamaño del universo (total de hipertensos) tiene las fórmulas necesarias, tanto para el caso
• 148 •
Cuadro 7.2
Inferencia estadística en base a muestras no sesgadas:
Estimaciones puntuales e intervalos de confianza de proporciones y medias
Intervalo de confianza (95%)
Parámetro a estimar Tamaño de muestra (n) Estimación puntual
(estimación puntual ± i)*
p(1-p)
Menor que el 10% del tamaño del marco n° cumplimientos p ±1.96 –––––––
p= -–––––––––––––––– n
muestral (N) n
- Proporción (p)
ejemplo: proporción de cumplimientos de
un criterio de calidad. p(1-p) N-n
Mayor que el 10% del tamaño del marco n° cumplimientos
p= -–––––––––––––––– p ±1.96 ––––––– • –––––
muestral (N) n n N-1
Menor que el 10% del tamaño del marco ∑xi S

–x+1.96 -––––
x–= -–––––
muestral (N) n n
- Media ( x– )
(ejemplo: media de minutos por consulta)
Mayor que el 10% del tamaño del marco ∑xi S
–x+1.96 -–––– N-n
x–= -––––– • –––––
muestral (N) n n N-1
Xi : los diversos valores individuales de cada caso incluido en la muestra

∑(xi-x– )2
s: desviación estándar de los datos de la muestra= –––––––
n -1
* La fórmula general para calcular los intervalos de confianza es i=z. Desviación estándar del parámetro estimado, donde z es el valor en la distribución nor-
mal que corresponde a los diversos niveles de confianza (ver cuadro 7.1), y la desviación estándar del parámetro corresponde al llamado error estándar.
Si el tamaño de la muestra no es suficientemente grande (n>30), la distribución normal no puede asumirse y se debe emplear el valor de t (de la distribu-
ción de la t de student) en lugar de z; t varía con el tamaño de la muestra.
de proporciones (como en nuestro ejemplo de al estratificar controlamos uno de los factores

hipertensos bien diagnosticados) como de me- (aquel por el que estratificamos) con influen-
dias y puede utilizarse como referencia para cia potencial en la variabilidad de los datos (y
los casos en que vaya a ser necesario utilizar por tanto en la desviación estándar). La varia-
medias en vez de proporciones. bilidad dentro de cada estrato es de esperarse
que sea menor (es más homogéneo) que la que
3. Influencia del método de muestreo en exista entre los estratos y por tanto en la mues-
la estimación de intervalos de confianza tra que podríamos realizar sin estratificar; por
otra parte, las diferencias de tamaño de cada
En el capítulo 5 vimos que el muestreo puede estrato también han de ser tenidas en cuenta,
realizarse con diversos métodos, de los cuales sobre todo en el muestreo estratificado no pro-
destacamos por su mayor aplicabilidad prácti- porcional. El resultado es generalmente que en
ca en general al aleatorio simple, el sistemático las muestras estratificadas la estimación es más
y el estratificado (proporcional y no proporcio- precisa si aplicamos las fórmulas adecuadas
nal). El emplear uno u otro método tiene in- que si no tenemos en cuenta la estratificación.
fluencia en la variabilidad de los datos de la El cuadro 7.3 contiene las fórmulas para las
muestra, y por tanto en las estimaciones que estimaciones puntuales e intervalos de confian-
hagamos con ellos, sobre todo en la estimación za según los diversos métodos de muestreo. La
del intervalo de confianza. Esta influencia pue- primera impresión al ver las fórmulas para las
de ser particularmente importante en el mues- estimaciones en muestreos estratificados es
treo estratificado, y se basa en el hecho de que que son de gran complejidad; cuando en rea-
• 149 •
Cuadro 7.3
Estimaciones puntuales de proporciones (p) y medias (x) e intervalos de confianza según tipo de muestreo utilizado
Tipo de muestreo Estimación puntual Intervalo de confianza (95%)
- Aleatorio simple Ver cuadro 7.2 Ver cuadro 7.2
- Sistemático Ver cuadro 7.2 Ver cuadro 7.2*
- Estratificado
1-f nh
P+1.96 –––– ∑Wh––––– P (1-P )
n nh-1 h h
Ver cuadro 7.2
Proporcional – 1-f
X +1.96 –––– • ∑Wh• sh2
n2
Ph(1-Ph)
1 P+1.96 ∑Wh2 (1-fh) ––––––––
P= ––– ∑Nh • Ph nh-1
N
No proporcional
– 1 – – Sh2
X = ––– ∑Nh • X h X +1.96 ∑Wh2 (1-f) –––
N nh
* Algunos autores proponen y razonan otras fórmulas semejantes a las del muestreo estratificado.

n

f: fracción de muestreo = –––; n = tamaño total de muestra; N = tamaño del universo o marco muestral.
N

h: número de estratos; nh = tamaño de la muestra en cada estrato; Nh = tamaño de cada estrato.

∑: sumatorio de todos los estratos.

Ph: proporción de cumplimientos de cada estrato; fh = fracción de muestreo en cada estrato.

N
Wh: proporción de casos de cada estrato (Nh) en el total del universo muestral = –––h

N
–
sh: desviación estándar en cada estrato; X h= media en cada estrato.

lidad no es así. Son fácilmente programables n = 450, de los cuales

en hoja de cálculo, e incluso manualmente si 90 (20%) son del profesional 1 (estrato 1)
preparamos una tabla debidamente ordenada 160 (36%) son del profesional 2 (estrato 2)
para el cálculo de cada elemento necesario por 200 (44%) son del profesional 3 (estrato 3)
separado, con una secuencia lógica. Veamos,
por ejemplo, como se procedería para el caso n = 60, de los cuales extraemos
de un muestreo estratificado proporcional, 20% de entre los hipertensos del profesio-
probablemente uno de los más frecuentemente nal 1 (n1=12)
empleados al evaluar calidad. 20% de entre los hipertensos del profesio-
Supongamos que hemos estratificado una nal 1 (n1=12)
muestra de 60 casos entre tres profesionales 20% de entre los hipertensos del profesio-
participantes en un estudio del nivel de cali- nal 1 (n1=12)
dad. Entre los tres tienen en programa un total
(N) de 450 hipertensos. Al evaluar las muestras de cada estrato, hemos
Uno de ellos tiene 90 hipertensos, otro 160 encontrado 4 hipertensos bien diagnosticados
y el tercero 200. Para estratificar de forma pro- en la muestra del profesional 1, 17 en la del
porcional, asignamos a cada profesional un profesional 2, y 24 en la del profesional 3; un
número de casos para la muestra en propor- total de 45 sobre el total de 60 casos evaluados.
ción a su número total de hipertensos; así ten- Con ello estimaríamos en un 75% (45/60 x 100)
dremos: el porcentaje de hipertensos bien diagnostica-
• 150 •
dos. Al ser la estratificación proporcional, la tuales por cada estrato son parecidas, no mere-
estimación puntual se hace de igual forma que ce la pena realizar los cálculos del intervalo de
si fuera una muestra aleatoria o sistemática confianza teniendo en cuenta la estratificación.
simple. Sin embargo, si la estratificación que hemos
Para estimar el intervalo de confianza, realizado no es proporcional a los tamaños de
podemos proceder sin tener en cuenta que la los estratos, y encontramos proporciones de
muestra ha sido estratificada y encontraría- cumplimiento diferentes en los diferentes es-
mos, tal como vimos más arriba, un interva- tratos, no es sólo conveniente sino obligatorio
lo para una confianza de 95% de 0.75±0.11, ó tenerla en cuenta al menos para la estimación El cálculo del intervalo de
0.75±0.10 si ajustamos por el tamaño del uni- puntual global. Veámoslo con un ejemplo: su- confianza para muestras
verso dado que 60>10% 450: pongamos decidimos estratificar la muestra de estratificadas no es más
60 casos para los mismos 3 profesionales del difícil que para los otros
450 - 60 ejemplo anterior extrayendo aleatoriamente 20 tipos de muestreo, aunque
0.11 . casos de entre los hipertensos de cada uno (es- pueda llevar más tiempo,
499
tratificación no proporcional). En los 20 casos se puede realizar con
Sin embargo, si tenemos en cuenta la estratifi- del profesional 1 encontramos 12 correctamen- calculadora de mano. No
cación haríamos los cálculos según la fórmula te diagnosticados (proporción de 0.6), 15 en los obstante, puede obviarse si
del cuadro 7.3 y en el orden que se muestra en del profesional 2 (proporción de 0.75), y 18 en las estimaciones puntuales
en cada estrato son
la siguiente tabla: los del profesional 3 (proporción de 0.9); un to-
semejantes.
tal de 45 cumplimientos pero con proporciones
Proporción Muestra Proporción de diferentes en los estratos. Para hacer nuestra
nh
ESTRATO
del estrato en el cumplimiento
1- Ph Wh • (
• Ph 1 -Ph ) estimación del nivel de cumplimiento de los 3
en el total estrato en el estrato nh - 1
(Wh) (nh ) (Ph ) profesionales conjuntamente, no sería correcto
decir 45/60 sino que utilizaríamos la fórmula
1 0.20 12 4/12=0.33 0,67 0.048
indicada en el cuadro 7.3 para muestras estra-
2 0.36 22 17/22=0.77 0,23 0.067 tificadas no proporcionales:
3 0.44 26 24/26=0.92 0,08 0.034 1
60 0.146 P= ∑ Nh • Ph'
N
cuyos valores en nuestro ejemplo serán los si-
n 60 guientes: Si se ha realizado un
f= = = 0.13
N 450 muestreo estratificado
Tamaño de cada Proporción de cumplimiento no proporcional y las
Una vez hecho esto, podemos aplicar la fórmu- estrato (Nh ) en cada estrato (Ph)
Nh . Ph
estimaciones puntuales
la indicada en el cuadro 7.3 para las muestras (proporciones de
Estrato 1: 90 12/20=0.6 54
estratificadas proporcionales: cumplimiento) en cada
Estrato 2: 160 15/20=0.75 120 estrato son diferentes,
1-f n 1 - 0.13 la estimación puntual
Sp.estr.= ∑ Wh h Ph(1 - Ph) = • 0.146 = 0.046 Estrato 3: 200 18/20=0.90 180
n nh - 1 60 global debe realizarse
N=450 354 con la fórmula apropiada,
y con ello el intervalo, para una confianza del teniendo en cuenta los
95% sería: datos de la estratificación.
1
De modo que: P=
0.75± (1,96.0,046)= 0.75±0.09 450 . 354=0.787; es decir,
78.7%.
Una estimación más precisa que la de 0.75±0.11 Recuérdese que sin tener en cuenta que la
o 0.75 ± 0.10 que habríamos estimado sin tener muestra ha sido estratificada no proporcional,
en cuenta la estratificación. la estimación de cumplimiento hubiera sido
En general, el incremento de precisión que 45/60=0.75, o 75%.
comporta la estratificación es mayor cuando Hay otros tipos de muestreo no contem-
la desigualdad entre los estratos sea también plados en este manual (por ejemplo el mues-
mayor, de forma que si las estimaciones pun- treo en conglomerados y polietápico) que con-
• 151 •
llevan sus propias fórmulas para una correcta incumplimientos, objeto de la interven-
inferencia estadística. En la práctica de los pro- ción para mejorar, el diagrama de Pareto
gramas de calidad lo normal es que utilicemos es más ilustrativo y adecuado para evi-
en la mayoría de los casos uno u otro de los denciar las prioridades para intervenir,
métodos de muestreo que hemos revisado, aunque también es posible utilizar estos
pero debe quedar clara la idea de que, en cual- mismos gráficos.
quier caso, es conveniente reflexionar para la
interpretación de los datos si el tipo concreto Vamos a ver en primer lugar los gráficos para
de muestreo que hemos utilizado puede o no representar cumplimientos y nos detendremos
El análisis de los datos de influir en la forma de realizar los cálculos para después a revisar paso a paso la construcción
una evaluación se completa la inferencia estadística. e interpretación de un gráfico de Pareto sobre
con su representación defectos o incumplimientos. En todos los casos
gráfica. Vamos a elegir 4. Presentación gráfica de los datos de utilizaremos como ejemplo los datos que figu-
el tipo de gráfico más una evaluación ran en el cuadro 7.4, resultado de una evalua-
adecuado en función del ción de los criterios de diagnóstico, anamnesis
tipo de variable (cumple/ Una correcta estimación del nivel de cumpli- y exploración física inicial del paciente hiper-
no cumple o cantidad de miento de los criterios es fundamental para tenso.
algo) con la que medimos dar base real al conocimiento sobre el nivel de
el criterio, el interés que
calidad de los aspectos evaluados y eviden- 4.1. Gráfico de barras de los cumplimientos
tengamos en representar
las estimaciones
ciar en qué criterios estamos necesitados de (figura 7.2)
de los intervalos de mejora. Sin embargo, en calidad existe siem-
confianza, y si queremos pre una representación gráfica que visualiza Un gráfico de barras consiste en la representa-
representar niveles de y hace más comprensible el resultado de las ción alineada en el eje de abscisas de las barras
cumplimiento o analizar los mediciones. que representan los diversos criterios evalua-
incumplimientos. De entre todas las representaciones gráfi- dos, con una altura para cada una de ellas que
cas posibles vamos a seleccionar las más úti- corresponde al nivel de cumplimiento del cri-
les y prácticas, de entre las cuales elegiremos terio que representa, según una escala que se
la que más nos interese, en función de lo que coloca como eje de ordenadas. De esta forma
queramos enfatizar en relación a la evaluación podemos comparar visualmente la diferencia
realizada. La selección de uno u otro gráfico en los niveles de cumplimiento de los distin-
está representada en la figura 7.1 en forma de tos criterios. La escala de medida puede ser
algoritmo decisional; como puede verse, una de números absolutos de cumplimientos (ten-
vez construida la tabla de presentación de los drá como valor máximo el total de casos de la
datos, las decisiones que afectan a la elección muestra) o lo que es más común, porcentajes,
del gráfico son: yendo entonces de 0 a 100.
i) el tipo de variable con que medimos el La representación de los datos de una eva-
criterio (categórica, o cuantitativa); (ii) si luación por medio de un gráfico de barras es
nos interesa representar sólo estimaciones probablemente la representación gráfica más
puntuales o también intervalos; y (iii) si sencilla y común. Sin embargo, para que sea
queremos representar cumplimientos o realmente informativa conviene que ordene-
El gráfico de barras es analizar incumplimientos (defectos de ca- mos los criterios y su correspondiente repre-
útil para representar las
lidad). En relación a esta última decisión, sentación de mayor a menor cumplimiento.
estimaciones puntuales
las opciones que tenemos para represen- En caso contrario, si las representamos por el
de los niveles de
cumplimiento, sobre tar cumplimientos son el clásico gráfico orden del listado de criterios, va a ser de poca
todo si ordenamos los de barras o el gráfico tipo estrella o radar ayuda para comparar más allá de distinguir
criterios de mayor a menor (si queremos representar sólo las estima- las que se destaquen como más extremas. La
cumplimiento. ciones puntuales), y el gráfico “box and figura 7.2 contiene los gráficos de barras de los
whiskers” (si queremos representar los datos del cuadro 7.4 con y sin ordenar para que
intervalos de confianza); para analizar los pueda apreciarse la diferencia.
• 152 •
Estudio de nivel de calidad:

datos recogidos
No
¿Se utilizó muestra?
Sí
Realizar cálculos para

inferencia estadística
¿El muestreo fue aleatorio No

simple o sistemático simple? ¿El muestreo fue estratificado?
No
Sí
Sí
Utilizar fórmulas Buscar fórmulas apropiadas
Utilizar fórmulas
del cuadro 7.3 al tipo de muestreo utilizado
del cuadro 7.2
Construir tabla
de presentación de datos
Realizar presentación y análisis

gráfico de los datos
¿Los criterios
de calidad medidos son No Construir histograma
de tipo categórico o box and whiskers
(cumple/no cumple)?
Sí
¿Representar No Construir gráfico box

y analizar sólo estimaciones and whiskers adaptado
puntuales?
Sí
Construir (elejir):
Sí - Gráfico de barras (ordenadas de mayor
¿Énfasis en cumplimientos?
a menor proporción de cumplimientos)
No
- Gráfico tipo estrella o radar
Construir diagrama de Pareto

sobre defectos o incumplimientos
Figura 7.1. Algoritmo decisional para el análisis y presentación de los datos de un estudio del nivel de calidad
• 153 •
Cuadro 7.4 4.2. Gráfico tipo estrella o radar (figura 7.3)

Del diagnóstico, anamnesis y exploración física inicial del paciente hipertenso.
Niveles de cumplimiento de los criterios en una muestra aleatoria de 60 casos En este gráfico, cada criterio se representa en
% Cumplimiento un eje cuyo origen es el centro de una estrella o
Criterio*
(Intervalo de confianza del 95%) asterisco, de forma que cada eje (cada criterio)
1. Diagnóstico correcto 75.0 (±11.0) es como un brazo del asterisco. La escala de
2. Antecedentes familiares 80.0 (±10.1) los ejes, todos iguales, puede ser sobre el total
3. Antecedentes personales 90.0 (±7.6)
de casos de la muestra o como porcentaje (de
0 a 100), que es como hemos representado los
4. Consumo de tabaco 30.0 (±11.6)
datos de nuestro ejemplo. Al representar cada
5. Consumo de alcohol 10.0 (±7.6) criterio en un eje, puede verse fácilmente la
6. Peso y talla y/o IMC 85.0 (±9.0) distancia que le queda a cada uno para llegar
7. Auscultación cardiaca 75.0 (±11.0) al 100% de cumplimiento.
8. Exploración abdominal 40.0 (±12.4) Este tipo de gráfico es interesante para
9. Pulsos periféricos 50.0 (±12.7) comparar evaluaciones de varias áreas, regio-
10. Soplos carotideos 55.0 (±12.6)
nes, centros o médicos; cada uno con su “es-
11. Edemas 25.0 (±11.0)
12. Fondo de ojo 15.0 (±9.0)
3a 1.
* Este es un enunciado resumido. La descripción detallada de los criterios debe seguir el formato
100
descrito en el capítulo 4. 12. 2.
80
60
100 11. 3.
90 40
Cumplimientos (%)
80
70 20
60
50 10. 0 4.
40
30
20
10
0 9. 5.
1 2 3 4 5 6 7 8 9 10 11 12
Criterios
100 8. 6.
90
Cumplimientos (%)
80
7.
70
60
50
40 3b 6.
30 100
20
10 80
0 12. 7.
3 6 2 1 7 10 9 8 4 11 12 5 60
Criterios
40
Criterios 20
0
1. Diagnóstico correcto 7. Auscultación cardiaca
2. Antecedentes familiares 8. Exploración abdominal 11. 8.
3. Antecedentes personales 9. Pulsos periféricos
4. Consumo de tabaco 10. Soplos carotideos
5. Consumo de alcohol 11. Edemas
6. Peso y talla y/o IMC 12. Fondo de ojo
10. 9.
Figura 7.2. Gráfico de barras (datos del cuadro 7.4) Figura 7.3. Gráfico tipo estrella o radar (datos del cuadro 7.4)
• 154 •
trella” de la forma y tamaño que corresponda La idea de representar no solamente las El gráfico tipo estrella es útil
a sus resultados, y también para visualizar la estimaciones puntuales sino también las carac- sobre todo para representar
mejora sobre un mismo gráfico al comparar terísticas que describen la variabilidad de los estimaciones puntuales de
dos evaluaciones de una misma área, región o datos de una muestra ha sido adaptada para niveles de cumplimiento
centro, tal como veremos en el capítulo 9. Pue- múltiples aplicaciones y ha dado lugar a di- y realizar comparaciones.
Es menos práctico, más
de resultar una opción menos atractiva si el nú- versas modificaciones de interés. Algunas de
confuso, si el número de
mero de criterios representados es muy grande ellas son muy sofisticadas, como su utilización criterios representados es
o excesivamente pequeño; véase por ejemplo para representar las series temporales de las grande.
la diferencia entre las figuras 7.3a y 7.3b. En la mediciones incorporando en cada medición
figura 7.3a se han representado todos los crite- los resultados de las anteriores, pero otras son
rios del cuadro 7.4, y en la 7.3b sólo los corres- sencillas y de una utilidad práctica más inme-
pondientes a la exploración física inicial. diata; de estas últimas, las tres más relevantes
son probablemente la inclusión de la media en
4.3. Gráfico box and whiskers el gráfico, modificar los bigotes para evidenciar
y representar la existencia de outliers y lo que
La traducción literal sería gráfico de caja y bi- es más importante, para representar las esti-
gotes o gráfico de cajas (box plot). Es un tipo de maciones de los intervalos de confianza.
gráfico que se propone a finales de los setenta Las dos primeras modificaciones son útiles
para visualizar los resultados de una muestra para la representación de criterios cuantitati-
de una variable cuantitativa, como una forma vos (resumidos como media, no como propor-
de representación de los llamados por Tukey ción o porcentaje), y consisten en lo siguiente:
“cinco números resumen” de los datos reco-
gidos, que son el valor mínimo y el máximo, Incluir la media. Es simplemente añadir un El gráfico box and whiskers”
el primer y tercer cuartil (es decir los valores punto más al gráfico; además de señalar la me- es útil para representar la
variabilidad de los datos
que corresponden al 25% y 75% de los casos), diana dentro de la caja, se representa con un
de la muestra, además de
y la mediana (el valor central de la serie). Los punto el valor que corresponde a la media, tal
la estimación puntual del
cuartiles delimitan los bordes de la caja, en la como se ve en la figura 7.5. parámetro (proporción
cual está contenida y representada la mediana, o media) de interés.
mientras que los valores mínimo y máximo de- Modificar los bigotes para señalar outliers. Si la Es el gráfico a elegir si
terminan la longitud de los bigotes. Con ello se muestra tiene casos con valores muy extremos, queremos representar los
tiene una idea visual de la variabilidad de los claramente alejados de la mayoría (lo que se intervalos de confianza y
datos del criterio o indicador medido, y permite conoce como outliers) van a producir un grá- resulta visualmente más
una comparabilidad más clara que si represen- fico con bigotes muy largos en el lado de los informativo si los criterios se
tamos los datos de cada criterio con histogra- outliers y va a proporcionar una información ordenan de mayor a menor
mas (nota: el histograma se vio en el capítulo 3). distorsionada de la realidad, al no verse en nivel de cumplimiento.
Este esquema básico es el de la figura 7.4. el gráfico la distribución de valores a lo largo
Primer cuartil Tercer cuartil

Primer cuartil Tercer cuartil
Media
Valor mínimo Mediana Valor máximo
Valor mínimo Mediana Valor máximo
Escala
Escala de mediciones
de mediciones del indicador
del indicador
Figura 7.5. Esquema de gráfico box and whiskers con

Figura 7.4. Esquema básico del gráfico box and whiskers mediana y media
• 155 •
del bigote. Para evitarlo, se limita la longitud

de los bigotes a los valores que comprenden a
1.5 x amplitud de la caja (la amplitud de la caja
es la distancia entre el primer y tercer cuartil).
Los valores que quedan fuera de los bigotes
modificados se representan como asteriscos y
constituyen los “outliers” de la serie de datos
representada. El tipo de gráfico que resulta es Límites del Estimación Límites del
el de la figura 7.6. intervalo de puntual intervalo de
confianza de 68% (P ó X confianza de 95%
Representación de los intervalos de confianza. Ésta

es la modificación que más nos interesa puesto
que es aplicable a la representación del nivel
de calidad para cualquier tipo de criterio, sea
como media o como proporción de cumpli-
mientos. En esta representación gráfica la caja
se delimita en el intervalo de confianza del
68% (aproximadamente la estimación puntual
±1 desviación estándar del parámetro estima-
do) y los límites de los bigotes son los valores Figura 7.7. Esquema básico para el gráfico box and
correspondientes a los límites del intervalo de whiskers representando los intervalos de confianza
confianza del 95%. Este esquema es el que se
representa en la figura 7.7, y es el que hemos
utilizado para representar en la figura 7.8 los
datos del cuadro 7.4.
El gráfico box and whiskers es una repre-
Escala sentación estadísticamente más completa que
de medida el diagrama de barras, y puede ser mejorada,
7 como el diagrama de barras, ordenando los
criterios de mayor a menor cumplimiento, tal
como se ha hecho en la figura 7.8. Es posible,
6
igualmente, combinar ambos gráficos super-
poniendo el de caja y bigotes al diagrama de
barras.
5
De todas formas, aunque todos estos gráfi-
cos son útiles para comunicar adecuadamente
4 los resultados de la evaluación, no hay que ol-
vidar que nuestro objetivo al evaluar es saber
3 qué debemos mejorar; en este sentido, nuestra
preocupación son fundamentalmente los de-
fectos de calidad o incumplimientos encontra-
2 dos (las causas del nivel de calidad deficiente),
y nos conviene enfocar nuestro análisis gráfi-
1 co en esta dirección. Para ello, la mejor repre-
Criterios sentación y análisis gráfico de los datos es la
: OUTLIERS
realización de un diagrama de Pareto sobre los
Fuente: Adaptado de HM Wadsworth, KS Stephens y AB Godfrey
incumplimientos. Un análisis semejante al que
podemos hacer graficando las causas hipoté-
ticas de la mala calidad, tal como se describe
Figura 7.6. Gráfico box an whiskers modificado con
indicación de outliers
en los ejemplos de la encuesta de causas del
capítulo 6.
• 156 •
120.0
100.0
Cumplimiento (%)
80.0
60.0
40.0
20.0
0.0
3 6 2 1 7 10 9 8 4 11 12 5
Criterios
Criterios
1. Diagnostico correcto 7. Auscultación cardiaca

2. Antecedentes familiares 8. Exploración abdominal
Figura 7.8. Gráfico box and whiskers (datos del cuadro 7.4)
5. Análisis gráfico de los datos para

priorizar intervenciones: diagrama
de Pareto de los defectos de calidad
(incumplimientos de criterios) 120%
encontrados
Núm. de incumplimientos (defectos)
100
El diagrama de Pareto (figura 7.9) es un grá-
“pocos 80
fico de barras que representa la frecuencia de vitales”
incumplimientos de cada uno de los criterios
60
evaluados, ordenados de mayor a menor nú- 61%
mero de incumplimientos y completado con 40
una curva de frecuencia porcentual acumula-
da. El objetivo es visualizar conjuntamente qué 20
criterios aportan mayor número de defectos
de calidad (cada incumplimiento es un defecto 0
11 12 8 14 15 6 16 17 9 13 3 1 2 10 4 5 7
de calidad) y señalar en la curva de frecuencia
Criterios
acumulada cuáles son los que representan la
mayoría de defectos y que, por tanto, serían Total de incumplimientos
prioritarios como objeto de intervención para Porcentaje acumulado
mejorar.
Este enfoque de buscar los pocos criterios
(o en general causas) que son la base de la ma- Figura 7.9. Diagrama de Pareto (esquema)
yoría de los defectos de calidad es lo que se co-
• 157 •
El diagrama de Pareto es
noce como “principio de Pareto” desde que lo Si consideramos paso a paso la construc-
un gráfico de barras para
representar y analizar las
propuso Juran a finales de los años cuarenta. ción de un diagrama de Pareto, podemos dis-
causas de los defectos de Juran observó que los estudios de Pareto tinguir dos fases: (i) preparación de los datos;
calidad (incumplimientos (un economista italiano de finales del XIX) so- y (ii) construcción del gráfico en sí. Los pasos
de criterios), aplicando bre la distribución de la riqueza señalando su que implica cada una de las fases se explicitan
el principio de las desigualdad y acumulación en unas pocas ma- en el cuadro 7.5. Vamos a realizarlos utilizan-
“pocas vitales y muchos nos respondían en realidad a una ley universal do los datos de nuestro ejemplo (cuadro 7.4).
triviales”, de forma que los que se repetía en todos los ámbitos; llevado al
criterios se representan terreno de la calidad, indicó que lo más común 5.1. Preparación de los datos
ordenadamente de es que la mayoría de los defectos de calidad se
mayor a menor número deban a unas pocas causas o tipos de defecto, 1. Construir una tabla con la frecuencia abso-
de incumplimientos y se principio que bautizó como principio de Pareto o luta (número de incumplimientos) y relativa
completa el gráfico con
de los pocos vitales y muchos triviales, señalando (porcentaje sobre el total de incumplimientos)
la curva de frecuencia
de incumplimientos
la importancia de buscar unos pocos defectos encontrados en la muestra.
acumulada para señalar en o causas de defecto vitales que serían la base Según los datos del cuadro 7.4, la frecuen-
ella el punto que resume los o acumulación de la mayoría de los defectos cia absoluta y relativa de incumplimiento de
“pocos vitales”. de calidad del producto o servicio a mejorar. cada criterio es la que figura en el cuadro 7.6.
Para su representación gráfica, aparte de pro- Estos datos los tendremos normalmente (igual
poner como norma que se ordenaran las barras que los de los cumplimientos) como resultado
en el gráfico de mayor a menor importancia en en bruto de la recogida de datos que hayamos
cuanto a número de defectos encontrados y no hecho. No obstante, también pueden derivarse
por cualquier otro orden, propuso completar a partir de las proporciones de cumplimiento
el análisis con la curva de frecuencia de causas como las que contienen el cuadro 7.4: obsérve-
acumuladas (basada en las curvas que propu- se que incumplimientos es el complemento de
so Lorenz, también sobre distribución de la ri- cumplimientos y que, por ejemplo, un cumpli-
Para el diagrama de Pareto, queza) para señalar en ellas donde se alcanza miento del 90% significa un incumplimiento
la frecuencia relativa la mayoría de los defectos. del 10%; si la muestra es de 60 casos, un 10%
(%) de incumplimientos El principio de Pareto o de los pocos vita- de incumplimientos es un total de 6 incumpli-
se calcula sobre el total les y muchos triviales (ambos en realidad de mientos (un 10% de 60) para ese criterio; de
de incumplimientos Juran) se conoce también en la jerga de la ca- esta forma pueden derivarse criterio a criterio
encontrados en la muestra, lidad en la industria como principio del 80/20, los datos de incumplimiento.
no sobre el total de casos indicando que, numéricamente el principio de Conviene subrayar que el porcentaje de
(n) de la muestra. Pareto quiere decir que el 80% de los defectos incumplimientos no se calcula sobre el núme-
se debe a un 20% de las posibles causas. ro de casos de la muestra (como lo haríamos
para estimar el porcentaje de cumplimientos
de cada criterio) sino sobre el total de incum-
plimientos (defectos de calidad) encontrados:
Cuadro 7.5 ésta es la distinción fundamental del diagrama
Construcción de un diagrama de Pareto de Pareto sobre los defectos de calidad en rela-
A. Preparación de los datos ción con el diagrama de barras representando
Hacer una tabla con el listado de criterios y la frecuencia absoluta (nº de veces) y
el nivel de cumplimientos. En nuestro ejemplo,
relativa (% sobre el total de incumplimientos de la muestra) de incumplimientos
por cada criterio. cada caso puede contribuir a este total de in-
Ordenar los criterios de mayor a menor número de incumplimientos. cumplimientos desde un mínimo de cero (si
Calcular la frecuencia relativa (%) acumulada. cumple todos los criterios) hasta un máximo
B. Construir gráfico de 12 (si los incumple todos).
Construir el gráfico de barras, con dos ejes (frecuencia absoluta y relativa) o uno
solo (frecuencia relativa).
Construir la curva de frecuencia relativa acumulada. 2. Ordenar los criterios de mayor a menor número
(Opcional). de incumplimientos. Con este orden necesario, el
Señalar el punto que acumula el 60-80% de los incumplimientos encontrados. cuadro queda como sigue (cuadro 7.7):
• 158 •
3. Calcular la frecuencia relativa (porcentaje) acu- Cuadro 7.6

mulada. Frecuencia de incumplimientos de los criterios evaluados
Este cálculo es la base para representar la Porcentaje
curva de Lorenz y poder identificar claramen- Número de incumplimien-
Criterio (Frecuencia
tos (frecuencia absoluta)
te los pocos vitales (aquellos criterios responsa- relativa)
bles de la mayoría de los defectos encontrados). 1. Diagnóstico correcto 15 4.4
Implica solamente ir sumando (acumulando) 2. Antecedentes familiares 12 3.5
al porcentaje de incumplimientos de cada cri- 3. Antecedentes personales 6 1.8
terio el porcentaje de incumplimientos que su-
4. Consumo de tabaco 42 12.3
ponen todos los anteriores a él en la tabla. La
frecuencia acumulada del último criterio de la 5. Consumo de alcohol 54 15.8
lista debe ser, naturalmente, 100. La tabla final 6. Peso y talla y/o IMC 9 2.6
de nuestros datos para análisis de Pareto que- 7. Auscultación cardiaca 15 4.4
daría como se muestra en el cuadro 7.8. 8. Exploración abdominal 36 10.5
9. Pulsos periféricos 30 8.8
5.2. Construcción del gráfico 10. Soplos carotideos 27 7.9
11. Edemas 45 13.2
1. Construcción del gráfico de barras con dos
12. Fondo de ojo 51 14.9
ejes (frecuencia absoluta y relativa) o uno solo
(frecuencia relativa). 342 100.0
El diagrama de Pareto es un gráfico para
comparar tipos de defectos de calidad encon-
trados y señalar cuáles son los pocos vitales
para diseñar la intervención para mejorar. Para
cumplir este objetivo es suficiente con repre-
sentar las barras con la frecuencia relativa de
incumplimientos de cada criterio (porcentaje
sobre total de incumplimiento en la muestra) y Cuadro 7.7
la curva de la frecuencia porcentual acumula- Frecuencia de incumplimientos de los criterios evaluados ordenados
da, con lo cual sólo necesitaríamos un eje para de mayor a menor
representar los porcentajes. Sin embargo, no Porcentaje
Número de incumplimien-
cuesta mucho construir el gráfico más comple- Criterio
tos (frecuencia absoluta)
(Frecuencia rela-
to, incluyendo la información sobre el número tiva)
absoluto de defectos que corresponde a cada 5. Consumo de alcohol 54 15.8
criterio. Para ello construimos el gráfico con 12. Fondo de ojo 51 14.9
dos ejes: uno a la izquierda para representar 11. Edemas 45 13.2
la frecuencia absoluta (número de incumpli- 4. Consumo de tabaco 42 12.3
mientos) y otro a la derecha para representar 8. Exploración abdominal 36 10.5
los porcentajes (frecuencia relativa); el eje para
9. Pulsos periféricos 30 8.8
la frecuencia absoluta tiene como rango de 0
al total de incumplimientos de la muestra, y 10. Soplos carotideos 27 7.9
el de la frecuencia relativa de 0 a 100. Ambos 1. Diagnostico correcto 15 4.4
deben tener el mismo tamaño. Cada barra, re- 7. Auscultación cardiaca 15 4.4
presentando a cada uno de los criterios, tiene 2. Antecedentes familiares 12 3.5
la altura que corresponde, a su vez, al número 6. Peso y talla y/o IMC 9 2.6
de incumplimientos (en el eje de la izquierda) 3. Antecedentes personales 6 1.8
y del porcentaje que supone sobre el total (en
342 100.0
el eje de la derecha). El eje de la derecha sir-
• 159 •
Cuadro 7.8 ve también para referencia de los puntos de la

Frecuencia absoluta, relativa (ordenadas) y acumulada de los incumplimientos curva de frecuencia acumulada.
de los criterios evaluados
Número de incumpli- Porcentaje 2. Completar el diagrama de barras con la cur-
Frecuencia va de frecuencia relativa acumulada.
Criterio mientos (frecuencia (Frecuen-
acumulada
absoluta) cia relativa)
5. Consumo de alcohol 54 15.8 15.8 3. Señalar el punto que acumula la mayoría (en
12. Fondo de ojo 51 14.9 30.7 torno a 60% o más) de los incumplimientos.
11. Edemas 45 13.2 43.9 El diagrama de Pareto que corresponde a
nuestros datos es el de la figura 7.10:
4. Consumo de tabaco 42 12.3 56.1
Como vemos, hay 4 criterios que repre-
9. Pulsos periféricos 30 8.8 75.4 sentan el 56.1% de los defectos de calidad (in-
10. Soplos carotideos 27 7.9 83.3 cumplimientos) encontrados y serían los pocos
1. Diagnostico correcto 15 4.4 87.7 vitales sobre los que debemos actuar priorita-
7. Auscultación cardiaca 15 4.4 92.1 riamente en nuestro esfuerzo para mejorar. En
2. Antecedentes familiares 12 3.5 95.6 ocasiones este porcentaje de los pocos vitales
6. Peso y talla y/o IMC 9 2.6 98.2
es mayor, hasta cumplirse o sobrepasar la ley
del 80/20.
El diagrama de Pareto es una forma senci-
342 100.0 lla, brillante e inteligente de presentar y ana-
lizar los datos de una evaluación, mostrando
dónde está el problema; es decir, lo que tene-
mos que mejorar. Sin embargo, es conveniente
100.0 hacer algunas puntualizaciones para su cons-
Núm. de incumplimientos (defectos)
300 90.0 trucción y uso:

80.0
250
70.0 5.3. Observaciones sobre la construcción e
200 60.0 interpretación de un diagrama de Pareto
56.1%
50.0 sobre defectos de calidad
150
40.0
100 30.0 En primer lugar hay que indicar que se asume
20.0 que todos los criterios y sus correspondientes
50
10.0 defectos son igualmente importantes; cual-
0 0.0 quier valoración sobre la diferente relevancia
5 12 11 4 8 9 10 1 7 2 6 3
de uno u otro tipo de defecto de calidad debe
Criterios
Total de incumplimientos
hacerse al margen del análisis con gráfico de
Porcentaje acumulado Pareto, y podrá, obviamente, modificar las
prioridades que marca el diagrama.
La segunda observación es de tipo formal:
Criterios cuando se representan un gran número de cri-
terios o causas hipotéticas, es habitual que va-
2. Antecedentes familiares 8. Exploración abdominal rios de ellos tengan un número pequeño de in-
3. Antecedentes personales 9. Pulsos periféricos cumplimientos y se agrupen en una sola barra
4. Consumo de tabaco 10. Soplos carotideos como otros al final del diagrama; en estos casos
hay que asegurarse siempre que el número de
incumplimientos de cualquier criterio agrupa-
do en otros es menor que el último represen-
Figura 7.10. Diagrama de pareto (datos del cuadro 7.8) tado de forma independiente. Por otra parte,
no hace buen efecto una barra de otros mucho
• 160 •
más alta que la última representada: rompe la les no deseables. Por ejemplo: ¿por qué el tiem- El diagrama de Pareto más
imagen del diagrama. po de espera es más largo de lo deseable?, ¿qué completo tiene dos escalas
Finalmente, aunque lo más frecuente es factores estructurales y organizacionales influ- y reúne dos gráficos: la
que el principio de Pareto se cumpla, no siem- yen en que el diagnóstico de la hipertensión no escala y eje de la izquierda.
pre es así y podemos encontrarnos con diagra- se haga correctamente?, etc. El segundo tipo de Este último va de 0 hasta el
total de incumplimientos
mas relativamente planos, en los que todos los estudios precisa de la medición simultánea del
de la muestra y sirve de
criterios tienen niveles parecidos de incumpli- nivel de calidad (reducido normalmente a un referencia para el gráfico
mientos. En estos casos, la priorización para in- solo criterio) y las causas hipotéticas que influ- de barras de la frecuencia
tervenir, si es que se establece alguna, se basará yen en la mala calidad. absoluta (númerode
en otras consideraciones (importancia relativa Como vimos en el capítulo 6, el análisis de incumplimientos) de
de cada criterio, facilidad de asumir su mejora, los datos de este tipo de estudios consiste esen- cada criterio; la escala
etc.) que no son las puramente cuantitativas. cialmente en ver el grado de asociación entre las de 0 a 100 en el eje de la
diversas causas hipotéticas y el nivel de calidad. derecha sirve de referencia
6. Análisis de los datos de estudios de Si las causas han sido medidas subjetivamente para representar la curva
causas hipotéticas (por ejemplo mediante encuesta de causas) su de frecuencia relativa
análisis puede hacerse mediante un diagrama acumulada. Ambas escalas
En los capítulos 5 y 6 vimos dos tipos de es- de Pareto (ver un ejemplo en las figuras 7.1 y deben tener altura idéntica.
tudios dentro de los ciclos de mejora: estudios 7.2 del capítulo 6); si por el contrario las causas
del nivel de calidad (capítulo 5), en los cuales hipotéticas se han medido empíricamente y te-
medimos el nivel de cumplimiento de los re- nemos datos reales, podemos realizar análisis
quisitos o criterios que de antemano sabemos estadístico y gráfico para evidenciar su asocia- El diagrama de Pareto
se relacionan con la calidad (en realidad son ción con el criterio o indicador de calidad que asume que todos los tipos
la definición operativa de calidad del servicio representa el problema a solucionar y siguien- de defectos son igualmente
que se evalúa); y estudios de causas hipotéti- do la metodología que sea más adecuada según importantes.
cas (capítulo 6), cuando lo que medimos es, el tipo de variables que hayamos medido. Todo
normalmente, sólo un criterio de calidad y ello fue revisado en el capítulo 6, que debe ser-
buscamos qué causas (frecuentemente de tipo vir de guía para el análisis y presentación de los
organizacional) pueden hacer que esté a nive- datos de este tipo de estudios.
El principio de Pareto no
siempre se cumple. En
estos casos, el diagrama no
resulta útil para priorizar
intervenciones para
BIBLIOGRAFÍA
mejorar.
• Briones G. Métodos y técnicas de investigación para las ciencias sociales. Distrito Federal: Trillas, 1990. Cap. 8 y 9.
• Farnum NR. Modern Statistical quality control and improvement. Belmont: Duxbury Press, 1994. Cap. 4.
• Juran JM. Conceptos básicos. En: Juran JM, Gryna FN, Bingham RS. Manual de control de la calidad. 2ª ed. Barcelon: Reverté,
1990. Cap. 2.
• Richards LE, LaCava JJ. Business Statistics. New York: McGraw Hill, 1983. Cap. 7.
En los estudios de causas
• Wadsworth HM, Stephens KS, Godfrey AB. Modern methods for quality control and improvement. New York: John Wiley and
hipotéticas se analiza la
sons, 1986. Cap. 9.
relación entre estas causas
y el criterio o indicador de
calidad que representa el
problema analizado.
La cuantificación subjetiva
de las causas mediante
encuesta a los implicados
puede analizase con
diagrama de Pareto.
• 161 •
Anexo 7.1
Intervalo (i) para un grado de confianza del 95%, según estimación puntual y tamaño muestral
• 162 •
Anexo 7.2
Las indicaciones y formatos que siguen están orientados a presentar y analizar los resultados de la evaluación realizada según los diseños
de estudio propuestos en los capítulos 5 y 6. Se subraya que las estimaciones de cumplimiento de los criterios deben darse con sus
correspondientes intervalos de confianza y que en el análisis de los defectos de calidad o incumplimientos de los criterios evaluados, o
en su caso, de las causas hipotéticas, es útil emplear un diagrama de Pareto completo (dos ejes, diagrama de barras, curva acumulada y
punto de corte de los pocos vitales).
Estimación del grado de cumplimiento de los criterios evaluados
Si se han evaluado todos los casos (censo o universo de casos) en vez de una muestra, el grado de cumplimiento real del criterio (C) se
desprende de la siguiente fórmula:
Nc
C=
N
Nc: número de cumplimientos
N: tamaño del marco muestral
Para expresarlo como "porcentaje" se multiplica por 100
En el caso, más frecuente, de que la evaluación se haya realizado en una parte representativa del conjunto de los casos (una muestra),
el cumplimiento real del criterio (C) no se puede conocer con exactitud debido a que el propio proceso de muestreo ha introducido un error
en la medición.
Sin embargo, sí se puede establecer, con una determinada probabilidad (grado de confianza), el intervalo de valores en el que
se encuentra comprendido el cumplimiento real del criterio. Sus límites (máximo y mínimo) se pueden determinar fijando previamente
la confianza del intervalo y calculando posteriormente: (i) la estimación puntual del nivel de cumplimiento y (ii) el error estándar de la
medición. Este procedimiento se desarrolla en las siguientes etapas y es el que se deberá seguir cuando se hayan evaluado muestras.
Paso 1º. Para estimar el nivel de cumplimiento puntual (P) y darlo como porcentaje, la fórmula que se utiliza es análoga a la anterior cuando
la muestra se ha obtenido mediante un procedimiento sistemático, aleatorio simple o estratificado proporcional:
nc
P= • 100
n
nc: número de cumplimientos en la muestra
n: tamaño de la muestra
Pero si se ha efectuado un muestreo estratificado no proporcional, se debe realizar un cálculo ponderado en base al peso relativo de cada
estrato, aplicando la siguiente fórmula: 1
P= ∑ Nh • Ph
N
N: Tamaño del universo de estudio
Nh: Tamaño de cada estrato.
Ph: Proporción de cumplimiento en la muestra de cada estrato
Como siempre, para expresarlo como porcentaje lo multiplicaremos por 100
Continúa.../
• 163 •
/... continuación
Paso 2º. Una vez que se ha realizado la estimación puntual debe tomarse una decisión en rela¬ción al grado de confianza; con él se va a
determinar el intervalo. Habitualmente se consideran como valores aceptables los que son iguales o superiores al 95%. A esta confianza
le corresponde un valor z (variable tipificada de la curva normal) de 1.96. Valores correspondientes a otros valores de confianza utilizados
habitualmente se encuentran también en el cuadro 7.1 de este capítulo.
Paso 3º. Calcular el error estándar o desviación estándar de la estimación puntual y el correspondiente intervalo para la confianza elegida
(i). Aunque las operaciones de cálculo son bastante sencillas, se pueden simplificar utilizando una hoja de cálculo o una calculadora
programable, especialmente cuando se han evaluado varios criterios. Las fórmulas, dependiendo del muestreo empleado, son:
Muestreo aleatorio simple o sistemático:
p(1 - p)
i=z•
n
Muestreo aleatorio estratificado proporcional:
1-f nh
i=z• ∑ Wh Ph (1 - Ph)
n nh - 1
Muestreo aleatorio estratificado no proporcional:
Ph (1 - Ph)
i=z• ∑ Wh2 (1 - fh)
nh - 1
N: tamaño de la muestra
N: tamaño del universo o marco muestral.
h: número de estratos
nh: tamaño de la muestra en cada estrato
Nh: tamaño de cada estrato
Σ: sumatorio de todos los estratos.
Ph: proporción de cumplimientos de cada estrato
fh: fracción de muestreo en cada estrato.
n
f: fracción de muestreo f:=
N
Wh: proporción de casos de cada estrato (Nh) en el total del universo muestral:
N
Wh = h
N
Si hemos decidido una confianza del 95%, el valor de z será 1.96 en todas las fórmulas.
n
Paso 4º. Reajustar el intervalo en función del tamaño del universo si > 0.1' , y el muestreo empleado ha sido aleatorio simple o
N
sistemático mediante la fórmula siguiente:
N-n
i (ajustada)= i •
N-1
Paso 5º. Establecer el valor máximo y el valor mínimo (intervalo de confianza [IC]) dentro del cual se encuentra el grado de cumplimiento
real del criterio con la probabilidad (confianza) fijada en el paso 2º (habitualmente del 95%).
IC(95%) = P ± i
• 164 •
Análisis de los defectos de la calidad y priorización de la intervención. Diagrama de Pareto
Elaboración de la tabla de frecuencias absolutas y relativas
Paso 1º. Diseñar una tabla con el listado de los criterios y, para cada uno de ellos, su frecuencia absoluta y relativa de incumplimientos.
Esta última se calcula dividiendo la frecuencia absoluta de incumplimientos del criterio en cuestión entre el total de
incumplimientos hallados en la muestra (suma de incumplimientos de todos los criterios). En caso de haber medido causas
hipotéticas, se trata cada una de ellas como un criterio. Si se ha hecho una encuesta de causas, se considera el número de
casos que cada causa se valora como muy importante.
Paso 2º. Clasificar los criterios de la tabla en orden decreciente al número de incumplimientos.
Paso 3º. Calcular la frecuencia relativa acumulada sumando al porcentaje relativo de incumplimientos de cada criterio los
incumplimientos que suponen todos los anteriores a él en la tabla.
Elaboración del gráfico
Paso 4º. Representar mediante barras en el eje de abscisas (eje x) de un plano cartesiano los criterios empleados en la evaluación. La
altura de cada barra corresponde a las frecuencias absoluta y relativa de incumplimientos, tomando como referencia los ejes
verticales (y) izquierdo y derecho respectivamente. Ambos ejes alcanzan la misma altura correspondiendo el izquierdo al
total de incumplimientos y el derecho al porcentaje relativo (0-100%).
Paso 5º. Dibujar la curva de frecuencia relativa acumulada.
Paso 6º. Señalar, en la curva anterior, el punto que corresponde al 60-80% de los incumpli¬mientos encontrados y comprobar si se
cumple la ley de los pocos vitales y muchos triviales, en cuyo caso, la priorización de la intervención se dirigirá a los criterios
comprendidos dentro de los pocos vitales.
Nota: si se han estudiado causas hipotéticas, cada una de ellas es como si fuera un criterio. Si se ha estudiado una encuesta de causas, se grafica la
frecuencia con que se da a cada una la valoración de “muy importante”.
• 165 •
Capítulo 8
Diseño de intervenciones
para mejorar
1. Contextualización
2. Diseño de intervenciones para mejorar. Directrices generales
3. Métodos para un diseño participativo
2 Identificación
Monitorización
Elaboración
medir calidad


Diseño
Capítulo 88
Capítulo
de intervención



Contenido general
Saber qué hacer para mejorar los aspectos evaluados y diseñar su puesta en práctica es el
objetivo central de los ciclos de mejora. Este capítulo desarrolla este paso esencial del ciclo,
haciendo énfasis en la importancia de basar las intervenciones en los datos obtenidos y
en la necesidad de hacer partícipe en su diseño a todos los que vayan a estar implicados
en su puesta en práctica. Junto a las directrices generales sobre estos temas, se describen
metodologías (diagrama de afinidades, encuesta de intervenciones, votación múltiple) para
realizar diseños participativos de una forma estructurada.

1. Razonar las intervenciones para mejorar, sobre la base de la información obtenida en la
evaluación.
2. Compartir la identificación de soluciones con los compañeros implicados.
3. Conducir la construcción de un diagrama de afinidades.
4. Construir un diagrama de afinidades.
5. Conducir un grupo de votación múltiple.
6. Resumir los resultados de un grupo de votación múltiple.
7. Describir en términos operativos la intervención propuesta para mejorar el problema
evaluado.
Diseño de intervenciones Capítulo
para mejorar 8
¡Datos, datos, datos!- gritó impacientemente-. ¡No puedo hacer ladrillos sin arcilla!”
Sherlock Holmes
El diseño de la intervención
1. Contextualización te eso: que sean efectivas para elevar el nivel
para mejorar se basa
de calidad. principalmente en el
Después de analizar el problema de calidad Podríamos enumerar un listado más o análisis y discusión de
(capítulo 3), decidir con qué criterios vamos a menos extenso de características de la inter- los resultados de la
medir el nivel a que nos encontramos (capítulo vención para mejorar, de forma que nos ase- evaluación, pero hay
4) y, sobre todo, tener datos que analizar y dis- guremos que la efectividad sea más probable; métodos estructurados
cutir (capítulo 7), debemos decidir qué hacer características como que sea realista, factible, para asegurarse que sea
para mejorar y poner en práctica las acciones aceptada y consensuada, válida, etc. Un lista- participativo y hacer
de mejora que se hayan acordado. do que podría ser semejante al que vimos para seguimiento de su
Para estos últimos objetivos, diseñar y po- definir los criterios de calidad en el capítulo 4 implementación. En este
ner en práctica la intervención para mejorar, (de hecho, los criterios de calidad también los y en el siguiente capítulo
basta en ocasiones con discutir qué es lo que definimos como objetivos de calidad que que- se revisa una selección de
estos métodos.
hay que mejorar con los implicados en el pro- ríamos cumplir o tener). Sin embargo, vamos a
ceso que se ha revelado defectuoso o con nivel seleccionar dos requisitos que son de especial
de calidad mejorable. Sin embargo, al diseñar relevancia en el diseño de intervenciones para
la intervención, también podemos utilizar mé- mejorar: (i) que se base siempre que sea posible
todos estructurados que aseguren la participa- en datos y su análisis; y (ii) que se diseñen y
ción de los implicados en implementarla, así acuerden de forma participativa, con la impli-
como formas de realizar un seguimiento explí- cación de quienes han de ponerlas en práctica.
cito de su puesta en marcha. En este capítulo
se explica una selección de estos métodos, efi- 2.1. Diseño de intervención basada en datos
caces pero de aplicación sencilla, para realizar
un diseño participativo de la intervención, y en Hemos visto en los capítulos anteriores que
el siguiente capítulo las relativas al seguimien- tanto la identificación de oportunidades de
to de la implementación. De entre los métodos mejora como el análisis de sus causas pueden
útiles para un diseño participativo vamos a realizarse sin disponer de datos, utilizando
destacar la encuesta de intervenciones, la vo- exclusivamente el conocimiento directo que Los estudios de causas
tación múltiple y, sobre todo, el diagrama de se pueda tener de los servicios que se consi- hipotéticas se realizan
afinidades por su sencillez y versatilidad de deran. De igual manera, es posible decidir, sin con cierta frecuencia sin
aplicación en éste, pero también en otros pasos realizar medición alguna, cuáles son las causas medición directa y la
intervención se basa en el
del ciclo de mejora. principales de la calidad deficiente (sobre todo
conocimiento que se tiene
cuando hablamos de causas hipotéticas, no de sobre el proceso analizado.
2. Diseño de intervenciones para mejorar. criterios o requisitos de calidad) y las interven- No así los estudios de
Directrices generales ciones que debemos poner en marcha para eli- nivel de calidad que
minarlas. Aunque siempre va a ser necesario habitualmente cuantifican
La principal virtud que pueden tener las accio- medir al menos un criterio o indicador para el nivel de cumplimiento de
nes que tomemos para mejorar es precisamen- saber el punto de partida y si hemos logrado los criterios diseñados.
• 171 •
Las intervenciones son o no mejorar tras la intervención, se utilizan frecuente es “yo lo hago correctamente pero no
más efectivas si se basan métodos estructurados para el consenso sobre tengo tiempo de registrarlo”. ¿Cómo reaccio-
en datos y se diseñan con causas e intervenciones como el diagrama de nar ante ello?, ¿puede ser cierto que no sea la
la participación de los causa y efecto y el análisis de campos de fuerza (ya calidad de la atención lo que hayamos evalua-
implicados en ponerlos en vistos en capítulos anteriores) y el diagrama de do? Al realizar cualquier medición estamos ex-
práctica.
afinidades (que veremos más adelante). Dichos puestos a una serie de errores dependientes de
métodos en ocasiones se utilizan sin que ven- la fuente de datos utilizada, del instrumento de
gan precedidos o acompañados de medición medida y del propio método de medición; sin
con datos reales de las suposiciones que los embargo, todo ello debe estar suficientemente
sustentan. Esto es más frecuente a la hora de controlado y no justifica una descalificación to-
decidir cuáles son las causas hipotéticas (nor- tal del tipo de la que se suele argumentar. Este
malmente estructurales, organizativas, propias argumento se contrarresta por sí solo si los cri-
de un contexto concreto) de que los criterios o terios que hemos medido son suficientemente
requisitos de calidad no se cumplan. relevantes, de forma que la historia clínica (y
Si queremos ser estrictos y rigurosos, antes lo que en ella se anote) más que una fuente de
de intervenir deberíamos realizar una medi- datos es, para esos criterios, un instrumento
ción de estas causas hipotéticas y un estudio necesario para la correcta atención al problema
estadístico de su asociación o no al problema de salud que se evalúa. Esta característica se da
de calidad considerado, tal y como se explica claramente cuando ocurre uno de los casos si-
en el esquema del capítulo 6. guientes (resumidos en el cuadro 8.1):
Sin embargo, si lo que hemos realizado es
un estudio del nivel de calidad, es decir, del ni- (i) El dato que buscamos en la historia forma
vel de cumplimiento de una serie de criterios o parte indiscutible del proceso asistencial, de
requisitos de calidad, hacemos equivalente cri- modo que su ausencia condiciona actuaciones
terio incumplido a causa de calidad deficiente, posteriores y/o la interpretación de otros datos
y lo que hemos de hacer es ver qué criterios y del proceso. Es el caso, por ejemplo, de los con-
en qué medida se incumplen, tal como hemos tenidos de las visitas de control, los resultados
visto en el capítulo 7; reflexionaremos sobre la de exploraciones realizadas o los tratamientos
forma en que podamos hacer que se cumplan. prescritos. ¿Para qué se hacen los controles sino
En ocasiones, no habitualmente, puede ser sirven para ver una evolución?, ¿cómo vamos
necesario realizar un estudio de causas hipo- a saber qué se ha prescrito con anterioridad a
téticas del incumplimiento de un determinado la hora de analizar otras alternativas, si fiamos
criterio para encontrar la mejor forma de inter- este dato exclusivamente a nuestra memoria y
venir sobre él. Esta opción está representada en la del paciente? Esto es atención defectuosa.
el esquema gráfico introducido que aparece al
principio de cada capítulo, pero lo más impor- (ii) El dato que buscamos en la historia lo sabe-
tante es la reflexión cualitativa estructurada en mos necesario para la valoración del paciente
torno a cómo mejorar los criterios que no se y antes o después lo vamos a indagar, de forma
cumplen. que si lo indagamos y no lo anotamos, corre-
mos el riesgo de repetir (nosotros mismos u
A veces se desconfía de los 2.2. Medición de las causas y calidad de los
datos que se han extraído registros
de historias clínicas u otros
sistemas de registro. La Otra cuestión diferente y que aparece con fre-
mejor manera de prevenir Cuadro 8.1
cuencia en la discusión sobre los niveles de Evaluación con base en datos registrados
este problema es una
selección adecuada de
cumplimiento de los criterios de calidad, si éstos
los criterios, de forma han sido medidos en historias clínicas u otros Más válida si:
que su anotación forme documentos de registro de actividades realiza- l El registro del dato es importante para el proceso que
parte claramente del das, es el tema de si los datos que tenemos mi- se evalúa.
propio proceso asistencial den la calidad de la atención o la calidad de los l El registro del dato evita repeticiones.
evaluado. registros o historias clínicas: el argumento más
• 172 •
Diseño de intervenciones para mejorar
otros profesionales) preguntas y exploraciones diseñar cómo actuar para mejorar. Ya hemos Existen varios métodos
que sólo hace falta hacer una vez. Este sería el apuntado la necesidad de que este diseño sea grupales para realizar un
caso de los antecedentes familiares, personales participativo, incluyendo e implicando a los diseño de intervención
y toda la serie de exploraciones básicas que hay que están de todas formas implicados en el participativo; aunque no
que realizar en caso de patologías crónicas. proceso que vamos a mejorar. siempre es necesario ni
obligatorio utilizar alguno
de ellos, vamos a destacar
En todos estos casos no vale el argumento 3. Métodos para un diseño participativo la utilidad para este fin del
“yo lo hago pero no lo anoto” como forma de Diagrama de Afinidades.
justificar una buena actuación profesional: la La mera discusión de los datos y de las suge-
propia no anotación la convierte en actuación rencias del equipo implicado en relación a las
defectuosa por su probable repercusión en actuaciones para mejorar puede ser suficiente
valoraciones posteriores del mismo paciente, para decidir qué hacer. No obstante, muchas
o en la repetición innecesaria de preguntas y veces es conveniente realizar la discusión de
exploraciones. forma estructurada y con un cierto método que
Conviene insistir, sin embargo, en la nece- garantice un uso eficiente de las aportaciones
sidad de que los datos que se vayan a buscar en de todos, a la vez que nos asegura lo más posi-
la historia clínica u otros registros, estén perfec- ble su implicación y la sensación de “pertenen-
tamente justificados en función de su interés para el cia” sobre las actuaciones acordadas.
proceso asistencial a valorar. La historia clínica y El cuadro 8.2 contiene una relación de al-
documentos semejantes son un medio, no un gunos de los métodos que pueden ayudar a
fin en sí mismos. Puede ser un inconveniente realizar este diseño participativo de forma es-
para la credibilidad y justificación de los ciclos tructurada. Dos de ellos ya han sido vistos con
de mejora basarlos en lo que se registra o no, otros fines en otros capítulos (por ejemplo la
sin asegurarse previamente la importancia, técnica de grupo nominal en el capítulo 2 como
para un determinado proceso asistencial, de lo método grupal cualitativo para priorizar pro-
que se va a medir. blemas de calidad). Si se revisan sus objetivos
En realidad, más que el probable (e injusti- y funcionamiento, se hace fácilmente eviden-
ficable, si los criterios son adecuados) infrare- te su utilidad también para diseñar interven-
gistro, lo que puede resultar problemático para ciones concretas en los ciclos de mejora; sólo
valorar la calidad en base a datos registrados hay que formular el objetivo del análisis, ha-
es lo contrario: que se registre como hecho algo ciendo de la propuesta de acciones concretas
que en realidad no se haya hecho. Afortuna- el objetivo de reflexión para el grupo nominal.
damente no parece ser lo más frecuente, pero Los otros métodos mencionados en el cuadro
en algunos estudios observacionales (compa- 8.2, también pueden utilizarse con objetivos
rando lo que se observa que se hace con lo que diferentes a la búsqueda de intervención para
queda registrado) se ha visto que este proble- mejorar; por ejemplo la encuesta de causas/
ma puede existir, sobre todo para aparentar intervenciones y la votación múltiple son de
que se cumple con requisitos y protocolos obli- utilidad en el análisis de problemas y cuantifi-
gatorios. Un caso de este tipo lo hemos visto cación de causas, si no queremos realizar una
recientemente en nuestro medio hospitalario
en relación a la cumplimentación de la lista de
comprobación (checklist) quirúrgica. La conclu-
sión sería que ante una evaluación con base
Cuadro 8.2
en datos registrados, más que cuestionar los
Métodos para un diseño de intervención participativo
cumplimientos bajos (que siempre van a ser
problemas de calidad si los criterios están bien
l Análisis de campos de fuerza
elegidos y diseñados), lo único que podría ser l Técnica de grupo nominal
cuestionado es encontrar cumplimientos sos- l Encuesta de causas y/o intervenciones
pechosamente altos. l Votación múltiple
En cualquier caso, una vez ante los datos l Diagrama de afinidades
analizados y discutidos, debemos proceder a
• 173 •
El diagrama de afinidades medición empírica, tal como vimos en el capí- equivocarse si las percepciones del grupo no
es una técnica grupal tulo 6. Probablemente el diagrama de afinida- son las correctas. La reevaluación de la cali-
que consiste en ordenar des es, junto a la encuesta de causas/interven- dad con base en los criterios o el indicador que
las intervenciones y ciones, uno de los métodos más genuinamente representa el problema y su comparación con
convertirlas en líneas de útiles para diseñar estrategias e intervenciones la situación (medición) de partida va a ser la
actuación y es útil para
de forma participativa, y es conveniente des- única forma de saber si el grupo estuvo o no
recoger todas las ideas
del grupo para mejorar
tacarlos sobre los demás. Vamos a recordar acertado.
el problema evaluado en brevemente en qué consiste la encuesta sobre
un plan de acción. Para causas y la votación múltiple, y revisar más en 3.3. Diagrama de afinidades
ello hay que seguir unos detalle el diagrama de afinidades.
pasos perfectamente La construcción de un diagrama de afinida-
estructurados 3.1. Encuesta sobre intervenciones para des es un proceso grupal que comienza con la
mejorar generación de ideas, opiniones, o de activida-
des sobre el tema que se propone, y que ter-
Tanto el formato de las preguntas como la es- mina con esas ideas o actividades ordenadas
cala de valoración pueden ser de varios tipos, de forma lógica en grupos afines que puedan
pero finalmente lo que se persigue es tener constituir los elementos de la estrategia a em-
una cuantificación/priorización de las diver- prender y las actividades a realizar. Es posible
sas acciones en relación a su importancia para combinar el diagrama de afinidades con otros
resolver el problema. El resultado de la en- métodos estructurados, como por ejemplo la
cuesta puede presentarse y analizarse con un encuesta de intervenciones, realizando el dia-
diagrama de Pareto, en donde se subrayen y grama como complemento de estos otros mé-
prioricen las actividades que han de componer todos, pero también puede ser utilizado inde-
la intervención en función de la valoración re- pendientemente para ordenar y dar forma a
cibida. las ideas que el grupo tenga sobre las interven-
En el capítulo 6 se explica con un ejemplo, ciones a realizar.
relacionado con la investigación de causas que La generación de ideas para el diagrama
conviene revisar, puesto que la utilidad de este de afinidades es similar a la lluvia o tormenta
método es similar para priorizar intervencio- de ideas (brainstorming) en relación a la inexis-
nes. El procedimiento es idéntico cuando lo tencia de límites en su número, y se parece a
que queremos es priorizar intervenciones. La la técnica del grupo nominal en el que cada in-
única diferencia es que en vez de preguntar so- dividuo del grupo debe de escribir las suyas,
bre las posibles causas, se pregunta sobre las de forma individual, antes de que se discu-
posibles intervenciones. tan o se comparen con las expresadas por los
demás. Los pasos a seguir son los siguientes
3.2. Votación múltiple (cuadro 8.3).
La votación múltiple es también un método Cuadro 8.3

para seleccionar las intervenciones más im- Diagrama de afinidades
portantes de la lista que se haya elaborado.
Pasos:
Consiste en una serie de votaciones entre los
1. Planteamiento del problema.
implicados en el proceso a mejorar, cada una
(Una pregunta: ej.: ¿Qué intervención?)
de las cuales reduce la lista hasta que quedan 2. Cada miembro del grupo anora acciones concretas.
seleccionadas aquellas sobre las que basar la (Regla de las tres palabras)
estrategia de mejora. Los pasos a seguir son 3. Todas las acciones se ponen en el tablón sin orden
Los métodos de consenso
los mismos que cuando se utiliza para priori- concreto.
que no manejan datos zar causas, solo que el listado de partida es un 4. Agrupación de las acciones en líneas estratégicas.
tienen el riesgo de listado de acciones vez de causas hipotéticas. 5. “Nombrar” los grupos de acciones o líneas estratégicas.
equivocarse si las La votación múltiple no deja de ser una (Unir las acciones parecidas, considerar las acciones
técnica de consenso que tiene el riesgo, como “huérfanas”)
percepciones del grupo no
6. Describir el resultado.
son las correctas. todas las técnicas que no manejan datos, de
• 174 •
1. El coordinador del grupo que va a realizar la información sobre hábitos tóxicos (tabaco El diagrama de afinidades
actividad plantea el problema, cuestión o pre- y alcohol) si señalamos la casilla del “sí”. produce un consenso
gunta que se quiere resolver con esta técnica. (ii) Utilizar papel autoadhesivo, fácil de pegar sobre el plan de acción
Por ejemplo, a la vista de los resultados con- y despegar, para realizar posteriormente de forma fácil y rápida, y
cretos que hemos obtenido en la evaluación las agrupaciones y reagrupaciones tanto puede completarse con
algún instrumento para
del nivel de calidad ¿qué podemos hacer para si se realizan sobre una mesa, como si se
asegurar y supervisar la
mejorar? realizan sobre un tablón. implementación del plan
En este paso no hay discusión de gru- de acción.
2. Cada miembro del grupo da sus respuestas po, cada uno individualmente escribe tan-
a la pregunta propuesta. Estas respuestas no se tas notas como ideas tiene para proponer.
dan abiertamente sino que se escribe cada una (iii) Todas las ideas o propuestas de acciones
de ella en un papel pequeño (después hay que generadas se ponen encima de la mesa o
examinarlas todas a la vez y reagruparlas junto en un tablón sin orden concreto; estando
con las de los demás). Para esta actividad hay todas a la vista, se puede proceder a su
dos recomendaciones que facilitan los pasos comparación y ordenación.
posteriores del diagrama: (iv) Agrupación de las acciones en grupos
(i) Las respuestas que se den no han de ser lógicos, afines o relacionados. Si el grupo
muy largas sino escuetas; pero tampoco tan de personas que está contribuyendo al
escuetas como para que no esté claro qué diagrama es numeroso, se toman turnos
queremos decir; algunos autores sugieren de tres o cuatro personas que realizan las
que se siga la “regla de las tres palabras”, agrupaciones de ideas durante un cierto
según la cual, cada idea debe exponerse tiempo (por ejemplo, 5 minutos) y luego
con un mínimo de tres palabras que inclu- dan paso a otros miembros del grupo; si
yan preferentemente un sujeto, un verbo el grupo es pequeño (tres a cinco perso-
y su predicado. Por ejemplo, si pensamos nas) puede realizarse esta actividad uno a
que hay que formarse sobre alguna cues- uno. Es importante que sea sólo la persona
tión concreta no se debe escribir como idea o grupo que esté realizando en cada mo-
“formación” sino formación sobre qué y a mento la agrupación de las propuestas las
quién. Supongamos, por ejemplo, que el únicas que opinen, discutan o actúen sobre
criterio sobre exploración de fondo de ojo la ordenación, hasta que finalmente que-
en el hipertenso no se cumple porque nun- den los grupos de ideas establecidos. Hay
ca nadie nos enseñó a hacerlo, y pensamos una serie de recomendaciones a tener en
que debe hacerlo el médico; la actividad o cuenta para que éste paso, probablemente
idea que vamos a proponer es “formación el más importante de todo el proceso, se
sobre exploración de fondo de ojo a los mé- realice con la mayor eficiencia:
dicos del centro”. Si pensamos que el pro- - Procurar no forzar una idea dentro de
blema es que el sistema de registro es defi- un grupo con el que no esté claramente
ciente y no nos recuerda o invita a realizar relacionada. Por ejemplo, las actuacio-
la anamnesis y exploración completa que nes de formación no tienen nada que
debemos hacer, la idea sería “modificar la ver con las modificaciones de los regis-
estructura del sistema de registro”; o pode- tros, pero pueden relacionarse con otras
mos explicitar aún más qué tipo de modi- acciones que tengan que ver con el per-
ficación creemos que es importante, como sonal y las actividades que tengan que
por ejemplo “añadir casillas con respuesta realizar.
“si” y “no” para la anamnesis sobre tabaco - Puede haber ideas “huérfanas” no re-
y alcohol”, porque podemos pensar que lacionadas con ninguna otra: dejarlas
de este modo , al tener forzosamente que como tales.
señalar que no, desaparece la ambigüe- - Si se produce un desacuerdo irreconci-
dad de pensar que cuando estén en blanco liable sobre dónde agrupar una deter-
quiere decir que no fuma o no bebe, ade- minada acción, puede duplicarse y co-
más de que nos da pie para completar la locarse en más de un grupo.
• 175 •
Esta agrupación de ideas o acciones Cuadro 8.4

para mejorar en grupos afines, es lo que Ejemplo de diagrama de afinidades
da el nombre a esta técnica, cuyo si- ¿Qué hacer para mejorar la detección, diagnostico y
guiente paso es precisamente explicitar estudio inicial del hipertenso?
cuáles son los grupos de acciones que
1. Formación del personal médico
hemos identificado.
(v) Nombrar los grupos de acciones o líneas l Exploración de fondo de ojo
estratégicas. Una vez que el grupo está de l Interpretación e informe de ecg
acuerdo en la agrupación y parece que no 2. Cambios en los sistemas de registros
es posible cambio razonable alguno, se
procede a dar nombre a los grupos forma- l Poner casillas si y no para los hábitos tóxicos
dos. Pueden resultar, por ejemplo, accio- l Incluir explícitamente todos los ítems que hay
que explorar
nes de formación, reorganización del tra-
l Eliminar lo que no sea necesario
bajo, cambios en los sistemas de registro, l Incluir recordatorios al principio indicando que
adquisición de material, etc. Cada una de un ítem en blanco no quiere decir que es normal
estas líneas estratégicas contiene activida- sino que no se ha explorado
des concretas que vamos a poner en mar- 3. Organización del trabajo
cha. Todas ellas configuran la intervención
a realizar para mejorar. l Establecer circuitos y responsabilidades de
(vi) Describir el resultado de forma clara y médicos y enfermería para la detección de hiper-
tensos
ordenada para que todo el grupo y el res-
l Establecer sistemas específicos de cita y recorda-
to del centro sepan qué es lo que vamos torios para los pacientes en proceso de diagnós
a hacer para mejorar. Esta descripción tico inicial
puede hacerse como diagrama de árbol l Establecer algoritmo de procedimientos a reali-
(cada rama principal es una línea estraté- zar para incluir al paciente en programa
gica) o como simple relación de acciones
agrupadas. El cuadro 8.4 es un ejemplo de
diagrama de afinidades, resultado de una
reflexión grupal sobre qué hacer para me-
jorar la detección, diagnóstico y estudio nalmente, la participación no verbal que impli-
inicial del hipertenso. ca, facilita la participación de todo el mundo,
incluso de los que habitualmente no lo hacen.
Las ventajas de explicitar las acciones a tomar Finalmente, queda claro para todo el esbozo
con un diagrama de afinidades son varias. En de plan de acción que puede completarse asig-
primer lugar implican a todo el grupo. En se- nando responsabilidades concretas para cada
gundo lugar, son normalmente fáciles de hacer acción y utilizando alguno de los métodos
y, aunque se propongan muchas ideas, se al- para asegurar y supervisar su puesta en mar-
canza el consenso fácil y rápidamente. Adicio- cha, como veremos en el siguiente capítulo.
BIBLIOGRAFÍA
• Goldfield N, Pine M, Pine J. Techniques for analyzing processes and managing team decisions. In: Measuring and managing
health care quality. Aspen, 1995. Vol I, Cap. 5.
• Leebow W, Ersoz CJ. Tools for tageting improvements. In: The health care manager´s guide to continuous quality improvement.
Chicago: AHA, 1991. Cap. 11.
• 176 •
Anexo 8.1
Se debe intentar la intervención oportuna para mejorar, a la vista de los resultados de la evaluación del nivel de calidad y/o del estudio
de causas hipotéticas. Utilizando los métodos reseñados en este capítulo se pretende que esta intervención se describa de forma
estructurada a través de un diagrama de afinidades, a realizar preferentemente en grupo (con los implicados en el problema a resolver)
o de forma individual ordenando en grupos afines todas las posibles acciones para mejorar. Para ello:
1. Seguir los pasos para la elaboración de un diagrama de afinidades que se indican en el apartado 3 de este capítulo.
2. Plasmar el resultado en una hoja, con formato semejante al del cuadro 8.4 de este capítulo.
Otra alternativa recomendable es realizar una encuesta de intervenciones y resumir los resultados con un diagrama de Pareto, tal como
se muestra en los capítulos 6 y 7.
• 177 •
Capítulo 9
Implementacion de intervenciones
para la mejora de la calidad.
Métodos de seguimiento y control
2. Métodos de apoyo para la implementación de la intervención para mejorar
3. Seguimiento de la implementación de la intervención para mejorar
2 Identificación
Monitorización
Elaboración
medir calidad


Capítulo 9 9
Capítulo de la intervención y discusión Capítulo 7
Capítulo 8 Diseño
de intervención



Contenido general
Saber qué hacer para mejorar los aspectos evaluados y diseñar su puesta en práctica es el
objetivo central de los ciclos de mejora. Este capítulo complementa al anterior, en el que se
muestran metodologías para el diseño participativo de intervenciones para mejorar, revisando
métodos y herramientas para planificar y controlar su puesta en práctica (diagrama de Gantt,
diagrama de problemas anticipados, carteles narrativos).

1. Estructurar los componentes y responsabilidades de la intervención propuesta.
2. Construir un Diagrama de Gantt.
3. Desarrollar un Cartel Narrativo del Ciclo de Mejora.
4. Analizar estructurada y explícitamente los problemas que puede tener la puesta en prác-
tica de la intervención diseñada.
Implementacion de intervenciones Capítulo
para la mejora de la calidad. 9

Métodos de seguimiento y control
El uso de carteles narrativos

1. Contextualización también complejas como el PERT (Program
y de instrumentos de
Evaluation and Review Technique). planificación operativos
Siguiendo los métodos descritos en el capítu- *
Sin embargo, en la mayoría de los casos, en como el diagrama de
lo anterior, ha de haber quedado especificada, nuestros ciclos de mejora algunas herramientas Gantt o el de problemas
tanto en términos de líneas estratégicas gene- más simples como el diagrama de problemas anticipados puede ser de
rales como de acciones específicas a realizar, anticipados y el diagrama de Gantt pueden ser utilidad para el éxito de la
la intervención a implementar para mejorar el suficientes; ambas herramientas se describirán intervención para mejorar.
problema evaluado. El siguiente paso es ha- en este texto. En nuestra experiencia, dichas
cer que la intervención diseñada sea una rea- herramientas, aunque recomendables, puede
lidad, es decir, implementarla. Asegurarnos incluso llegar a hacerse necesarias en las pro-
la implementación es, en esencia, un ejercicio puestas de mejora habituales, sobre todo al
de planificación operativa en el que tenemos principio de los programas o actividades de
que tener claro cuándo, cómo y quién tiene gestión de la calidad. El cuadro 9.1 contiene la
que hacer cada una de las acciones previstas. relación de métodos que vamos a revisar.
En este sentido, cualquiera de las herramientas
de utilidad para la planificación operativa nos 2.1. Diagrama de Gantt
puede ser de también de utilidad en esta fase
del ciclo de mejora. Sin embargo, nos vamos Los diagramas de Gantt son representacio-
a centrar en las más simples y de uso más co- nes de las actividades a realizar en un plan de
mún, poniendo énfasis en la conveniencia de acción de forma que se visualice su relación
utilizar alguna de ellas. temporal desde el principio hasta el fin de la
ejecución del plan. El esquema básico es el que
2. Métodos de apoyo para la
implementación de la intervención para
mejorar Cuadro 9.1
Métodos comunes para el seguimiento
Una vez decidido lo que hay que hacer para del proceso de mejora
mejorar, el plan de acción consecuente puede
ser muy simple y no necesitar de herramientas l Análisis y vigilancia de problemas anticipados
adicionales de planificación operativa. En esos l Diagrama de Gantt
El diagrama de Gantt
casos, la única recomendación que prevalece l Carteles narrativos
representa la secuencia
de los diversos métodos a utilizar es el uso de temporal correcta de las
un póster o cartel narrativo del proyecto para actividades del plan de
ir reflejando su progreso y explicitar, a la vista acción. Para un mayor
de todos, el compromiso contraído. Para pla- * Los fundamentos de esta herramienta pueden verse en los siguien- control, se puede dibujar
nes de acción complejos, pueden ser de utili- tes documentos: <http://www.uhu.es/eyda.marin/apuntes/admon/
tema9_I.pdf> http://ocw.uc3m.es/economia-financiera-y-contabili-
sobre él la marcha real del
dad herramientas de planificación operativa dad/economia-de-la-empresa/material-de-clase-1/PERT.pdf proyecto.
• 183 •
se presenta en la figura 9.1. En la parte izquier- Esquema para la elaboración de un diagrama de

da del diagrama están las diversas acciones o Gantt
actividades a realizar ordenadas en secuencia
temporal lógica, mientras que en el encabeza- En el diagrama de Gantt pueden introducirse
do (o a veces en la parte inferior) se representa algunas modificaciones que lo hacen aún más
la secuencia de unidades de tiempo que sea informativo y útil. Por ejemplo, junto a la co-
adecuada al plan (días, semanas, meses, etc.). lumna de tareas o actividades puede añadirse
El diagrama consiste entonces en señalar con otra en la que se especifican la persona o per-
un segmento o una barra horizontal el tiempo sonas responsables de esa actividad concreta;
de comienzo y final de cada una de las acti- de igual manera, es más útil como herramienta
vidades. De esta forma pueden verse las acti- de seguimiento del proyecto de mejora si se
vidades a realizar de forma paralela y las que va dibujando la línea de ejecución real de las
hay que realizar después de que se completen actividades en paralelo a la establecida en la
otras anteriores. También se evidencia el tiem- planificación inicial.
po mínimo de ejecución del plan, la secuencia Las intervenciones acordadas pueden
apropiada de actividades y aquellas que pue- plasmarse en uno o más Diagramas de Gantt.
den determinar retraso en la aplicación del A veces conviene tener un diagrama de Gantt
plan. En este sentido, el diagrama de Gantt es para cada una de las líneas estratégicas del
también una forma visualmente más atractiva diagrama de afinidades. En la figura 9.2 pue-
de presentar un diagrama PERT, otra de las he- de verse un ejemplo simple de diagrama de
rramientas clásicas de planificación operativa Gantt aplicado a la planificación operativa de
que ya hemos mencionado pero que no vamos los cambios a introducir en los sistemas de re-
a considerar aquí por su mayor complejidad y gistro, una de las líneas estratégicas acordadas
una menor aplicabilidad en los ciclos de mejo- en nuestro diagrama de afinidades del cuadro
ra normales. 8.4 del capítulo anterior.
Unidades de Tiempo (días, semanas, meses, etc.)

Tareas Actividades 1 2 3 4 5 6 7 8 9 10
1.
2.
3.
4.
5.
6.
7.
8.
9.
Figura 9.1. Esquema para la elaboración de un diagrama de Gantt
• 184 •
Implementacion de intervenciones para la mejora de la calidad. Métodos de seguimiento y control
Objetivo: Introducción de cambios en los sistemas de registro para el estudio inicial del hipertenso.
Plan de acción (diagrama de Gantt)
Semana
Tarea Responsables 1 2 3 4 5 6 7 8 9 10
1. Recoger y revisar los Juan
documentos existentes
2. Hacer propuesta de Juan y Carmen

diseño de cambios
3. Revisar propuesta con Carmen

todo el equipo
4. Pilotar modificaciones Rocío y José

acordadas
5. Discutir resultados Rocío y José
6. Aprobar Juan
7. Imprimir nuevo formato Miguel
8. Sustituir los antiguos Carmen

impresos por los nuevos
9. Promover y supervisar Juan, Rocío y José

su utilización
Figura 9.2. Ejemplo de diagrama de Gantt
2.2. Diagrama de problemas anticipados se trata de establecer una planificación con-

tingente a la evolución de la puesta en marcha El diagrama de problemas
Esta herramienta es la plasmación explícita del plan de acción diseñado. El enfoque de anticipados sirve
de los probables obstáculos esperables en base es semejante al de un AMFE (Análisis como herramienta de
Modal de Fallos y Efectos) aplicado frecuen- planificación contingente a
la puesta en marcha de las acciones acorda-
la aparición de obstáculos o
das, de forma que se fuerza a pensar tam- temente a la gestión de riesgos en relación a
problemas presumibles en
bién en las posibles soluciones para cuando la seguridad del paciente. relación al plan de acción
aparezcan. Es un diagrama que resulta un La figura 9.3 contiene el esquema básico de decidido.
complemento fácil y lógico para el análisis este diagrama, cuya práctica es, de todas for-
de campos de fuerza cuando ha sido este el mas, menos habitual y probablemente también
método utilizado para diseñar la estrategia menos efectiva y atractiva que los carteles na-
de la intervención para mejorar, dado que los rrativos, la más recomendable y sencilla de las
principales problemas esperables se derivan herramientas que sugerimos utilizar, aunque
normalmente de las fuerzas en contra identi- lo más indicado es empezar su construcción a
ficadas en este tipo de análisis. En definitiva la vez que se inicia el ciclo de mejora.
• 185 •
Resumen de la estrategia a implantar: (describirla)
¿Qué puede ir ¿Qué ¿Qué tan Atención Acciones Acciones para Responsables
mal? probabilidad importante es prioritaria preventivas minimizar de acción
hay de que el obstáculo? efectos
ocurra? (a) (b) (a x b)
1.
2.
3.
4.
5.
6.
etc.
(a) y (b): escala: 1 poco; 2 moderadamente; 3 mucho; 4 muchísimo.
Figura 9.3. Esquema para un diagrama de problemas anticipados
Cualquier actividad de 2.3. Carteles narrativos del proyecto de mejora implementar en la intervención para mejorar,
seguimiento formal su secuencia temporal y los responsables de las
o informal, es útil y El story board o cartel narrativo del proyecto de mismas.
conveniente en la medida mejora es una representación paso a paso del
que logre que la mejora se 3. Seguimiento de la implementación de
ciclo de mejora. Al utilizarlo estarán los espa-
consiga.
cios en blanco y se irán ilustrando y llenando a la intervención para mejorar
medida que vaya avanzando el proyecto. Para
cada paso del ciclo de mejora se va informan- Los métodos y herramientas que acabamos
do de las actividades clave y las herramientas de ver tienen como uno de sus principales
utilizadas. El que esté todo ello expuesto en objetivos el facilitar la continuación y el se-
un lugar visible fomenta la responsabilidad y guimiento del proyecto de mejora, segui-
compromiso del grupo de mejora encargado miento que resulta más fácil si utilizamos
del proyecto, a la vez que hace posible y fá- alguna de ellas. Sin embargo, también hemos
cil recibir comentarios y sugerencias de otros apuntado que muchas veces la intervención
profesionales del centro. La figura 9.4, que ya para mejorar se decide tras un simple análi-
mostramos en el capítulo 2, es un ejemplo de sis y discusión de los datos de la evaluación,
la estructura de un cartel narrativo. En la fase sin que se proceda a ningún tipo de planifi-
del ciclo de mejora en que nos encontramos en cación operativa explícita, con actividades,
este capítulo, deberían estar cumplimentados tareas, tiempos y responsabilidades. Aún en
los apartados de causas principales y solución, ese caso, sería conveniente establecer algún
además de todos los anteriores del cartel. Si mecanismo de seguimiento o comprobación
nos parece oportuno, puede añadirse también de que efectivamente, se están haciendo las
a continuación de estos dos apartados el Dia- cosas acordadas. Este seguimiento puede ser
grama de Gantt que explicita las acciones a algo tan simple como recordatorios o discu-
• 186 •
Implementacion de intervenciones para la mejora de la calidad. Métodos de seguimiento y control
Narración de EMC
Definición del problema Equipo Foto Cronograma
Mes
1 2 3 4 5 6 7 8
1
2
3
Nombres:
Actividad
4
5
6
7
8
Roles:
Análisis del problema Criterio Núm. incumplimientos % frecuencia

(frecuencia absoluta) (relativa)
Frecuencia
acumulada
Lista de criterios
1. Diagnóstico correcto 5. Consumo de alcohol 54 15.8 15.8
12. Fondo de ojo 51 14.9 30.7
2. Antecedentes familiares 11. Edemas 45 13.2 43.9
3. Antecedentes personales 4. Consumo de tabaco 42 12.3 56.1
4. Consumo de tabaco 9. Pulsos periféricos 30 8.8 75.4
5. Consumo de alcohol 10. Soplos carotideos 27 7.9 83.3
Listado de chequeo 1. Diagnóstico correcto 15 4.4 87.7
6. Peso y talla y/o IMC
Cuestionario sí/no 7. Auscultación cardiaca 15 4.4 92.1
7. Auscultación cardiaca 2. Antecedentes familiares 12 3.5 95.6
1. xxxxxxxxxxxxxxx
1. xxxxxxxx? ABC 6. Peso y talla y/o IMC 9 2.6 98.2
8. Exploración abdominal
Diagrama de causa y efecto 2. xxxxxxxxxxxxxxx
2. xxxxxxxx? ABC
9. Pulsos periféricos 342 100
3. xxxxxxxxxxxxxxx
3. xxxxxxxx? ABC
10. Soplos carotideos
4. xxxxxxxxxxxxxxx
4. xxxxxxxx? A B C
11. Edemas
Incumplimientos (%)
5. xxxxxxxxxxxxxxx
5. xxxxxxxx? A B C 100
12. Fondo de ojo
Cumplimientos (%)
Criterios Instrumentos
50
Flujograma
0
3. 6. 2. 1. 7. 10. 9. 8. 4. 11. 12. 5. 5. 11. 8. 10. 7. 6.
Gráfica de tendencia Criterios Criterios
Presentación y análisis de datos
Resultados
12.
1.
2. Antes Después Manteniendo
Causas principales Solución 11. 3.
lo alcanzado
%___ %___ %___

10. 4.
1. %___ %___ %___

9. 5.
100 342
Fecha Fecha Fecha
2. 8.
7.
6.
Mejora
222 100 ____ ____ ____
5. 11. 8. 10. 7. 6. 12. 11. 5. 8. 9. 4 10 7 6 2 1 3

Criterios Criterios
Análisis gráfico
Figura 9.4. Narración de EMC
siones sobre el proyecto en las reuniones del no tiene por qué ser más pura o científica si se
grupo, e incluso de manera informal con to- deja que la intervención actúe sola, sin sesgos.
dos aquellos que deben estar implicados en Si buscamos e identificamos alguna manera de
cambiar a mejor la manera de hacer las cosas. favorecer la mejora no previsto o no explicita-
Hay que tener presente que un ciclo de do en la estrategia diseñada, no hay que tener
mejora no es un trabajo de investigación, y la ningún reparo en ponerlo en práctica si funcio-
comprobación de la mejora tras la intervención na, es decir si conseguimos finalmente mejorar.
• 187 •
BIBLIOGRAFÍA
• Goldfield N, Pine M, Pine J. Techniques for analyzing processes and managing team decisions. In: Measuring and managing
health care quality. Aspen, 1995. Vol I, Cap. 5.
• Leebow W, Ersoz CJ. Tools for tageting improvements. In: The health care manager´s guide to continuous quality improvement.
Chicago: AHA, 1991. Cap. 11.
Anexo 9.1
Una vez descrita la intervención o intervenciones a implantar (capítulo 8), se debe plasmar de forma gráfica un método de seguimiento,
de forma que se pueda hacer control explícito de su implementación. La herramienta más común es un diagrama de Gantt. En su forma
más completa figuran las actividades previstas, el tiempo que precisarán para ser implementadas, la secuencia en la que deben ser
implementadas, y los responsables de llevarlas a cabo. Siguiendo el modelo de la figura 9.2 de este capítulo. Los pasos a seguir son los
siguientes:
1. Establecer un cronograma explícito para la implementación de las actividades contenidas en el diagrama de afinidades del
trabajo práctico anterior, plasmándolo en un diagrama de Gantt.
2. Utilizar el modelo propuesto en la figura 9.2 de este capítulo.
3. Procurar ser realista, de forma que se pueda tener una idea lo más aproximada posible del tiempo que llevará completar la
intervención diseñada.
4. Considerar la conveniencia de construir un diagrama de Gantt por cada línea estratégica o grupo de acciones del diagrama de
afinidades.
Una alternativa complementaria es utilizar un cartel narrativo del ciclo de mejora, preferentemente iniciado al principio del proyecto, e
insertar en él el diagrama de Gantt.
• 188 •
Capítulo 10
Cierre del ciclo de mejora: reevaluación,
análisis y presentación de resultados
comparativos de dos evaluaciones
2. Diseño de la reevaluación. Componentes y diferencias con el diseño de la primera
evaluación
3. Presentación y análisis de los datos: estimación del nivel de calidad y mejora conseguida
tras la intervención para mejorar.
4. ¿Hemos mejorado? Significación estadística de la diferencia entre las dos evaluaciones.
5. Representación gráfica de las diferencias en los niveles de calidad entre dos evaluaciones.
6. Análisis gráfico de la mejora y defectos por mejorar: diagrama de pareto antes-después.
7. ¿Qué hacemos a continuación? Cursos de acción tras la reevaluación
2 Identificación
Monitorización
Elaboración
medir calidad

Capítulo 10 10
Capítulo Evaluación del nivel de evaluación del nivel Capítulo 5

Capítulo 8 Diseño
de intervención



Contenido general
Una vez que se haya dado tiempo a la intervención para surtir efecto, es precisa una nueva
medición de la calidad para documentar la mejora. En este capítulo se detalla la metodología
necesaria para cumplir con este objetivo. Se parte del hecho de que en la reevaluación lo
que pretendemos no es solamente medir el nuevo nivel de calidad sino también comprobar
la hipótesis de mejora, para ello tenemos que asegurarnos de que los datos a obtener sean
comparables con la situación de partida, procurando que el diseño del estudio la reevaluación
no introduzca modificaciones que impidan la comparabilidad. También se necesitan aplicar las
pruebas estadísticas pertinentes y realizar una adecuado análisis gráfico de los datos.

1. Diseñar la recogida de datos utilizando un esquema similar al empleado en la primera eva-
luación o evaluación basal de la calidad (capítulo 5).
2. Realizar la recogida de los datos en relación al nivel de calidad en esta evaluación, de forma
similar a lo realizado con los datos de la primera evaluación. Calcular la mejora absoluta y
relativa de cada criterio o requisito de calidad.
3. Aplicar correctamente diversas pruebas de significación estadística para el contraste de la
hipótesis de mejora.
4. Interpretar los resultados de estas pruebas para responder a la pregunta ¿hemos mejorado?
5. Presentar gráficamente los resultados comparativos del nivel de calidad de las dos evaluacio-
nes con un gráfico estrella o radar.
6. Construir un gráfico de Pareto antes-después.
7. Interpretar los resultados del ciclo de mejora efectuado, utilizando un gráfico de Pareto antes-
después que indique la mejora conseguida y priorice las siguientes actividades a realizar.
Cierre del ciclo de mejora: reevaluación, Capítulo
análisis y presentación de resultados 10

comparativos de dos evaluaciones
“La vida sólo se comprende mirando hacia atrás pero se debe vivir hacia adelante”
Kierkegaard
En este capítulo se abordan

1. Contextualización el cuadro 10.1) y responden a la misma des-
los aspectos metodológicos
cripción que se describe en el capítulo 5, que relacionados con el diseño
Después de haber puesto en marcha las me- es conveniente revisar a este respecto. de la segunda evaluación
didas acordadas para mejorar el nivel de cali- Sin embargo, tras la experiencia de la pri- para la comparación con la
dad, llega el momento, tras un cierto tiempo, mera evaluación se plantean a veces algunas situación basal.
de comprobar si efectivamente hemos logrado dudas en relación al mantenimiento de exacta-
mejorar, y decidir en consecuencia qué debe- mente los mismos criterios, las peculiaridades
mos hacer a continuación en nuestro camino de las unidades de estudio que pueden condi-
de mejora continua. cionar el marco muestral para la segunda eva-
Documentar la mejora y decidir qué hacer luación, y la conveniencia de utilizar tamaños
a continuación entraña los siguientes pasos: de muestra diferentes. Vamos a revisar las cau-
(i) diseñar la (re)evaluación de forma que los sas más frecuentes por las que se pueden plan-
datos sean comparables con la primera eva- tear estas cuestiones y la forma más razonable
luación (basal); (ii) analizar los datos correc- de afrontarlas.
tamente para determinar cuál es el nivel de
calidad alcanzado y responder a la pregunta 2.1. Cambios en los criterios o indicadores de
¿hemos mejorado?; y (iii) analizar los datos la calidad en la segunda evaluación
para responder a la pregunta ¿qué hacemos
a continuación para seguir mejorando? A lo Para efectos de comparabilidad con la primera
largo de este proceso se han de ir tomando evaluación no es deseable en absoluto cambiar
decisiones metodológicas concretas que son
la base de este capítulo. En primer lugar se
contemplan las diferencias posibles y no de- Cuadro 10.1
seables en los diseños de la primera y segunda Componentes de una evaluación de la calidad
evaluación para asegurar la comparabilidad,
y a contiinuación se plantea cómo realizar el 1. Criterios para evaluar la calidad
análisis comparativo de los datos obtenidos 2. Dimensión estudiada
con los que obtuvimos en la evaluación basal. 3. Tipos de datos
4. Unidades de estudio
El diseño de la reevaluación
2. Diseño de la reevaluación. 5. Fuentes de datos
es conveniente que sea
6. Identificación y muestreo de la unidades de estudio
Componentes y diferencias con el diseño l Marco muestral en general idéntico al de
de la primera evaluación l Número de casos la primera evaluación Sin
l Métodos de muestreo embargo la experiencia
El diseño metodológico de la evaluación para 7. Tipo de evaluación de la primera evaluación
documentar la mejora conseguida no tiene l Según relación temporal puede habernos sugerido
por qué tener ninguna diferencia con el que l Según quién tomó la iniciativa introducir cambios que
utilizamos para la primera evaluación. Sus l Según quién obtiene los datos hay que considerar con
componentes son idénticos (se reproducen en precaución.
• 193 •
Para que se puedan la definición de criterios a evaluar. Cuando se el proceso de atención (como por ejemplo el
comparar, los criterios han plantea esta duda se debe casi siempre a defec- diagnostico), o muy extenso (por ejemplo su-
de ser definidos y medidos tos en el diseño de los criterios evaluados en la pongamos que las exploraciones electrocar-
de forma semejante en primera evaluación. Frecuentemente, estos de- diográficas en los pacientes hipertensos son
las dos evaluaciones. Los fectos se deben a una falta de concreción que establecidas cada tres años como criterio de
cambios de definición los hace difíciles de valorar; por ejemplo si un buen seguimiento), pueden surgir dudas sobre
los convierte en nuevos
criterio incluye varios subapartados, tras eva- cómo definir los casos y/o el marco muestral
criterios para los que
se realiza una primera
luarlo puede evidenciarse que deberían haber en la reevaluación, dada la dificultad de que
evaluación. sido considerados aisladamente, o incluso que se puedan reunir un número suficiente de ca-
algunos ítems faltan o sobran. Son ejemplos sos para reevaluar los criterios con periodos de
frecuentes los criterios sobre anamnesis de an- tiempo y/o marcos muestrales como los defi-
tecedentes personales, exploración física bási- nidos en la primera evaluación. ¿Qué es lo más
ca, etc., que suelen incluir en realidad varios conveniente entonces para la re-evaluación?,
subcriterios y podemos decidir, después de ¿una muestra de todos los casos?, ¿Sólo los
haberlos medido, que no es muy informativo casos nuevos que se hayan producido tras la
medirlos conjuntamente como un solo criterio. primera evaluación?
Otras veces lo que ocurre es que nos damos
cuenta que hemos incluido criterios irrelevan- Criterios con periodo de tempo único en el
tes o que se cumplen siempre, mientras otros proceso por evaluar. ¿Todos los casos o sólo casos
más importantes y/o problemáticos no han nuevos?
sido medidos; estamos tentados entonces de
incluir nuevos criterios para la segunda eva- Tomemos por ejemplo el criterio sobre diag-
luación, e incluso eliminar aquellos que se nos nóstico de la hipertensión. Está claro que si
Aunque pueden aceptarse
diferencias en el marco han revelado como irrelevantes. definimos la unidad de estudio como las 2
muestral (universo para El problema común a todos estos cambios, semanas a 3 meses en las que se deben hacer
la extracción de casos), que puede estar muy justificado hacer, es el de las mediciones para clasificar al paciente como
no debe cambiarse la la comparabilidad entre las dos evaluaciones: hipertenso (en ese “segmento” irrepetible del
definición de la unidad de cualquier nuevo criterio o nueva forma de en- proceso evaluamos si se procedió correctamen-
estudio entre la primera y la tender (o describir) un criterio lo convierte de te o no), debe mantenerse la misma definición
segunda evaluación. hecho en una primera evaluación y la compa- para la reevaluación, de forma que sólo debe-
ración con la anterior evaluación no es posible ríamos considerar en ella los casos nuevos diag-
ni deseable. La comparación se debe efectuar nosticados desde que pusimos en marcha la in-
siempre entre criterios que hayan sido descri- tervención para mejorar; sin embargo, el marco
tos, entendidos y medidos de forma semejante temporal para la muestra de casos sería muy
en las dos evaluaciones. diferente, si hemos utilizado como universo
para la primera evaluación todos los hiperten-
2.2. Diferencias en la definición de las sos diagnosticados hasta el momento de la eva-
unidades de estudio y en el marco muestral luación; esta diferencia en el marco muestral
es aceptable aunque hubiese sido quizá mejor
Al igual que para los criterios, no es deseable elegir como marco muestral para la primera
para la reevaluación cambio alguno en la defi- evaluación los diagnosticados en un cierto pe-
nición de las unidades de estudio ni, en menor riodo de tiempo semejante al que dejaríamos
grado y con excepciones, en las características pasar entre intervención y reevaluación. ¿Qué
Si hemos utilizado criterios del marco muestral. ocurriría si decidimos mantener el mismo mar-
de comparabilidad Sin embargo, la primera vez que se eva- co muestral, y realizar de nuevo una muestra
problemática lúa la calidad de la atención a un determinado extraída de todo el universo de hipertensos?
(cumplimientos en periodos problema de salud son frecuentes los marcos Mantener el mismo marco muestral (todos los
de tiempo únicos o muy muestrales definidos en términos de todos los hipertensos diagnosticados hasta el momento
largos) junto a otros más
casos existentes en el centro y, si se evalúan cri- de la 2ª evaluación) es, efectivamente, una op-
sencillos, siempre queda
terios a los que corresponde como unidad de ción posible, pero en este caso el efecto de la
la opción de realizar su
reevaluación por separado. estudio un periodo de tiempo único en todo intervención puede quedar diluido, aparte de
• 194 •
Cierre del ciclo de mejora: reevaluación, análisis y presentación de resultados comparativos de dos evaluaciones
que tendríamos que decidir qué hacer con los (un acercamiento del tipo “todos los casos”
diagnosticados incorrectamente antes de la pri- existentes, al igual que en la primera evalua-
mera evaluación: excluirlos de la segunda eva- ción que acabamos de comentar) o evaluar
luación o iniciar de nuevo el proceso diagnosti- sólo los casos que no la cumplían y que han
co con ellos e incluirlos en el marco muestral de visitado el centro desde que decidimos inter-
la segunda evaluación si han visitado el centro venir, más los que no se habían incluido en la
entre las dos evaluaciones; en esta segunda op- primera evaluación por no llevar suficiente
ción, estamos asimismo cambiando el criterio tiempo diagnosticados (menos de tres años)
en cuanto al periodo de tiempo contemplado y ya lo llevan al reevaluar. En este caso, debe
en la primera evaluación porque consideramos primar en la decisión el mantenimiento de la
la “segunda oportunidad” no contemplada en misma definición de unidad de estudio y re-
la primera evaluación. Obviamente, con estos visar los últimos tres años de todos los que
cambios estamos introduciendo “ruido” en la llevan al menos este tiempo diagnosticados
comparación. En el primer caso (si considera- en ambas evaluaciones, porque actuar correc-
mos de nuevo todos los hipertensos en vez de tamente (cumplir el criterio) implica valorar
solo los nuevos diagnósticos) conducente a di- continuamente si se tiene o no se tiene hecho el
luir el posible efecto de la intervención; y en el ECG en los últimos tres años. Tanto la unidad
segundo (considerando también como nuevos de estudio como el marco muestral pueden y
diagnósticos el “re-diagnóstico” de los previa- deben ser, en este caso, iguales en las dos eva-
mente mal diagnosticados) aumentándolo, a luaciones. Pueden incluirse por tanto aquellos
costa de redefinir el criterio hasta el punto que casos excluidos en la primera evaluación por-
se podría considerar no comparable con el de que no cumplían aún con el periodo de tiempo
la primera evaluación. Por todo ello, hay que necesario para ser evaluados.
considerar muy cuidadosamente cualquier Finalmente, en el caso de que hayamos
cambio en la definición de la unidad de estudio evaluado criterios de fácil comparabilidad en
y marco muestral de la segunda evaluación, rela segunda evaluación junto a otros potencial-
flexionando sobre los posibles sesgos que estos mente problemáticos por sus peculiares uni-
cambios puedan introducir en la comparabili- dades de tiempo (únicas o muy largas) a que
dad e interpretación de los datos. se refieren, no es mala solución evaluarlos por
A efectos comparativos es siempre más separado y tras un tiempo diferente tras la in-
importante mantener la definición de la unidad de tervención; es decir, esperar seis meses o hasta
estudio, que la definición del marco muestral o un año para algunos de ellos, mientras que se
universo para la extracción de los casos a eva- evaluarán antes aquellos en los que el efecto de
luar, teniendo a veces que esperar más tiempo la intervención pueda verse a más corto plazo.
para reunir casos suficientes para evaluar. Si in- Cuando los criterios se refieren a periodos
troducimos cambios en los criterios o periodos de tiempo en el proceso de atención que no son
de tiempo en el que el criterio debe cumplirse, únicos o muy largos, no suelen plantearse este
se trata de estudios complementarios, probable- tipo de dudas y problemas potenciales para la
mente necesarios y justificados, pero no directa- comparabilidad de las dos evaluaciones. Es el
mente comparables con la primera evaluación. caso por ejemplo de todos los criterios que se re-
fieren a problemas agudos o, en caso de pacien-
Criterios con periodo de tiempo largo. ¿Sólo tes crónicos, a cada visita, o en la última visita.
nuevos casos o incluimos los que no cumplan el
criterio en la primera evaluación? 2.3. Diferencias en el tamaño de la muestra.
En el caso de criterios con periodo de tiempo A diferencia de la definición de criterio y su co-

muy largo a la hora de definir la unidad de es- rrespondiente unidad de estudio, el tamaño de
tudio (como por ejemplo un ECG cada 3 años la muestra para la segunda evaluación no tiene
en el control del hipertenso), podríamos dudar que ser necesariamente igual que el de la primera.
en la reevaluación si incluir aquellos que ya Es conveniente que sea manejable, se obtenga
cumplían el criterio en la primera evaluación de forma aleatoria, si el universo es suficien-
• 195 •
El tamaño de la muestra te grande como para aconsejar una muestra, y luaciones que sería necesario para que fuesen
puede ser diferente en que tenga, como para la primera evaluación, significativos diversos niveles de diferencia en-
la segunda evaluación, un tamaño que permita estimar el nivel de ca- tre las dos evaluaciones, en función del valor
siempre que se respete lidad con una cierta precisión. Nada más. encontrado en la primera evaluación. Tanto el
la aleatoriedad de su En el capítulo 5 propusimos la cifra de concepto de significación estadística, como el
extracción. Para detectar
50-60 casos como un tamaño razonablemente fundamento del cuadro 10.2 serán explicados
como significativas
mejoras pequeñas
pequeño que permitía inferencias de una pre- en otros apartados de este capítulo. Baste, por
(inferiores a 0,15 ó 0,1) cisión normalmente suficiente. Sin embargo al ahora resumir que una muestra de 60 casos va
necesitamos muestras reevaluar no estamos interesados solamente a ser suficiente para detectar de forma signifi-
más grandes, sobre todo en estimar el nivel de calidad: también quere- cativa diferencias que van desde un mínimo de
si el cumplimiento en la mos saber con una cierta seguridad si hemos 0.15, cuando la proporción de cumplimiento
1ª evaluación fue en torno mejorado o no. Esta seguridad nos la da, como en la primera evaluación fue de en torno a 0.5
a 50%. veremos más adelante, el cálculo del nivel de (50%), hasta un mínimo de 0.05 o 0.1 cuando las
significación de la diferencia encontrada entre proporciones de cumplimiento en la primera
las dos evaluaciones; nivel de significación en evaluación son más extremas (0.05, 0.1 o 0.95).
el que influye el tamaño de la muestra en am- En general, diferencias entre estimaciones de
bas evaluaciones. Como norma general, mues- las dos evaluaciones iguales o superiores a
tras pequeñas van a dar como significativas 0.15 van a ser evidenciadas como significativas
diferencias grandes, mientras que hacen falta con muestras de 60 casos, sea cual sea la pro-
muestras más grandes para que diferencias porción de cumplimiento en la 1ª evaluación,
(en nuestro caso mejoras) modestas aparezcan siendo posible detectar diferencias tanto más
como significativas. Quiere esto decir que si pequeñas cuando más alejado está del 50% el
queremos aumentar las posibilidades de de- cumplimiento en la primera evaluación.
tectar como significativas diferencias no muy
grandes entre las dos evaluaciones, nos con- 3. Presentación y análisis de los datos:
viene aumentar el tamaño de la muestra en estimación del nivel de calidad y mejora
ambas o al menos en la segunda evaluación. conseguida tras la intervención para
Para tener una idea de en qué medida ne- mejorar
cesitamos o no muestras más grandes para de-
tectar según qué diferencias, en el cuadro 10.2 Una vez efectuada la nueva recogida de datos,
figura el tamaño de la muestra en ambas eva- nos encontramos ante una situación semejante
Cuadro 10.2
Tamaño de muestra (n) necesario en cada evaluación para detectar como significativas (p≤0.05, una cola) diversos niveles de diferencias
entre dos evaluaciones (d), según la proporción de cumplimiento de la primera evaluación (p1)
Proporción de cumplimiento en la primera evaluación (p1)
d 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95
0.05 150 237 313 377 432 475 507 529 540 540 529 507 475 432 377 313 237 150 53
0.08 69 102 130 154 174 190 201 208 211 210 205 195 181 163 140 114 83 48 32
0.10 49 69 87 101 114 123 130 134 135 134 130 123 114 101 87 69 49 * *
0.13 33 44 54 62 69 74 78 80 80 79 76 71 65 58 48 37 * * *
0.15 * 35 42 48 53 56 59 60 60 59 56 53 48 42 35 * * * *
0.18 * * 30 34 37 40 41 42 41 40 38 36 32 * * * * * *
0.20 * * * * 31 32 33 34 33 32 31 * * * * * * * *
0.23 * * * * * * * * * * * * * * * * * * *
0.25 * * * * * * * * * * * * * * * * * * *
(*): n< 30
d: diferencia entre las dos evaluaciones: p2-p1
• 196 •
a la de la primera evaluación en cuanto a las evaluaciones. En consecuencia vamos a reali- En la reevaluación estamos
estimaciones o inferencias que podemos hacer. zar una estimación puntual de la diferencia y interesados en saber el
Los métodos estadísticos en este sentido van además comprobar si esta diferencia puede ser nivel de calidad alcanzado
a ser idénticos a los de la primera evaluación, atribuible o no a los errores esperables por ha- pero también, y sobre todo,
tanto para realizar la estimación puntual como ber medido con muestras; esta comprobación documentar la mejora
conseguida; es decir:
para el intervalo de confianza de los niveles de se hace en base a un cálculo de probabilidades
comparar adecuadamente
calidad alcanzados. Sin embargo, tendremos y se expresa, en la jerga estadística, como signi- los resultados de las dos
ahora el interés adicional de comparar ambas ficación estadística de la diferencia entre las dos evaluaciones.
evaluaciones y ver si hemos logrado mejorar. evaluaciones. Vamos a revisar lo que entraña
Para ello, si hemos evaluado con muestras, conceptual y operativamente cada uno de esos
tendremos que tener en cuenta, también para pasos, siguiendo el resumen que figura en el
la comparación, los posibles errores en las es- cuadro 10.3 y ejemplificando los cálculos con
timaciones (puntual e intervalo), en ambas los datos del cuadro 10.4.
Cuadro 10.3
Análisis de los datos de una reevaluación. Resuñmen de componentes y métodos
Tipo de muestreo Estimación puntual
1. Estimación del nivel de calidad
n° de cumplimientos
- Estimación puntual: P2= –––––––––––––––––––––
tamaño de la muestra
p2(1-p2)
- Intervalo de confianza (95%): P2 ± 1.96 –––––––––
n
2. Estimación de la mejora conseguida
- Mejora absoluta: P2 - P1=
P2 - P1
- Mejora relativa: ––––––––
1 - P1
3. Significación estadística de la mejora

- Calcular valor de z para la diferencia entre las dos evaluaciones (**):
P2 - P1
z= –––––––––––––––––
- Diferencia entre proporciones: 1 1
p(1-p) ––– + –––
n1 n2
–x - –x
2 1
- Diferencia entre medidas: z= ––––––––––––
S21 S22
––– + –––
n1 n2
- Ver significación en tablas de la distribución normal (una cola):
n° cumplimientos en la 1a + n° cumplimientos en la 2a
p: proporción de cumplimiento conjunta (primera y segunda evaluación juntas= ––––––––––––––––––––––––––––––––––––––––––––––––––
n1 + n2.
–x –x
2: media en la reevaluación; 1: media en la primera evaluación.

s2: desviación estándar de los datos de la muestra en la reevaluación; s1: desviación estándar de los datos de la muestra en la priimera evaluación.

• 197 •
Cuadro 10.4
Evaluacion de la calidad del diagnóstico, anamnesis y exploración fìsica inicial
del paciente hipertenso antes y después de la intervención para mejorar.
Niveles de cumplimiento de los criterios en una muestra aleatoria de 60 casos
1ª Evaluación 2ª Evaluación
Criterio*
%Cumplimiento (ic 95%) %Cumplimiento (ic 95%)
1. Diagnóstico correcto 75.0 (±11.0) 95.0 (±5.5)
2. Antecedentes familiares 80.0 (±10.1) 86.0 (±8.8)
3. Antecedentes personales 90.0 (±7.6) 98.0 (±3.5)
4. Consumo de tabaco 30.0 (±11.6) 70.0 (±11.6)
5. Consumo de alcohol 10.0 (±7.6) 50.0 (±12.7)
6. Peso y talla y/o IMC 85.0 (±9.0) 84.0 (±9.3)
7. Auscultación cardiaca 75.0 (±11.0) 80.0 (±10.1)
8. Exploración abdominal 40.0 (±12.4) 57.0 (±12.5)
9. Pulsos periféricos 50.0 (±12.7) 60.0 (±12.4)
10. Soplos carotideos 55.0 (±12.6) 75.0 (±11.0)
11. Edemas 25.0 (±11.0) 50.0 (±12.7)
12. Fondo de ojo 15.0 (±9.0) 25.0 (±11.0)
Las estimaciones puntual 3.1. Estimación del nivel de calidad 10.4 la mejora absoluta para los criterios 1, 3, 5
y de intervalo del nivel de y 10 es de 20, 8, 40 y 20 puntos respectivamente
calidad se realizan de forma El objetivo y los procedimientos son idénticos (95-75, 98-90, 50-10 y 75-55). De igual manera
idéntica a las de la primera a los que vimos en el capítulo 7. Los datos de podemos calcular la mejora absoluta para cada
evaluación. nuestra segunda evaluación nos sirven de base uno de los criterios del cuadro 10.4 y veremos
para una estimación puntual del nivel de cum- que en todos ellos es positiva, excepto para el
plimiento de los criterios, y la estimación de un criterio 6. Sin hacer ningún otro tipo de consi-
intervalo de valores (intervalo de confianza) deraciones, parece que se ha logrado mejorar
entre los cuales tenemos un nivel considerable de forma consistente en prácticamente todos
de certeza (confianza, normalmente estableci- los criterios.
da en 95%) de que se encuentra el valor real. Pero volvamos al ejemplo de los cuatro cri-
Las fórmulas más usuales son las que figu- terios (1, 3, 5 y 10) que hemos seleccionado para
ran en el cuadro 10.3, pero existe una explica- ejemplificar el cálculo de la mejora absoluta;
ción más extensa en el capítulo 7, al cual debe- podemos observar que, sólo con las cifras de
mos remitirnos en caso de duda en este punto. mejora absoluta, parece que los criterios 1 y 10
El cuadro 10.4 contiene ambas estimaciones, han mejorado en igual medida (20 puntos cada
puntual y de intervalo, para los criterios consi- uno), el criterio 5 ha mejorado el doble que es-
derados en dos evaluaciones. tos dos, y el criterio 3 ha mejorado compara-
tivamente bastante menos que los anteriores.
3.2.Estimación de la mejora conseguida Sin embargo, estas apreciaciones no tienen en
cuenta que el punto de partida, y por tanto las
La forma más directa e intuitiva de saber si he- posibilidades o espacio para mejorar, son muy
mos mejorado es simplemente ver la diferencia diferentes para cada uno de estos criterios. No
entre los niveles de cumplimiento de la segun- es lo mismo normalmente subir de 75% a 95%,
da y la primera evaluación. Esta diferencia es como ocurre con el criterio 1, que de 55% a 75%
lo que podemos denominar estimación de la como ocurre con el criterio 10, aunque en am-
mejora absoluta para cada criterio considera- bos casos la mejora absoluta sea de 20 puntos;
do. Por ejemplo, según los datos del cuadro de igual manera, los 40 puntos de mejora del
• 198 •
criterio 5 son posibles porque se parte de unos del criterio 10 sólo suponen el 44% de la mejora Para estimar la mejora
niveles de cumplimiento muy bajos, que no se posible. Es evidente que esta es una valoración conseguida es conveniente
dan en el criterio 3, con unos niveles de 90% más ajustada del esfuerzo realizado cuando calcular no solo la diferencia
de cumplimiento en la primera evaluación queramos hacer comparaciones. absoluta entre las dos
que sólo permiten mejorar como máximo 10 En general, es conveniente calcular tan- evaluaciones (mejora
absoluta) sino también
puntos (de 90 a 100%). Con el objeto de con- to la mejora absoluta como la mejora relativa.
relativizarla al espacio
siderar explícitamente esos matices y poder No obstante, tanto la mejora absoluta como la de mejora posible que
comparar mejor el esfuerzo de mejora entre relativa las hemos calculado en base a las esti- teníamos en la primera
criterios y/o entre centros para los mismos cri- maciones puntuales de los niveles de cumpli- evaluación (mejora
terios, es conveniente calcular lo que podemos miento que sabemos están sujetos a los errores relativa).
llamar mejora relativa, que consiste en relativi- propios de haber utilizado una muestra. Ello
zar la mejora absoluta en relación al espacio de quiere decir que, sin hacer algunos cálculos
mejora posible total que existía en la primera adicionales, no sabremos hasta qué punto es-
evaluación; este espacio de mejora posible es 1 (o tamos seguros que la mejora es real, o si puede
100%, máximo cumplimiento posible) menos responder a los posibles valores que podemos
el nivel de cumplimiento en la primera eva- encontrar por la variabilidad esperable al utili-
luación (en proporción o porcentaje, según sea zar muestras, aunque no exista diferencia en la
1 o 100 como hayamos caracterizado el nivel realidad entre las dos evaluaciones. Es necesa-
máximo de cumplimiento). La fórmula sería rio, pues, ser capaces de afirmar hasta qué pun-
pues: to la diferencia encontrada es compatible o no
con la inexistencia de mejora en la realidad: hay
Mejora absoluta p2 - p1 que calcular la significación estadística de la dife-
=
espacio posible de mejora 1 -p1 rencia encontrada entre las dos evaluaciones.
Hay que realizar algunos
cálculos estadísticos
siendo p2 el cumplimiento en la segunda eva- 4. ¿Hemos mejorado? Significación para poder concluir si la
luación y p1 el cumplimiento que encontramos estadística de la diferencia entre las dos diferencia encontrada es
en la primera evaluación. Para los cuatro crite- evaluaciones real o puede ser explicada
rios que hemos elegido como ejemplo, la mejo- por los errores del
ra relativa sería la siguiente: Con la estimación puntual de la diferencia en- muestreo.
tre las dos evaluaciones ocurre lo mismo que
- Criterio 1 (Diagnostico): veíamos al dar la estimación puntual del nivel
0.95 - 0.75 0.2 de calidad: no sabemos con sólo dar el valor
= = 0.8 o 80% de la estimación hasta qué punto puede res-
1 - 0.75 0.25
ponder o no al valor real; la cuestión de base
- Criterio 3 (Antecedentes personales): es si las dos estimaciones puntuales, es decir
0.98 - 0.90 0.08 los dos niveles de cumplimiento de la primera
= = 0.8 o 80% y la segunda evaluación, pueden responder a
1 - 0.90 0.1 valores probables en una muestra de un mis-
- Criterio 5 (Consumo alcohol): mo valor real, o, lo que es lo mismo, si la dife-
0.50 - 0.10 0.4 rencia observada con las dos muestras puede
= = 0.44 o 44% ser explicada por los errores esperables por el
1 - 0.10 0.9 muestreo. Esta incógnita puede ser, desde lue-
- Criterio 10 (Soplos carotídeos): go, despejada con la ayuda de los cálculos es- Una forma de ver si la
diferencia es real es
0.75 - 0.55 0.20 tadísticos oportunos.
calculando el intervalo de
= = 0.44 o 44% Hay dos maneras de aclararlo: (i) estiman-
1 - 0.55 0.45 confianza de la diferencia.
do un intervalo de valores de la diferencia; o Si este intervalo no contiene
Con este nuevo cálculo vemos que en términos (ii) con un test estadístico para comprobar la el valor cero, podemos
relativos los criterios que más han mejorado probabilidad de que la diferencia real entre las concluir, con la confianza
con el 1 y el 3, en los que se ha logrado apro- dos evaluaciones sea cero. fijada, que la diferencia
vechar el 80% de la mejora posible, mientras La primera opción ya nos es familiar: esti- es real y no debida a los
que los mismos 20 puntos de mejora absoluta mamos el intervalo de confianza de la diferencia, errores de muestreo.
• 199 •
y si éste contiene el valor cero, no podremos diferencia es a mejor, que es exactamente lo que
afirmar que la diferencia es real. Recuérdese nos interesa, mientras que el intervalo de con-
que el intervalo de confianza es un rango de fianza incluye las posibles diferencias en los
valores entre los cuales sabemos con una cierta dos sentidos (a mejor y a peor), lo cual conlleva
confianza (probabilidad de que sea cierto) que unas exigencias mayores en cuanto a detectar
está el valor real del parámetro estimado. En diferencias significativas. Para entender toda
este caso, el parámetro estimado con las mues- esta argumentación a favor de la utilización de
tras de las dos evaluaciones vamos a considerar un test estadístico, hay que introducir y aclarar
que es la diferencia entre ellas, en vez del nivel dos nuevos conceptos como son la significación
de cumplimiento que es para lo que hemos uti- estadística y la formulación de las llamadas hi-
lizado la estimación de un intervalo de valores pótesis nula y alternativa que son las que vamos
hasta ahora. La fórmula y razonamiento para a poner a prueba con el test estadístico.
el intervalo de confianza de la diferencia es en
todo semejante a la que vimos en el capítulo 4.1. ¿Qué es la significación estadística?
7, para el intervalo de confianza del nivel de
cumplimiento. Responde a la fórmula general: La significación estadística es un concepto que se
utiliza normalmente en la comprobación de hi-
Parámetro estimado ± z • Desviación estándar pótesis y responde a la probabilidad de que esa
del parámetro estimado hipótesis que se comprueba sea cierta, de ma-
nera que si esa probabilidad es muy baja, nos
El parámetro estimado es ahora la diferencia arriesgamos a rechazar que sea cierta y acep-
entre las dos evaluaciones (p2-p1); z es 1.96, tamos que existe una situación diferente. En la
para una confianza de 95%; y el error estándar jerga estadística a la hipótesis de partida que se
Para concluir si hemos
(o desviación estándar del parámetro estima- acepta o rechaza con el test se le llama hipótesis
mejorado más que calcular
do) es la suma del error estándar de las dos nula, y lo que aceptamos cuando ésta se recha-
el intervalo de confianza
de la diferencia, conviene evaluaciones, de modo que el intervalo va a za debido a que la probabilidad de que sea cier-
utilizar un test estadístico ser: ta es muy baja, se conoce como hipótesis alterna-
apropiado. tiva. En nuestro caso la hipótesis nula seria que
p1 (1 - p1) p2 (1 - p2) la diferencia entre las dos evaluaciones es en
(p2 - p1) ± 1.96 +
n1 n2 realidad cero, es decir, que no ha habido mejora
y la diferencia estimada es explicable por los
Si lo aplicamos por ejemplo a la diferencia que errores del muestreo; mientras que la hipótesis
hemos encontrado para el criterio 1, en donde alternativa es que sí ha habido mejora y la dife-
p2=0.95 y p1=0.75, con muestras de 60 casos en rencia encontrada responde a la existencia real
las dos evaluaciones, el intervalo de confianza de diferencia entre las dos evaluaciones y no al
de 95% para la diferencia sería: azar de los errores del muestreo. En resumen,
lo que hacemos para aplicar un test estadístico
(0.75)(0.25) (0.95)(0.05) para aceptar o rechazar una determinada hipó-
(0.95-0.75) ± 1.96 + = 0.20 ±0.12
60 60 tesis (o suposición de que algo es de una deter-
minada manera) es lo siguiente:
es decir, de 0.08 a 0.32; todos ellos valores por 1. Formulamos la hipótesis nula, o hipótesis
encima de cero con lo que podemos concluir, de partida que normalmente ha de impli-
con una confianza de 95%, que la diferencia es car la igualdad o inexistencia de cambios
real y además que es como mínimo de 8 puntos. o diferencias. En nuestro caso, la hipótesis
nula va a ser que no ha habido diferencia
El segundo proceder, la utilización de un test entre las dos evaluaciones.
estadístico para aceptar o rechazar la hipótesis 2. Formulamos la hipótesis alternativa, que
de que no hay diferencia, nos puede resultar en será la que vamos a aceptar si rechaza-
general más conveniente por ser más adapta- mos la hipótesis nula. Nuestra hipótesis
ble a nuestra situación, en el sentido de que va alternativa va a ser que sí que hay dife-
a ser posible comprobar de forma aislada si la rencia a mejor entre las dos evaluaciones
• 200 •
(vamos a ver enseguida por qué subraya- se diferencian entre sí básicamente por la dis-
mos a mejor). tribución de probabilidades que utilizan para
3. Aplicamos un test estadístico apropiado ver la significación (el valor de p), lo que con-
que nos va a decir la probabilidad de que lleva unas determinadas condiciones de uso,
la hipótesis nula sea cierta. Esa probabili- y fórmula de cálculo. Por ejemplo, para com-
dad es lo que vamos a llamar significación parar dos proporciones como es el caso de los
estadística de nuestra decisión. niveles de cumplimiento de un criterio en las La significación estadística
4. En función de esa probabilidad vamos a dos evaluaciones, podríamos utilizar una χ2, el para la decisión que se
aceptar o rechazar la hipótesis nula (y con- test exacto de Fisher o el valor de z que corres- toma con la aplicación
siguientemente rechazar o aceptar la hipó- ponde a la diferencia y errores estándar de las de un test estadístico es
tesis alternativa). dos muestras. De todos ellos, seleccionamos el la probabilidad de que la
test del valor de z por la facilidad de cálculo, hipótesis nula sea cierta.
Pero ¡ojo!: lo que puede resultar confuso es que junto a la posibilidad de ver la significación de Se conoce también como
decimos que el test estadístico es muy significa- una cola, algo cuya importancia veremos en- errorα, error tipo I y valor p.
tivo cuando la probabilidad de que la hipótesis seguida. La aplicación de este test se basa en
nula sea cierta es muy pequeña; es decir, más el hecho de que los diversos valores posibles
significación estadística cuanto menor es la de la diferencia entre las dos evaluaciones que
probabilidad de que la hipótesis nula sea cierta. podemos encontrar por muestreo siguen en
En realidad, esta probabilidad es esencial- cuanto a su probabilidad de aparición una dis-
mente el riesgo de equivocarnos que corremos al tribución normal; para ver la probabilidad de
rechazar la hipótesis nula, puesto que hemos cada uno de los valores si la diferencia real es
dicho que es la probabilidad de que sea cierta: cero, se calcula el valor de z (valor estadístico
es un riesgo que se conoce también como error estándar de la distribución normal), que co-
a o Tipo I de la decisión tomada, y se anota ha- rresponde a la diferencia encontrada.
bitualmente como el valor p (de probabilidad)
del test estadístico. Como probabilidad de error La fórmula de cálculo es (tal como figura en el
que es, nos interesa adoptar una determinada cuadro 10.3):
como límite de decisión que no sea muy alta p2 - p1
pero que nos dé una cierta seguridad en la deci- z=
sión (recuérdese que p alta quiere decir signifi- 1 1
p(1 - p) +
cación baja); lo habitual es aceptar que sea como n1 n2
máximo de un 5%, de forma que si el valor de p
que encontramos en el test es £5% (en forma de donde p2 es la proporción de cumplimiento
proporción sería £ 0.05) vamos a rechazar la hi- en la segunda evaluación, p1 es la proporción
pótesis nula, aceptaremos la hipótesis alterna- de cumplimiento en la primera evaluación, n1
tiva, y vamos a decir que el test es significativo, y n2 el tamaño de la muestra en la primera y
con un nivel de significación igual a p. segunda evaluación, y p la proporción de cum- De entre los tests
Una vez entendido el concepto de signi- plimiento conjunta de las dos evaluaciones estadísticos que se pueden
ficación estadística y su aplicación a la acep- (suma de cumplimientos de ambas evaluacio- utilizar, seleccionamos
tación o rechazo de las hipótesis nula (no di- nes dividida por la suma de ambas muestras). el cálculo del valor z
ferencia) y alternativa (mejora significativa), Una vez realizado el cálculo, miramos en las (valor estadístico en la
podemos aplicarlo a nuestro caso. Sólo nos tablas de la distribución normal cuál es la pro- distribución normal) para la
falta seleccionar el test estadístico apropiado y babilidad (significación) que corresponde al diferencia encontrada.
entender qué quiere decir y cómo se aplica el valor de z encontrado.
que la significación estadística sea de una cola. Como es evidente al estar p2-p1 en el nu-
merador, si no hay diferencia entre las dos eva-
4.2. Selección del test estadístico apropiado luaciones el valor de z es cero, y obtendremos
valores de z tanto mayores cuanto mayor sea
Existen varios test estadísticos que podrían la diferencia encontrada. La cuestión es ¿cuán-
aplicarse para comprobar si hay o no diferen- to puede llegar a ser de grande el valor de z
cia real entre las dos evaluaciones. Estos tests y seguir siendo compatible con una situación
• 201 •
real de no diferencia, es decir con un valor real do razonamiento bidireccional está en la base
de diferencia igual a cero?, dicho de otra for- de la estimación del intervalo de confianza de
ma, si para rechazar que la hipótesis nula (no la diferencia, que veíamos más arriba. Sin em-
diferencia entre las evaluaciones) es cierta, la bargo, el que nuestra hipótesis sea claramente
probabilidad del valor encontrado ha de ser unidireccional (en el sentido de la mejora) y ser
≤5%, ¿cuál es el valor límite que puede llegar el test de una cola menos restrictivo, es lo que
a tener z, a partir del cual vamos a rechazar nos hace sugerir como método más convenien-
que la diferencia entre las dos evaluaciones es te para ver si la diferencia entre las dos evalua-
cero?; por otra parte, ¿cómo sabemos el nivel ciones es significativa el test del valor de z de
de significación que corresponde al valor de z una cola (en el sentido de la mejora).
que hayamos podido encontrar? Para respon- Vamos a ilustrar todos estos razonamien-
der a estas preguntas hay que recurrir a la tabla tos y procedimientos aplicándolo a los criterios
de probabilidades de la distribución normal, 1 y 3 del cuadro 10.4.
pero antes hemos de decidir si utilizamos las Para el criterio 1, ya vimos que el intervalo
probabilidades de una cola o de dos colas. de confianza de la diferencia no contenía el va-
lor cero, y que por tanto podíamos concluir que
4.3. Buscar significación estadística de una cola la diferencia no era debida al azar o los errores
del muestreo; aplicando el test estadístico va-
La distribución normal es, como es sabido, mos a ver cuál es el nivel de significación de la
perfectamente simétrica en torno al valor cen- diferencia encontrada. Para aplicar la fórmula
tral que es cero y tiene dos extremos o colas, de del valor de z, sólo nos falta calcular la propor-
La significación del valor de forma que cuando se buscan niveles de signifi- ción conjunta que sería, puesto que las mues-
z la buscamos en una cola cación (probabilidades de que el valor real sea tras en las dos evaluaciones son iguales,
de la distribución normal, cero) para los correspondientes valores de z p2 + p1 0.95 + 0.75
= = 0.85
tal como corresponde pueden considerarse una de las dos colas o las 2 2
a nuestra hipótesis dos simultáneamente; de hecho hay tablas que (si las dos muestras no hubiesen sido de igual
alternativa (¿hemos dan los niveles de significación de una u otra tamaño, calculamos la proporción conjunta de
mejorado?) que supone y forma; el mirar sólo una cola o las dos simultá- la siguiente manera: n2• p2 + n1• p1 ).
espera diferencias sólo en neamente tiene relación con la formulación de n1 + n2
sentido positivo. la hipótesis alternativa,(tal como se representa El valor de z sería:
en la figura 10.1), y repercute en los niveles de
significación en el sentido de que mirando la p 2 − p1 0.95 − 0.75
z= = = 3.07
significación en sólo una cola va a ser mayor 1 1 1 1
p (1 − p ) + (0.85)(0. 15) +
para un mismo valor de z, de forma que hay n1 n2 60 60
incluso algunos valores de z que son significa-
tivos si los vemos en una cola, pero no lo son si Para ver el nivel de significación buscamos en
se miran en las dos simultáneamente. El test de la tabla de la distribución normal (una cola),
dos colas es más restrictivo. que reproducimos como cuadro 10.5, la proba-
¿Por qué podemos mirar la significación bilidad que corresponde a ese valor de z. Para
sólo en un lado o cola? Ya hemos menciona- ello buscamos en la primera columna el valor
do que ello está en relación con la formulación de las unidades y primer decimal (3.0) y en la
de la hipótesis alternativa. Nuestra hipótesis fila del encabezamiento el segundo decimal
alternativa es que hemos mejorado (diferen- (0.07), el lugar donde se cruzan nos da la pro-
cia positiva); esta hipótesis es unidireccional babilidad de encontrar por muestreo ese valor
y sólo nos interesa la significación de valores de z si la diferencia real entre las dos evaluacio-
de z positivos. Si nuestra pregunta no fuese nes fuese cero; este es el nivel de significación
¿hemos mejorado? sino, ¿hay diferencia entre del test. El valor que encontramos en la tabla
las dos evaluaciones? estaríamos buscando es <0.001. Muy significativo. Podemos afirmar
la significación de diferencias tanto positivas que la diferencia (mejora) es real, con un riesgo
como negativas, y por tanto debemos conside- (probabilidad) de equivocarnos <0.001.
rar ambas colas simultáneamente. Este segun-
• 202 •
1. Test de dos colas

Para contrastar la hipótesis:
¿hay diferencia?
Aceptación
Rechazo de la hipótesis nula de la hipótesis Rechazo de la hipótesis nula
nula
α/2 α/2
Z
Valor crítico inferior 0 Valor crítico superior
(diferencia negativa) (diferencia positiva)
(-1.96) (1.96)
2. Test de una cola

¿hay diferencia positiva?
Rechazo de la
Aceptación de la hipótesis nula hipótesis nula
α Z
0 Valor crítico
(1.65)
3. Test de una cola

¿hay diferencia negativa?
Rechazo de la hipótesis nula Aceptación de la hipótesis nula
α Z
Valor crítico 0
(-1.65)
* La hipótesis nula es en todos los casos que no hay diferencia. Los valores críticos están establecidos para una significación de 0,05 (5%)
Fuente: Adaptado de Richards LD, La Cava JJ.
Figura 10.1. Test de hipótesis de la diferencia entre dos evaluaciones. Significación (probabilidades) de una o dos colas
según la formulación de la hipótesis alternativa*
Para el criterio 3, p2=0.98; p1=0.9;

z= 0.98 − 0.9 = 1.85
1 1
p=
0.98 + 0.9
= 0.94
(0.94)(0.06) +
60 60
2
• 203 •
buscando en la tabla el lugar donde se cruzan Lo que da unos límites de –0.004 y 0.164, que
1.8 y 0.05 vemos que la probabilidad de este contienen el valor cero, con lo que conclui-
valor de z, si no hubiese diferencia en la reali- ríamos que la diferencia puede ser debida al
dad, es 0.032; como es ≤0.05 (nuestro límite de azar. Esta discrepancia con el otro proceder
riesgo para decidir), rechazamos la hipótesis es debida a que el intervalo de confianza es
nula y diremos que la diferencia entre las dos bidireccional, mientras que con el test esta-
evaluaciones es estadísticamente significativa. dístico hemos podido comprobar nuestra
Si utilizamos para este mismo criterio el hipótesis de mejora que es unidireccional, de
procedimiento de ver el intervalo de confianza una cola; queda así de manifiesto la mayor
de la diferencia tendríamos: conveniencia de utilizar el test del valor de z,
( p2 − p1 ) ± 1.96 p1 (1 − p1 ) p2 (1 − p2 ) (0.9)(0.1) + (0.98)(0.02 ) = 0.08 ± 0.084

+ = 0.08 ± 1.96
n1 n2 60 60
Cuadro 10.5
Probabilidades de un extremo o cola de la curva estandar normal
Tanto el intervalo de Esta tabla da el valor de la zona sombreada

confianza de la diferencia
como un test estadístico 0 z
de dos colas son más
restrictivos, y por tanto Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
menos convenientes, 1.5 0.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056
para detectar diferencias 1.6 0.055 0.054 0.053 0.052 0.051 0.049 0.048 0.048 0.046 0.046
significativas de mejora.
1.7 0.045 0.044 0.043 0.042 0.041 0.040 0.039 0.038 0.038 0.037
1.8 0.036 0.035 0.034 0.034 0.033 0.032 0.031 0.031 0.030 0.029
1.9 0.029 0.028 0.027 0.027 0.026 0.026 0.025 0.024 0.024 0.023
2.0 0.023 0.022 0.022 0.021 0.021 0.020 0.020 0.019 0.019 0.018
2.1 0.018 0.017 0.017 0.017 0.016 0.016 0.015 0.015 0.015 0.014
2.2 0.014 0.014 0.013 0.013 0.013 0.012 0.012 0.012 0.011 0.011
2.3 0.011 0.010 0.010 0.010 0.010 0.009 0.009 0.009 0.009 0.008
2.4 0.008 0.008 0.008 0.008 0.007 0.007 0.007 0.007 0.007 0.006
2.5 0.006 0.006 0.006 0.006 0.006 0.005 0.005 0.005 0.005 0.005
2.6 0.005 0.005 0.004 0.004 0.004 0.004 0.004 0.004 0.004 0.004
2.7 0.003 0.003 0.003 0.003 0.003 0.003 0.003 0.003 0.003 0.003
2.8 0.003 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.002
2.9 0.002 0.002 0.002 0.002 0.002 0.002 0.002 0.001 0.001 0.001
3.0 0.001 <0.001 <0.001 <0.001 <0.001 <0.001 <0.001 <0.001 <0.001 <0.001
- Valores de z >1,65 tienen una probabilidad (significación) <0,05.

- Valores de z >3,0 tienen una probabilidad (significación) <0,001
Fuente: Adaptado de Colton T.. Estadística en medicina. Ed.Salvat. Barcelona. 1989.
• 204 •
para no clasificar como no significativas di- 5. Representación gráfica de las

ferencias que sí lo son. De igual manera, no diferencias en los niveles de calidad entre
sería conveniente utilizar un test estadístico dos evaluaciones
de dos colas.
Como regla general, tal como puede verse Al igual que veíamos en el capítulo 7, para la
en el cuadro 10.5, valores de z ≥1.65 (valor que representación gráfica de los resultados de una
hemos marcado en la tabla) nos van a indicar evaluación, en la representación de los resul-
que la mejora entre las dos evaluaciones es sig- tados conjuntos de dos evaluaciones podemos
nificativa (error a < 0.05). estar interesados en subrayar las mejoras en La representación gráfica de
Si encontramos diferencias negativas entre los niveles de cumplimiento de cada criterio, las diferencias del nivel de
la segunda y primera evaluación no merece la o bien la disminución del número de defectos calidad completa el análisis
pena que calculemos significación estadística: (incumplimientos) encontrados. De igual for- comparativo de las dos
como lo que vamos buscando es exclusiva- ma, podemos querer representar las estimacio- evaluaciones.
mente mejorar, en ese criterio está claro que no nes puntuales o los intervalos de confianza. En
lo hemos conseguido. todos los casos, los gráficos más útiles son los
El cuadro 10.6 contiene el análisis esta- que ya veíamos en el capítulo 7, solo que aña-
dístico completo de los criterios del cuadro diendo los resultados de la segunda evaluación
10.2, comparando la primera y segunda eva- en la forma que resulte más útil e informativa.
luación. Este análisis numérico debe comple- En la figura 10.2 se resumen los diversos
tarse con una presentación y análisis gráfico objetivos de la comparación y representación
adecuado, sea sobre la base de los niveles de gráfica correspondiente. Comencemos por re-
cumplimiento o analizando lo mejorado y lo visar aquellas que son útiles para mostrar di-
que queda por mejorar con un Pareto antes- ferencias en el nivel de calidad, ejemplificando
después. su caso con datos del cuadro 10.4.
Cuadro 10.6
Evaluación de la calidad del diagnostico, anamnesis y exploración física inicial del paciente hipertenso antes y después de la intervención
para mejorar. Diferencias en los niveles de cumplimiento de los criterios en muestras aleatorias de 60 casos
Mejora rela-
Mejora abso- tiva Significación
1ª Evaluación 2ª Evaluación
Criterio* luta p2 - p2 estadística
p1 (IC 95%) p2 (IC 95%)
p2 - p1 –––––––– p
1-p2
1. Diagnóstico correcto 75.0 (±11.0) 95.0 (±5.5) 20 80% <0.001
2. Antecedentes familiares 80.0 (±10.1) 86.0 (±8.8) 6 30% NS
3. Antecedentes personales 90.0 (±7.6) 98.0 (±3.5) 8 80% 0.046
4. Consumo de tabaco 30.0 (±11.6) 70.0 (±11.6) 40 57% <0.001
5. Consumo de alcohol 10.0 (±7.6) 50.0 (±12.7) 40 44% <0.001
6. Peso y talla y/o IMC 85.0 (±9.0) 84.0 (±9.3) — <0.001 —
7. Auscultación cardiaca 75.0 (±11.0) 80.0 (±10.1) 5 20% NS
8. Exploración abdominal 40.0 (±12.4) 57.0 (±12.5) 17 28.3% 0.031
9. Pulsos periféricos 50.0 (±12.7) 60.0 (±12.4) 10 20% NS
10. Soplos carotideos 55.0 (±12.6) 75.0 (±11.0) 20 44% <0.001
11. Edemas 25.0 (±11.0) 50.0 (±12.7) 25 33% <0.001
12. Fondo de ojo 15.0 (±9.0) 25.0 (±11.0) 10 11.8% NS
* Este es el enunciado. La descripción detallada de los criterios debe seguir el formato indicado en el capítulo 4.
p1= cumplimiento en la primera evaluación.
p2= cumplimiento en la segunda evaluación.
NS: No significativa (p>0.05).
• 205 •
1. Representación de diferencias en el nivel de calidad

Diferencias en estimaciones puntuales
100 1a evaluación
90 2a evaluación
80
% cumplimientos
70
60
50
Diagrama de barras comparativas 40
30
20
10
0
3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12.
Criterios
1.
12. 2.
11. 3.
Gráfico de estrella 10. 4. 1a evaluación

2a evaluación
9. 5.
6.
8.
7.
Diferencias con intervalos de confianza
100
80
60
Gráfico box and whiskers comparativo 40
20
0
3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12. 3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12.
Criterios
2. Análisis de la mejora y defectos por mejorar

100 1a evaluación 342 2a evaluación
Mejora
222 100
Diagrama de Pareto antes-después
5. 11. 8. 10. 7. 6. 12. 11. 5 8. 9. 4 10 7 6 2 1 3

Criterios Criterios
Figura 10.2. Representación y análisis gráfico de la comparación entre dos evaluaciones. Resumen de objetivos y presentación
• 206 •
5.1. Representación gráfica de las diferencias 120

en estimaciones puntuales del nivel de
cumplimiento 100
% cumplimientos
80
Para este objetivo las dos opciones más útiles
son el diagrama de barras comparativas y el 60
gráfico de estrella. En el gráfico de barras lo
que hacemos es yuxtaponer la barra correspon- 40
diente al nivel de cumplimiento en la 2ª eva-
luación; a lo que teníamos en la 1ª evaluación. 20
El orden de las barras no tiene porqué ser el
de la lista de criterios. De hecho es preferible o 0
3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12.
bien mantener el orden que había en la prime- Criterios
ra evaluación (de más cumplimiento, a menos
1a Evaluación
cumplimiento) o establecer el orden que haya 2a Evaluación
resultado en la segunda evaluación (también
de más cumplimiento a menos cumplimiento). Criterios: 1. Diagnóstico correcto. 2. Antecedentes familiares. 3 Antecedentes persona-
Esta segunda opción tiene la ventaja de evi- les. 4. Consumo de tabaco. 5. Consumo de alcohol. 6. Peso y talla y/o IMC. 7. Ausculta-
ción cardiaca. 8. Exploración abdominal. 9. Pulsos periféricos. 10. Soplos carotídeos. 11.
denciar mejor la situación actual, y es la que Edemas. 12. Fondo de ojo.
hemos utilizado para representar los datos del
cuadro 10.4 en el gráfico de la figura 10.3. Figura 10.3. Comparación gráfica de dos evaluaciones. Gráfico de barras
La representación en gráfico de estrella o
radar, tiene la ventaja de poder visualizar tam-
bién el área de mejora global, correspondiente
al área entre las líneas que representan las dos
1.
evaluaciones. Al mismo tiempo es igualmente 12. 2.
visible, incluso mejor que en el gráfico de ba-
rras, hasta qué punto se ha mejorado en cada 11. 3.
criterio individualmente y lo que queda por
mejorar en cada uno. Es pues un gráfico más
informativo, cuya única desventaja es, como ya
dijimos en el capítulo 7, que pierde en claridad, 10. 4.
sobre todo en la comparación criterio a criterio,
a medida que aumenta el número de criterios
representados. La figura 10.4 es el gráfico de 1a evaluación
estrella comparando las dos evaluaciones del 9. 5. 2a evaluación
cuadro 10.4.
8. 6.
5.2. Representación gráfica de diferencias en 7.
intervalos de confianza Criterios

No es frecuente analizar y representar esta 2. Antecedentes familiares 8. Exploración abdominal
información. Lo más normal es representar 3. Antecedentes personales 9. Pulsos periféricos
las estimaciones puntuales (barras, estrella) 4. Consumo de tabaco 10. Soplos carotídeos
o defectos (Pareto) e indicar, si acaso, en qué 6. Peso y talla y/o IMC 12. Fondo de ojo
criterio es la diferencia estadísticamente signi-
ficativa. No obstante, si quisiésemos plasmar
gráficamente las diferencias en las estimacio- Figura 10.4. Comparación gráfica de dos evaluaciones. Gráfico de estrella
nes de intervalos de confianza, el gráfico de
• 207 •
elección sería el de tipo box and whiskers, cuya co, y que se convierte así en la representación
explicación vimos también en el capítulo 7. gráfica de elección, caso de querer seleccionar
Como en el gráfico de barras, puede ser sólo una.
útil ordenar los criterios de más a menor nivel
de cumplimiento según los resultados de la se- 6. Análisis gráfico de la mejora y defectos
gunda evaluación. por mejorar: diagrama de Pareto antes-
Cuando hay muchos criterios, puede tam- después
bién ser visualmente más claro si prescindimos
de la caja y representamos sólo la estimación En el capítulo 7 se revisó paso a paso la cons-
puntual y los límites del intervalo de confianza trucción de un diagrama de Pareto de los de-
del 95%. En la figura 10.5 se han representado fectos como el tipo de análisis gráfico de más
los datos del cuadro 10.4 con un gráfico box and utilidad para priorizar hacia dónde dirigir las
whiskers en el que hemos introducido las dos acciones para la mejora. A la hora de compa-
modificaciones mencionadas (ordenar los crite- rar la reevaluación con la situación de partida
rios según los resultados de la segunda evalua- también nos interesa, aparte de ver lo que he-
ción y representar sólo la estimación puntual y mos mejorado, tener una imagen clara de las
los límites del intervalo de confianza). características de lo que queda por mejorar.
Con todo, reviste un mayor interés anali- Para conjuntar ambas imágenes (mejora conse-
zar explícitamente no sólo la mejora consegui- guida y mejora por conseguir) nada mejor que
da sino también los defectos por mejorar. La un diagrama de Pareto antes-después elabora-
mejor forma de hacerlo es con un diagrama de do de una manera determinada.
Pareto antes-después, una forma de represen- En los manuales sobre métodos para el
tar la diferencia entre las dos evaluaciones que control y la mejora de la calidad se pueden
ofrece más información que ningún otro gráfi- encontrar varias formas de diagrama de Pa-
100
80
60
40
20
0
3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12. 3. 1. 2. 6. 7. 10. 4. 9. 8. 5. 11. 12.
Criterios
Estimación puntual
Intervalo confianza 95%
Criterios

2. Antecedentes familiares 8. Exploración abdominal
Figura 10.5. Comparación gráfica de dos evaluaciones box and whiskers antes–después
• 208 •
reto antes-después, siendo probablemente lo absoluto de defectos o incumplimientos). En La representación gráfica

más frecuente la simple yuxtaposición de los estas dos formas alternativas, representadas en más completa e informativa
Paretos de ambas evaluaciones construidos de la figura 10.6 junto a la más común, se unen los es el gráfico de Pareto
forma independiente, cada uno con los datos dos diagramas en uno solo con tres ejes, de los antes-después.
sobre los defectos de su correspondiente eva- cuales el central es el del número absoluto de
luación; en otras ocasiones aparecen las barras defectos (incumplimientos), obligatoriamente
apiladas, en vez de en secuencia horizontal, y igual para los dos diagramas, mientras que el
yuxtapuestas por su base tomando la forma de de la izquierda es el de la frecuencia relativa
lo que se llama “pirámide de Pareto”. Sin em- (% de incumplimientos) para la primera eva-
bargo ninguna de estas formas es visualmente luación y el de la derecha es el de la frecuencia
tan clara e informativa como la que se consi- relativa en la segunda evaluación. Con este es-
gue introduciendo una pequeña modificación: quema de base, tanto las barras del diagrama
mantener en el Pareto de la segunda evaluación el como la curva de porcentaje acumulado para
tamaño y escala que tenía en la primera evaluación identificar los pocos vitales pueden partir del
el eje que representa el número absoluto de defectos; eje central en ambas evaluaciones (con lo cual
si hemos logrado mejorar, el Pareto de la se- el diagrama de la primera evaluación resultará
gunda evaluación se representará en una parte ordenado de derecha a izquierda, figura 10.6c),
de este eje, de forma que la diferencia aparece o mantener el orden de izquierda a derecha
claramente como mejora conseguida. Al mis- para los dos (figura 10.6b). En todos los casos
mo tiempo, el diagrama de la 2ª evaluación van a ser representaciones gráficas informati-
puede interpretarse aisladamente, como cual- vas de la diferencia entre las dos evaluaciones Para que el Pareto
quier Pareto, para identificar qué hacer para y de las características de lo que aún queda por antes-después resulte
seguir mejorando; adicionalmente, al mante- mejorar. Depende de las preferencias de cada más informativo hay que
nerse la misma escala, la diferencia en cada cri- uno elegir una u otra de las tres modalidades. mantener constante en
los dos diagramas el eje
terio puede compararse individualmente vien- Los datos del cuadro 10.4, convertidos en
del número absoluto de
do las barras correspondientes de la primera y información útil para los diagramas de Pareto
defectos.
segunda evaluación. son los que figuran en el cuadro 10.7. Con ellos
Así pues, construido como proponemos, el hemos construido los tres diagramas antes-
Pareto antes-después permite: después de la figura 10.6, donde se aprecia a
1. Evidenciar la magnitud de la mejora global simple vista el área de mejora, a la vez que el
conseguida, expresada por la diferencia Pareto de después es interpretable de forma
entre el número total de defectos (incum- independiente como ayuda para decidir qué
plimientos) de la primera y segunda eva- hacemos a continuación.
luación, y el área que delimita en el Pareto En caso de que la muestra empleada en
de la 2ª evaluación. la segunda evaluación no sea igual que la de
2. Analizar y priorizar lo que nos queda que la primera hay que hacer un pequeño ajuste
mejorar, y qué criterios son los principales para poder utilizar cualquiera de las tres mo-
causantes de los defectos de calidad. dalidades de Pareto antes-después que hemos
3. Comparar la mejora (disminución del nú- propuesto. El ajuste consiste en calcular, por
mero de incumplimientos) de cada criterio simple regla de tres, lo que supondría el núme-
individualmente. ro de defectos encontrados en la segunda eva-
luación, si el tamaño de muestra fuese idéntico
La forma más conveniente de este tipo de Pa- al de la primera evaluación. Por ejemplo, si los
Si la muestra no es idéntica
reto antes-después es probablemente la que datos de del cuadro 10.5 correspondieran a una
en las dos evaluaciones, hay
se representa en el esquema de la figura 10.2. primera evaluación de 60 casos y una segunda que ajustar el número de
Esta es una de las dos formas de representa- de 80, no podríamos utilizarlos directamente defectos (incumplimientos)
ción que han surgido en nuestra experiencia, para representar el diagrama de Pareto antes- de la segunda evaluación
modificando la forma más común que sería la después que proponemos, dado que en 80 ca- tomando como referencia
de construir dos Paretos independientes, dado sos vamos a encontrar un mayor número de el tamaño de muestra de la
que ambos Paretos tienen un eje común que ha defectos (incumplimientos) para proporciones primera evaluación.
de ser idéntico (el correspondiente al número de cumplimiento idénticos en las dos evalua-
• 209 •
Cuadro 10.7
Comparación de dos evaluaciones, frecuencia absoluta, relativa y acumulada de los incumplimientos de los criterios evaluados
1ª evaluación 2ª evaluación
Nº incum % (Fre- Nº incum %
Frecuencia Frecuencia
Criterio (frecuencia cuencia Criterio (frecuencia (Frecuencia
acumulada acumulada
absoluta) relativa) absoluta) relativa)
5. Consumo de alcohol 54 15.8 15.8 12. Fondo de ojo 45 20.3 20.3
12. Fondo de ojo 51 14.9 30.7 11. Edemas 30 13.5 33.8
11. Edemas 45 13.2 43.9 5. Consumo alcohol 30 13.5 47.3
4. Consumo tabaco 42 12.3 56.2 8. Exploración abdominal 26 11.7 59.0
8. Exploración abdominal 36 10.5 66.7 9. Pulsos periféricos 24 10.8 69.8
9. Pulsos periféricos 30 8.8 75.4 4. Consumo tabaco 18 8.1 78.0
10. Soplos carotídeos 27 7.9 83.3 10. Soplos carotídeos 15 6.8 84.7
1. Diagnostico correcto 15 4.4 87.7 7. Auscultación cardiaca 12 5.4 90.1
7. Auscultación cardiaca 15 4.4 92.1 6. Peso y talla y/o IMC 10 4.5 94.6
2. Antecedentes familiares 12 3.5 95.6 2. Antecedentes familiares 8 3.6 98.2
6. Peso y talla y/o IMC 9 2.6 98.3 1. Diagnostico correcto 3 1.4 99.6
3. Antecedentes personales 6 1.8 100.0 3. Antecedentes personales 1 0.5 100.0
342 100 222 100
ciones; en consecuencia no podríamos utilizar terio 12 en Pareto comparativo de la 2ª evalua-

el ”truco” principal de nuestro diagrama con- ción, si n2 fuese 80 (y no 60 como n1) sería:
junto que consiste, como hemos visto, en man- 45 • 60
tener común el eje de número absoluto de de- x= = 34
fectos y realizar la comparación en referencia a 80
él. Para solucionarlo, normalizamos los datos de forma que los 45 incumplimientos de la
de la segunda evaluación, tomando como re- muestra de 80 casos contarían como 34 para la
ferencia la primera evaluación, y calculamos el comparación con la 1ª evaluación que se hizo
número de defectos que corresponderían a los sobre 60 casos.
encontrados en la 2ª evaluación si el tamaño de Con los números absolutos de defectos
muestra fuese como el de la primera evalua- ajustados de esta forma para todos los criterios,
ción. De la siguiente forma: construiremos nuestro Pareto comparativo.
defectos en la 2ª evaluación (d 2 ) x
=
muestra en la 2ª evaluación (n2 ) muestra en la 1ª evaluación (n1 )
7. ¿Qué hacemos a continuación? Cursos
de acción tras la reevaluación
d2 • n1
de donde x= , En general, dentro de las actividades para me-
n2 jorar la calidad de la atención que ofrecemos a
cálculo que realizaríamos para cada criterio, de nuestra población, siempre tendremos la op-
forma que el número absoluto de defectos sea ción de iniciar nuevos ciclos de mejora, diseñar
perfectamente comparable a los que había en o planificar mejor los servicios que ofrecemos,
la primera evaluación. y construir y monitorizar indicadores relevan-
En nuestros datos, por ejemplo, el número tes y representativos de los aspectos que más
de defectos que había que utilizar para el cri- nos interesen de nuestro trabajo. Estos son los
• 210 •
342 100 342
Mejora
322
Incumplimientos
Incumplimientos
100
50
6a
50
0
5. 12. 11. 4. 8. 9. 10. 1. 7. 2. 6. 3. 12. 11. 5 8. 9. 4 10 7 6 2 1 3
Criterios Criterios
100 342
Mejora
322
100
6b
5. 11. 8. 10. 7. 6. 12. 11. 5 8. 9. 4 10 7 6 2 1 3

Criterios Criterios
100 342
Mejora
322
100
6c
3. 6. 2. 1. 7. 10. 9. 8. 4. 11. 12. 5 12. 11. 5 8. 9. 4 10 7 6 2 1 3

Criterios Criterios
Figura 10.6. Comparación gráfica de dos evaluaciones
tres grupos de actividades que mencionába- Sin embargo, en cualquier caso hay que
mos en el capítulo 1, uno de los cuales (Ciclos decidir qué hacemos en relación con el ciclo Si no hemos mejorado,
de mejora) se describe paso a paso en este made mejora tras analizar la reevaluación con la hay que reiniciar el ciclo y
nual. Los otros dos (monitorización y diseño o metodología descrita en este capítulo. Obvia- pensar en qué podemos
planificación) son objeto de otros manuales que mente, lo que decidamos hacer va a estar con- haber fallado.
acompañan a este. dicionado por el resultado obtenido en el ciclo
• 211 •
de mejora. En primer lugar, si no hemos conse- óptimos y la intervención ha sido lo suficien-

guido mejorar hasta los niveles que queremos, temente robusta, generalmente de tipo estruc-
y debemos, estar, no podemos dar por conclui- tural, como para pensar que va a ser difícil que
do el ciclo de mejora. Es muy probable que nos volvamos a los niveles de calidad deficiente
hayamos equivocado al analizar las causas o que teníamos al comenzar el Ciclo de mejora.
al diseñar la intervención, que, obviamente, no La segunda opción supone elegir como indi-
ha sido efectiva si no hemos logrado mejorar. cador o indicadores algunos de los criterios
Lo que debemos hacer entonces es reiniciar el empleados en la evaluación (o construir indi-
ciclo, o al menos retomarlo en aquellos pasos cadores relacionados) y volverlos a medir de
que pensamos son el origen de que no haya- forma planificada con los métodos y planes
mos mejorado (¿análisis de causas?; ¿diseño de de monitorización óptimos que nos alerten de
criterios?, ¿diseño de intervención?). la presencia, si se produce, de deterioro en el
Caso de haber logrado mejorar satisfacto- nivel de calidad logrado. En esta opción, para
riamente, tenemos dos opciones ante nosotros. ser prácticos y operativos nos conviene cono-
Una es dejar el tema como está y otra diseñar cer y practicar métodos de monitorización lo
un plan de monitorización para asegurarnos más eficientes posible, lo cual constituye otro
que la mejora conseguida se mantiene. La pri- bloque de conocimientos que debemos adqui-
mera opción, dejar el tema como está, sería ló- rir, y que es objeto del segundo manual de esta
gica si los niveles de calidad alcanzados son serie.
BIBLIOGRAFÍA
• Gitlow H, Gitlow s, Oppenheim A, Oppenheim R. Diagnosing a process. In: Tools and methods for the improvement of quality.
Boston: Irwin, 1989. Cap. 12.
• Lemeshow S, Hosmer DW, Klar J, Lwanga SK. The two-sample problem. In: Adequancy of sample size in health studies. New
York: WHO/John Wiley and sons, 1992. Cap. 2.
• Richard LE, LaCava JJ. Test of hypothesis. In: Bussiness statistics. New York: McGraw Hill, 1983. Cap. 8.
• 212 •
Anexo 10.1
Indicaciones para la aplicacion práctica de los contenidos de este capítulo
Los contenidos metodológicos de este capítulo son útiles para analizar y documentar estadística y gráficamente la mejora conseguida
tras una intervención, en referencia a la situación basal. Se trata de que quede evidente la respuesta a las preguntas siguientes: ¿cuál
es el nivel de calidad que hemos logrado tras intervenir?; ¿cuál ha sido la mejora conseguida?; ¿hemos mejorado significativamente en
relación a la situación de partida?; ¿cuál ha sido la mejora relativa en cada uno de los criterios o indicadores medidos?; ¿qué debemos
hacer a continuación en relación al problema de calidad evaluado? Para realizar esta práctica son necesarios los resultados obtenidos en
una evaluación basal y la reevaluación, tas implementar una intervención para mejorar, del nivel de calidad del tema seleccionado por
cada participante o equipo de mejora. El resumen e indicaciones y formatos a utilizar para los pasos a seguir se describen a continuación.
ANÁLISIS ESTADÍSTICO

l Al igual que ocurría con la evaluación (capítulo 7), la reevaluación de una muestra de casos proporciona una estimación puntual
que debe completarse con el cálculo del intervalo de confianza.
l No obstante, el principal objetivo de la reevaluación es comprobar si se ha experimentado una mejora en el nivel de calidad, y
tomar, en consecuencia, decisiones en relación con el curso de acción siguiente.
l Sin embargo, la mejora observada puede ser debida al azar cuando se han evaluado muestras (mejora aparente). En consecuencia,
a menos que se haya evaluado el universo de casos, es necesario determinar si las diferencias en el cumplimiento de criterios entre
ambas evaluaciones son significativas desde el punto de vista estadístico o no.
l En resumen, el análisis estadístico se desarrolla a lo largo de las siguientes etapas: 1º. Estimación de la proporción de cumplimiento
puntual y del intervalo de confianza en los criterios (nivel de calidad) o indicadores, tanto en la reevaluación como en la evaluación
basal; 2º. Estimación de la mejora conseguida (absoluta y relativa); y, en el caso de que se hayan evaluado muestras, 3º. Grado de
significación estadística de la mejora observada.
Paso 1º. Para estimar el nivel de calidad (puntual e intervalo de confianza) se procede de forma análoga a lo descrito en el capítulo 7.
Paso 2º La estimación puntual de la mejora o el cambio experimentado en el cumplimiento de un criterio entre la reevaluación (p2) y
la evaluación (p1) se proporcionará en términos de mejora absoluta y relativa, para cada criterio. La mejora absoluta (MA) es,
simplemente, la diferencia, entre la reevaluación y la evaluación, en el nivel cumplimiento del criterio en cuestión, como se
resume en la siguiente fórmula:
MA= p - p1
2
Esta mejora se debe reflejar también, ya que aporta más información, en relación al punto de partida o margen de
mejora potencial de la 1ª evaluación, mediante el cálculo de la mejora relativa (MR) de la siguiente forma:
p2 - p1
MR=
1 - p1
Para darlo en forma de porcentaje se multiplica por 100.
Continúa.../
• 213 •
/... continuación
Paso 3º. Por último, cuando se trabaja con muestras, es necesario descartar la posibilidad de que la mejora observada sea, en realidad,
aparente; como consecuencia del azar o error del muestreo. Ello implica determinar, mediante un contraste de hipótesis de una
cola, la probabilidad de la hipótesis nula:
Hipótesis nula: p2 p1 “No se ha experimentado una mejora en el nivel de calidad”
w Dicha hipótesis se puede rechazar cuando tiene una probabilidad (p) suficientemente baja (normalmente menor o
igual a 0.05), para aceptar, con un error (=p) la hipótesis alternativa:
w Hipótesis alternativa: p2 p1 “Se ha experimentado una mejora” (con un riesgo de error=)
w La probabilidad de la hipótesis nula (p o error ) se determinará, en el caso más frecuente de que se hayan aplicado
criterios dicotómicos (cumple o no cumple), mediante el test de la z de comparación de proporciones para consultar
posteriormente en la tabla de la distribución del valor z de una cola (cuadro 10.5) su valor p (probabilidad de que la
hipótesis nula sea cierta).
p2 - p1 p : proporción de cumplimientos en la 2ª evaluación

z= 2
1 1 p : proporción e cumplimientos en la 1ª evaluación.

p(1 - p) + 1
n1 n2 n : tamaño de la muestra en la 2ª evaluación
2
n : tamaño de la muestra en la 1ª evaluación.

1
c1 + c2 c : nº de cumplimientos del criterio en 1ª evaluación.

1
p=
n1 + n2 c : nº de cumplimientos del criterio en la 2ª evaluación.
2

Los resultados pueden resumirse en una tabla con el formato que se adjunta a continuación:
Continúa.../
• 214 •
/... continuación
Formato para la presentación de los datos de la reevaluación
1ª 2ª Mejora Mejora relativa Significación

Criterio Evaluación Evaluación absoluta p2-p1 estadística
p1 (IC 95%) p2 (IC 95%) p2 - p1 1-p1 p
1. (± ) (± )
2. (± ) (± )
3. (± ) (± )
4. (± ) (± )
5. (± ) (± )
6. (± ) (± )
7. (± ) (± )
8. (± ) (± )
9. (± ) (± )
10. (± ) (± )
. (± ) (± )
. (± ) (± )
p1= cumplimiento en la primera evaluación.
p2= cumplimiento en la segunda evaluación.
NS: No significativa (p >0.05)
• 215 •
/... continuación
ANÁLISIS GRÁFICO: DIAGRAMA DE PARETO ANTES-DESPUÉS

(Caso de haber medido más de un criterio o indicador)
1. Elaboración de la tabla de frecuencias absolutas y relativas de incumplimientos.

Se realizará una tabla de frecuencias de incumplimientos relativos y absolutos, en la reevaluación de cada criterio, siguiendo los
pasos 1º, 2º y 3º del apartado correspondiente al “Análisis de los defectos de la calidad” que se describe en la aplicación práctica del
capítulo 7 con los resultados de la 1ª evaluación.
Sin embargo, si las muestras, de la reevaluación (n2) y de la evaluación (n1) difieren de tamaño será necesario, previamente,
ajustar las frecuencias absolutas de incumplimientos de la reevaluación de cada criterio (d2) en base al tamaño de la muestra de la
1ª evaluación, aplicando una sencilla regla de tres:
d2 - n1
x=
n1
Esta tabla junto con la correspondiente a la 1ª evaluación son las que se emplean para elaborar el gráfico de Pareto antes-después.
2. Elaboración del gráfico

Paso 1º. Dibujar un plano cartesiano con un eje horizontal y tres subejes verticales (derecho, central e izquierdo).
Paso 2º. Representar, con los datos de la primera evaluación, un diagrama de Pareto, tal como se desarrolla en los pasos 4º, 5º y 6º del
apartado correspondiente al análisis de los defectos de la calidad descritos en el capítulo 7; pero, a diferencia del anterior,
el porcentaje relativo de incumplimientos corresponde al eje vertical izquierdo, mientras que la frecuencia absoluta de
incumplimientos corresponde al eje vertical central. Los criterios se disponen en el eje de abscisas, en la parte situada a la
izquierda del eje vertical central y en orden decreciente a su frecuencia relativa de incumplimientos.
Paso 3º. Representar a partir de los datos de la tabla de incumplimientos de la segunda evaluación, otro diagrama de Pareto (barras
de altura decreciente, curva acumulada y anotación del punto correspondiente al 60-80% del total de incumplimientos). La
frecuencia absoluta y relativa de incumplimientos se corresponde con los ejes verticales central y derecho respectivamente.
Los criterios se representan en el eje de abscisas, en la zona situada a la derecha del eje vertical central y en orden decreciente
a su frecuencia relativa de incumplimientos.
Paso 4º. Unir con una recta los puntos correspondientes al total de incumplimientos absolutos y relativos (100%) de la 2ª evaluación;
ambos situados en los ejes verticales central y derecho respectivamente; y trazar una paralela, delimitada por los ejes anteriores,
que pase por el punto correspondiente al total de incumplimientos absolutos de la primera evaluación.
Paso 5º. Subrayar entre los ejes verticales central y derecho la zona comprendida entre las dos rectas anteriores. Esta área corresponde
al espacio de mejora experimentada.
Continúa.../
• 216 •
/... continuación
Caso de no disponer de medios electrónicos para la realización del gráfico, puede emplearse el formato que se adjunta a
continuación:
Formato para la presentación del pareto antes-despues

Frecuencia relativa Frecuencia abso- Frecuencia relativa
1ª evaluación luta -2ª evaluación-
100%
95%
90%
85%
80%
75%
70%
65%
60%
55%
50%
45%
40%
35%
30%
25%
20%
15%
10%
5%
-1ª evaluación -2ª evaluación
Criterios: Código Descripción

C1:
C2:
C3:

• 217 •
Métodos y herramientas
para la realización de ciclos de mejora
de la calidad en servicios de salud
Se terminó de imprimir en diciembre de 2015.

La edición consta de 1 000 ejemplares
y estuvo al cuidado de la
Subdirección de Comunicación Científica y Publicaciones
del Instituto Nacional de Salud Pública
View publication stats

Mtodosyherramientasciclosdemejora PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Mtodosyherramientasciclosdemejora PDF

Загружено:

Авторское право:

Доступные форматы

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Métodos y herramientas para la realización de ciclos de mejora de la calidad en

Book · January 2015

How to study the nosocomial infection outbreaks? View project

Indicadores de Boas Práticas de Segurança do Paciente - Projeto ISEP-Brasil View project

The user has requested enhancement of the downloaded file.

D.R. © Instituto Nacional de Salud Pública

Impreso y hecho en México

Contenido general y objetivos específicos

1. El concepto general y operativo de la calidad

2. Satisfacción del profesional: concepto de cliente interno

3. Concepto de calidad total

4. Gestión de la calidad. Componentes esenciales de un sistema de gestión

5. Los bloques estratégicos para la mejora de la calidad

6. Las actividades para la mejora de la calidad

7. Programas internos y externos en la estrategia para la mejora de la calidad

8. Responsabilidades en la mejora de la calidad

9. Estrategias de implantación de actividades. El ciclo de mejora

Análisis del problema Capítulo 3

(RE) Diseño de estudio

Implantación Recogida, análisis

Definición de criterios/ Diseño de estudios

• Definición de resultados por conseguir 3

Puntos de partida 1 Monitorización 2 Ciclo de mejora 3 Diseño

1. Diferenciar definiciones genéricas de calidad, aplicables a cualquier tipo de producto o

para la gestión de la calidad 1

“Cuando la mente se ensancha para dar cabida a una idea nueva

Necesitamos definir qué es

Calidad de los servicios de salud

Calidad de un servicio concreto

Figura 1.1. Los niveles del concepto de calidad

de calidad científico-técnica para las distintas el componente proveedor, pero no es un ele-

el personal de la organización; la búsqueda tividades diferenciables dentro del programa:

Grupo de actividades Punto de partida Objetivo inmediato

Figura 1.3. Los seis grupos de intervenciones para la mejora de la calidad

Las intervenciones sobre

dos, y con el equipamiento necesario para 6. Las actividades para la mejora de la

Contenidos generales y objetivos específicos

2. Concepto de problema de calidad u oportunidad de mejora

3. Identificación de la oportunidad de mejora

4. Normas generales para la selección de una oportunidad de mejora

5. Métodos de identificación de oportunidades de mejora. Consideraciones generales

6. Métodos para la identificación de oportunidades de mejora que no precisan datos

7. Métodos para la identificación de oportunidades de mejora mediante datos

8. Inicio práctico del ciclo de mejora

9. El cartel narrativo: un apoyo para la realización y el seguimiento del ciclo de mejora

Anexo 2.1. Instrucciones para la elaboración de un cartel narrativo de un ciclo de mejora

Anexo 2.2. Instrucciones para la realización de la técnica de grupo nominal

Análisis del problema Capítulo 3

(RE) Diseño de estudio

Implantación Recogida, análisis

Definición de criterios/ Diseño de estudios

• Definición de resultados por conseguir 3

Puntos de partida 1 Monitorización 2 Ciclo de mejora 3 Diseño

1. Describir diferentes métodos aplicables para la identificación de problemas de calidad u

“Un defecto puede ser un tesoro. El descubrimiento de la imperfección

Este capítulo aborda el

2. Concepto de problema de calidad u prestados al usuario y definir a continuación

4.1 Factibilidad de la resolución del problema la oportunidad de mejora en términos de “falta

Proceso/resultado Estructura (organizacional)

Problema tipo I Problema tipo II

Figura 2.1. Clasificación de los problemas de calidad

C C C 3 (Resultado C=3; D=2; A=1; B=0)

%_ %_ %___

1. %_ %_ %___

222 100