¿Qué es un diseño D-eficiente?

Cuando realizamos un experimento de elección discreta, antes de generar nuestra encuesta (diseño) debemos tomar varias decisiones:

  • ¿Cuántos atributos vamos a emplear?
  • ¿Cuántos niveles tendrá cada atributo?
  • ¿Cuántos choice sets (preguntas en la encuesta) queremos emplear?
  • ¿Cuántas alternativas habrá por choice set?
  • ¿Usaremos una alternativa nula?

Una vez respondidas estas preguntas, ya estamos preparados para generar nuestro diseño eficiente. Nuestro objetivo en este punto es, con esos parámetros, maximizar la información que extraemos de cada encuestado. Ya que hemos especificado a priori cuántos choice sets usaremos y cuántas alternativas tendrán nuestros choice sets, lo que queremos ahora es conocer cómo combinar los niveles de los atributos en alternativas/choice sets que maximicen la información que extraemos el encuestado.

Para ilustrar el problema, centrémonos en el ejemplo de Carlsson y Martinsson en Design techniques for stated preference methods in health economics. Supongamos que tenemos dos atributos: atributo 1 (con niveles a y b) y atributo 2 (con niveles c y d).

Tradicionalmente se ha empleado la estrategia del «diseño óptimo». En el diseño óptimo, la selección de los niveles que van en los choice sets se hace basada en el concepto de ortogonalidad. La ortogonalidad puede ser entendida a través del siguiente ejemplo: imaginemos que un encuestado tiene que escoger entre las dos alternativas siguientes:

Alternativa A
a
c
Alternativa B
b
c

Si en este caso el encuestado escoge la Alternativa A, será porque el nivel a es preferido al nivel b. Es por esto por lo que empleamos la idea de ortogonalidad para calcular el coeficiente de cada nivel de forma independiente.

Sin embargo, los diseños ortogonales no cumplen las cuatro reglas establecidas por Huber y Zwerina (https://doi.org/10.1177/002224379603300305) :

  • Ortogonalidad
  • Equilibrio de niveles (cada nivel aparece el mismo número de veces en el diseño)
  • Equilibrio de utilidad (las alternativas reportan una utilidad similar al encuestado)
  • No solapamiento (las alternativas contienen el mismo nivel para el mismo atributo)

Teóricamente, aquel diseño que cumpla estos cuatro principios será un diseño muy eficiente que conseguirá sacar la máxima información posible por cada encuestado entrevistado. Sin embargo, en la gran mayoría de ocasiones alcanzar los cuatro principios simultaneamente es imposible. Es por esto que existen algoritmos que nos dan diseños D-eficientes. ¿Qué quiere decir esto? La D-eficiencia es un indicador de cómo de cerca se encuentra mi diseño del diseño ideal. Los algoritmos que aproximan diseños D-eficientes alcanzan la máxima D-eficiencia posible para cada situación.

Cómo funcionan estos algoritmos

Los principios matemáticos del algoritmo que emplearemos para generar nuestro diseño D-eficiente están explicados en el artículo de Huber y Zwerina mencionado anteriormente. Por suerte, nosotros no necesitamos replicarlo pues esta rutina ya ha sido programada por otros usuarios (en el caso de R). Por tanto, con una explicación sencilla de cómo funcionan nos bastará.

Antes hemos mencionado el concepto de D-eficiencia en el que ahora conviene indagar. La D-eficiencia, técnicamente, es una medida de la varianza de los estimadores del modelo que queremos calcular. Por tanto, incrementando la D-eficiencia, reducimos la varianza de los estimadores y conseguimos que el modelo sea más eficiente (con menos respuestas conseguimos la misma información ó con las mismas respuestas conseguimos más información). La D-eficiencia puede ser estimada a través de la siguiente fórmula:

D-eficiencia=[\Omega^{1/k}]^{-1}

Donde \Omega es la matriz de varianzas-covarianzas del modelo que vamos a calcular y k es el número de parámetros del modelo. Para una regresión lineal, \Omega puede ser calculado como:

\Omega=(X'X)^{-1}\sigma^2

Para la regresión logística el cálculo se complica y será realizado por software (la fórmula puede encontrarse en la referencia anterior a Carlsson y Martinsson, pág. 5).

Una cuestión que puede surgir llegados a este punto es, ¿cómo va a conocerse la matriz de varianzas-covarianzas del modelo si aún no se ha estimado? Esta es una buena pregunta. Cuando nosotros estimamos un diseño D-eficiente, el algoritmo que empleamos (a través de R, Stata u otro software) nos pide (¡efectivamente!) unas betas (los coeficientes del modelo) para calcular la matriz de varianzas-covarianzas. ¿Qué hacemos si aún no hemos calculado el modelo? Muy sencillo, primero creamos el diseño a través del algoritmo con coeficientes cero. Este diseño lo podremos presentar a una muestra pequeña de encuestados (por ejemplo N=50). Una vez tengamos sus respuestas podemos estimar el modelo y usar los coeficientes que resulten para crear un nuevo diseño. Este segundo diseño ya estará afinado y será D-eficiente.

Cómo crear un diseño D-eficiente con R ->

2 thoughts on “¿Qué es un diseño D-eficiente?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *