11 Cópulas

Hasta el momento hemos visto como construir modelos univariados. Pero existen aplicaciones donde dos riesgos están correlacionados.

Es decir, a partir de la correlación lineal $ρ$ entre dos variables $X$ y $Y$ , podríamos describir su comportamiento. Sin embargo, en pérdidas nos interesa responder otras preguntas:

Si un riesgo tiene una pérdida muy grande, ¿es más probable que otro riesgo también tenga una pérdida grande?
¿Cuáles son las probabilidades de tener varias pérdidas grandes de diferentes tipos de riesgo?

Estas preguntas se responde a partir del concepto de dependencia en las colas construida a partir de la cópula.

11.1 Definición y construcción de cópulas

El concepto de cópula es una distribución generada a partir de las distribuciones marginales de dos o más variables. Formalmente

Una cópula es una función $C : [0, 1]^{d} \mapsto [0, 1]$ con las siguientes propiedades:

Marginales:. Para cualquier $j = 1, \dots, d$ se tiene que $C (1, \dots, 1, u_{j}, 1, \dots, 1) = u_{j}$ .
Isotónica: $C (u) \leq C (v)$ si $u \leq v$ , donde $u \leq v$ significa que $u_{j} \leq v_{j}$ para todo $j = 1, \dots, d$ .
$d$ -creciente: para cualquier caja $[a, b] \subset [0, 1]^{d}$ con volumen no vacío, $C ([a, b]) > 0$ .

En particular una cópula $C$ con $d$ -variable es la función de distribución conjunta de $d$ variables aleatorias uniformes $(0, 1)$ . Si etiquetamos las variables aleatorias $d$ como $U_{1}, U_{2}, \dots, U_{d}$ , entonces podemos escribir la cópula $C$ como

$C (u_{1}, \dots, u_{d}) = \Pr (U_{1} \leq u_{1}, \dots, U_{d} \leq u_{d}) .$

Ahora considere cualquier variable aleatoria continua $X_{1}, X_{2}, \dots, X_{d}$ con funciones de distribución $F_{1}, F_{2}, \dots, F_{d}$ , respectivamente.

Construya una función de distribución multivariada de la siguiente manera:

$\begin{aligned} F (x_{1}, \dots, x_{d}) & = C [F_{1} (x_{1}), \dots, F_{d} (x_{d})] \\ = \Pr (U_{1} \leq F_{1} (x_{1}), \dots, U_{d} \leq F_{d} (x_{d})) . \end{aligned}$

Primero hay que verificar dos cosas

F

es una función de distribución.

Prueba. Note que cada argumento es no decreciente ya que conforme crece cada $x_{i}$ la función $F_{i} (x_{i})$ correspondiente no decrece (por ser una distribución). Como la función $C$ fue construida a partir de la definición de una distribución conjunta, entonces $F$ también lo es.

Note que el Teorema 11.1 (Sklar) nos dice que siempre se puede construir esta función $C$ a partir de las distribuciones marginales y que esta es única.

Teorema 11.1 (Teorema de Sklar) Para un vector aleatorio $X$ con distribución $F$ y marginales univariadas $F_{1}, \dots, F_{d}$ . Existe una cópula $C$ tal que $F (x_{1}, \dots, x_{d}) = C (F_{1} (x_{1}), \dots, F_{d} (x_{d})) .$ Si $X$ es continua, entonces tal cópula $C$ es única.

Las marginales de

F

son también funciones de distribución.

Prueba. Para una variable $X_{1}$ se tiene que: $\begin{aligned} \Pr (X_{1} \leq x_{1}) & = F (x_{1}, \infty, \dots, \infty) \\ = \Pr [U_{1} \leq F_{1} (x_{1}), U_{2} \leq F_{2} (\infty), \dots, U_{d} \leq F_{d} (\infty)] \\ = \Pr [U_{1} \leq F_{1} (x_{1}), U_{2} \leq 1, \dots, U_{d} \leq 1] \\ = \Pr [U_{1} \leq F_{1} (x_{1})] \\ = F_{1} (x_{1}) \end{aligned}$

Las ventajas de usar cópulas es que en un problema podemos reconocer el riesgo individual y que este está ligado con otros. Pero no tenemos idea como. El Teorema 11.1 nos dice que podemos experimentar con los riesgos individuales para constuir ese riesgo conjunto desconocido.

11.2 Medidas de asociación

La forma más sencilla de construir una cópula es basado en su correlación

11.2.1 $ρ$ de Spearman

Para dos variables aleatoarios $(X_{1}, X_{2})$ , esta cópula se define como

$ρ_{S} (X_{1}, X_{2}) = ρ (F_{1} (X_{1}), F_{2} (X_{2})),$

donde $ρ$ es la correlación lineal clásica.

Si recordamos que la distribución es una variable uniforme $(0, 1)$ con media 1/2 y varianza 1/12 entonces:

$\begin{aligned} ρ_{S} (X_{1}, X_{2}) & = \frac{E [F_{1} (X_{1}) F_{2} (X_{2})] - E [F_{1} (X_{1})] E [F_{2} (X_{2})]}{\sqrt{Var (F_{1} (X_{1})) Var (F_{2} (X_{2}))}} \\ = 12 E [F_{1} (X_{1}) F_{2} (X_{2})] - 3 . \end{aligned}$

Más concretamente, la $ρ$ de Spearman se puede escribir como $\begin{aligned} ρ_{S} (X_{1}, X_{2}) & = 12 E [U V] - 3 \\ = 12 \int_{0}^{1} \int_{0}^{1} u v d C (u, v) - 3 \\ = 12 \int_{0}^{1} \int_{0}^{1} C (u, v) d u d v - 3 . \end{aligned}$

Ejercicio 11.1 Muestre que $\int_{0}^{1} \int_{0}^{1} u v d C (u, v) = \int_{0}^{1} \int_{0}^{1} C (u, v) d u d v .$ usando integración por partes.

11.2.2 $τ$ de Kendall

Considere dos variables aleatorias bivariadas continuas independientes e idénticamente distribuidas $(X_{1}, X_{2})$ y $(X_{1}^{*}, X_{2}^{*})$ con distribución marginal $F_{1} (x_{1})$ para $X_{1}$ y $X_{1}^{*}$ y distribución marginal $F_{2} (x_{2})$ para $X_{2}$ y $X_{2}^{*}$ .

La medida de asociación, de la $τ$ de Kendall, $τ_{K} (X_{1}, X_{2})$ , está dada por $τ_{K} (X_{1}, X_{2}) = \Pr [(X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*}) > 0] - \Pr [(X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*}) < 0]$

Es claro que esta medida se puede reescribir como $τ_{K} (X_{1}, X_{2}) = E [sign (X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*})] .$

Además se puede reescribir como función de la cópula misma

$\begin{aligned} τ_{K} (X_{1}, X_{2}) & = 4 \int_{0}^{1} \int_{0}^{1} C (u, v) d C (u, v) - 1 \\ = 4 E [C (U, V)] - 1 . \end{aligned}$

Ejercicio 11.2 Pruebe la igualdad anterior haciendo lo siguiente:

Recuerde que $\Pr [(X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*}) < 0] = 1 - \Pr [(X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*}) > 0]$
Separe en dos probabilidades distintas $\Pr [(X_{1} - X_{1}^{*}) (X_{2} - X_{2}^{*}) > 0]$ .
Reconstruya cada termino en terminos de $C$ .

Si la cópula es absolutamente continua, entonces la ecuación anterior se puede reescribir como $τ_{K} (X_{1}, X_{2}) = 4 \int_{0}^{1} \int_{0}^{1} C (u, v) c (u, v) d u d v - 1$

donde $c (u, v) = \frac{\partial^{2} C (u, v)}{\partial u \partial v}$ es la función de densidad.

11.3 Dependencia en las colas

El interés de construir estos objetos es en caso de que haya pérdidas grandes en una variable, entonces reconocer que también lo existe en las otras.

Considere dos variables aleatorias continuas $X$ y $Y$ con distribuciones marginales $F (x)$ y $G (y)$ . El índice de dependencia de la cola superior $λ_{U}$ se define como:

$λ_{U} = lim_{u \to 1} \Pr [X > F^{- 1} (u) ∣ Y > G^{- 1} (u)] .$

En resumen, si $X$ es muy grande, dado que $Y$ lo es, entonces podemos identificar cierta dependencia.

Podemos reescribir esta igualdad como

$\begin{aligned} λ_{U} & = lim_{u \to 1} \Pr [F (X) > u ∣ G (Y) > u] \\ = lim_{u \to 1} \Pr [U > u ∣ V > u] \end{aligned}$

Haciendo un poco más de álgebra se puede escribir así (¿por qué?):

$\begin{aligned} λ_{U} & = lim_{u \to 1} \frac{1 - \Pr (U \leq u) - \Pr (V \leq u) + \Pr (U \leq u, V \leq u)}{1 - \Pr (V \leq u)} \\ = lim_{u \to 1} \frac{1 - 2 u + C (u, u)}{1 - u} \end{aligned}$

De acá observamos que la dependencia de las colas puede ser explicada completamente partir de la cópula y no de las distribuciones marginales.

11.4 Generación de cópulas

El punto clave en la discusión de modelos de cópulas es la construcción de la función $C (u, v)$ . En esta sección veremos algunas formas de construirla.

11.4.1 Cópulas arquimedianas

La forma de esta cópula es,

$C (u_{1}, \dots, u_{d}) = ϕ^{- 1} [ϕ (u_{1}) + \dots + ϕ (u_{d})],$ donde $ϕ (x)$ es llamado generador.

Propiedades de un generador

Es una función estrictamente decreciente, convexa y continua.
Se tiene que $ϕ : [0, 1] \to [0, \infty]$ .
$ϕ (1) = 0$ .
La inversa del generador $ϕ^{- 1} (t)$ debe ser completamente monótona en $[0, \infty]$ . Es decir debe cumplir que $(- 1)^{n} \frac{d^{n}}{d x^{n}} ϕ^{- 1} (x) \geq 0, n = 1, 2, 3, \dots$

Para el caso de dos variables, se puede describir,

$τ_{K}$ de kendall: Haciendo los respectivos cálculos se tiene que
$τ_{K} (X_{1}, X_{2}) = 1 + 4 \int_{0}^{t} \frac{ϕ (u)}{ϕ^{'} (u)} d u .$
Dependencia de la colas: $\begin{aligned} λ & = lim_{u \to 1} \frac{1 - 2 u + C (u, u)}{1 - u} \\ = lim_{u \to 1} \frac{1 - 2 u + ϕ^{- 1} [2 ϕ (u)]}{1 - u} \\ = 2 - 2 lim_{t \to 0} \frac{\frac{d}{d t} ϕ^{- 1} (2 t)}{\frac{d}{d x} ϕ^{- 1} (t)} \end{aligned}$ con la condición que $lim_{t \to 0} \frac{d}{d t} d t ϕ^{- 1} (t) = - \infty$ .

Ejercicio 11.3 Prueben esta propiedad usando el teorema de l’Hopital.

11.4.2 Cópulas independientes

Una caso particular de las arquimedianas es cuando $ϕ (u) = - \ln (u)$ . Acá se obtiene que

$C (u_{1}, \dots, u_{d}) = \prod_{j = 1}^{d} u_{j}$

Ejercicio 11.4 Para este caso en el caso de dos variables se tiene que

$τ_{K} = 0$ .
$λ_{U} = 0$ .

¿Por qué se da este fenómeno?

11.4.3 Cópula de Gumbel

Usando $ϕ (u) = (- \ln u)^{θ}, θ \geq 1$ se obtiene

$C (u_{1}, \dots, u_{d}) = \exp {- {[{(- \ln u_{1})}^{θ} + \dots + {(- \ln u_{d})}^{θ}]}^{1 / θ}}$

En este caso se debe ajustar el parametro $θ$ .

Ejercicio 11.5 Para este caso en el caso de dos variables se tiene que

$τ_{K} = 1 - \frac{1}{θ}$ .
$λ_{U} = 2 - 2^{\frac{1}{θ}}$ .

11.4.4 Otras cópulas

Nombre	Generador	$C (u_{1}, \dots, u_{d})$	$λ_{U}$
Joe	$- \ln [1 - (1 - u)^{θ}], θ \geq 1$	$1 - {[\sum_{j = 1}^{d} {(1 - u_{j})}^{θ} - \prod_{j = 1}^{d} {(1 - u_{j})}^{θ}]}^{1 / θ}$	$2 - 2^{\frac{1}{θ}}$
BB1	${(u^{- 5} - 1)}^{θ}, δ > 0, θ \geq 1$	${1 + {[\sum_{j = 1}^{d} {(u_{j}^{- δ} - 1)}^{θ}]}^{1 / θ}}^{- 1 / δ}$	$2 - 2^{1 / (δ θ)}$

11.5 Cópulas elípticas

Estas son generadas principalmente por distribuciones elípticas.

11.5.1 Cópula gaussiana

$C (u_{1}, \dots, u_{d}) = Φ_{P} (Φ^{- 1} (u_{1}), \dots, Φ^{- 1} (u_{d}))$

donde $Φ (x)$ es la cdf normal univariada estándar y $Φ_{P} (x_{1}, \dots, x_{d})$ es la cdf multivariada de la distribución normal multivariada estándar (con media cero y varianza de 1 para cada componente) y matriz de correlación $P$ . Debido a que la matriz de correlación contiene $d (d - 1) / 2$ correlaciones por pares, este es el número de parámetros en la cópula.

No existe una forma cerrada simple para la cópula. En el caso bidimensional (con un solo elemento de correlación $ρ$ ), la cópula gaussiana se puede escribir como $C (u_{1}, u_{2}) = \int_{- \infty}^{Φ^{- 1} (u_{1})} \int_{- \infty}^{Φ^{- 1} (u_{2})} \frac{1}{2 π \sqrt{1 - ρ^{2}}} \exp {- \frac{x^{2} - 2 ρ x y + y^{2}}{2 (1 - ρ^{2})}} d y d x$

Aunque su forma teórica es algo difícil de construir, es muy fácil de simular.

Para dos variable se tiene que $τ_{K} (X_{1}, X_{2}) = \frac{2}{π} \arcsin (ρ)$ si $ρ = 0$ entonces se obtiene la cópula independiente.

Además, $λ_{U} = 0$ por lo que esta cópula no es adecuada para modelado de riesgo por este motivo.

11.5.2 Cópula $t$ -student

La cópula $t$ viene dada por $C (u_{1}, \dots, u_{d}) = t_{ν, P} (t_{ν}^{- 1} (u_{1}), \dots, t_{ν}^{- 1} (u_{d})),$ donde $t_{ν} (x)$ es el cdf de la distribución estándar $t$ con $ν$ grados de libertad y $t_{ν, P} (x_{1}, \dots, x_{d})$ es la cdf conjunta de la distribución estándar multivariada $t$ con $ν$ grados de libertad para cada componente y donde $P$ es una matriz de correlación. En el caso bidimensional (con un solo elemento de correlación $ρ$ ), la cópula $t$ se puede escribir como $C (u_{1}, u_{2}) = \int_{- \infty}^{t_{ν}^{- 1} (u_{1})} \int_{- \infty}^{t_{ν}^{- 1} (u_{2})} \frac{1}{2 π \sqrt{1 - ρ^{2}}} {1 + \frac{x^{2} - 2 ρ x y + y^{2}}{ν (1 - ρ^{2})}}^{- 1 - \frac{ν}{2}} d y d x .$

Se puede estimar que $τ_{K} (X_{1}, X_{2}) = \frac{2}{π} \arcsin ρ$ pero si $ρ = 0$ no implica la cópula independiente.

Para este caso, $λ_{U} = 2 t_{ν + 1} (- \sqrt{\frac{1 - ρ}{1 + ρ} (ν + 1)}) .$

11.6 Laboratorio

Para este ejercicio vamos a usar el siguiente paquete

library(copula)
set.seed(123)

Abra la ayuda en la función ellipCopula y describa que tipo de entradas se necesita y que objeto voy a obtener.
Construya una cópula gauassiana, de dimensión 3 y $ρ = 0.4$ . Use getSigma para ver la matriz de correlación.
Haga lo mismo con cópula $t$ con 8 df, pero use dispstr='toep' y param = c(0.8, 0.5). Qué ocurrió?
Finalmente use la función archmCopula y construya una cópula gumbel con parámetro 3.

Ejercicio 11.6 En este ejemplo se generarán datos que tengan marginales Gamma con una cópula elíptica.

CopulaModelo <-
  mvdc(
    copula = ellipCopula(family = "normal", param = 0.5),
    margins = c("gamma", "gamma"),
    paramMargins = list(list(shape = 2, scale = 1), list(shape = 3, scale = 2))
  )

contour(CopulaModelo, dMvdc, xlim = c(-1, 6), ylim = c(-1, 14))

n <- 1000
dat <- rMvdc(mvdc = CopulaModelo, n = n)

Cuál es la fórmula exacta para calcular los parámetros shape y scale usando los datos.

Construya la $τ_{K}$ para estos datos

Use la función fitMvdc para ajustar la cópula sin valores iniciales. ¿Qué parámetros necesita?
Usando los valores iniciales calculados anteriormente vuelva a hacer el ajuste.
Vuelva a dibujar la copula, pero usando los valores ajustados del punto anterior.

11.7 Cópulas de valor extremo

Una cópula de este tipo tiene la propiedad de tener estabilidad en el máximo. Para entender esta propiedad veamos esta proposición:

Proposición 11.1 Una cópula de valor extremo satisface la igualdad,

$C (u_{1}^{n}, \dots, u_{d}^{n}) = C^{n} (u_{1}, \dots, u_{d}),$

para todo $(u_{1}, \dots, u_{d})$ y para todo $n \geq 0$ .

Prueba. Para demostrar esta propiedad, considere el caso bivariado. Supongamos que $(X_{1}, Y_{1}), (X_{2}, Y_{2}), \dots, (X_{n}, Y_{n})$ son $n$ pares aleatorios independientes e idénticamente distribuidos extraídas de la distribución conjunta $F (x, y)$ , con distribuciones marginales $F_{X} (x)$ y $F_{Y} (y)$ y cópula $C (x, y)$ .

Sea $M_{X} = max (X_{1}, \dots, X_{n})$ y $M_{Y} = max (Y_{1}, \dots, Y_{n})$ los máximos por en cada margen.

Entonces la función de distribución del par aleatorio $(M_{X}, M_{Y})$ es $\begin{aligned} \Pr (M_{X} \leq x, M_{Y} \leq y) & = \Pr (X_{i} \leq x, Y_{i} \leq y, para todo i) \\ = F^{n} (x, y) \end{aligned}$

De manera similar, las distribuciones marginales de $M_{X}$ y $M_{Y}$ son $F_{X}^{n} (x)$ y $F_{Y}^{n} (y)$ . Entonces, dado que $F (x, y) = C [F_{X} (x), F_{Y} (y)],$ podemos escribir la distribución conjunta de los máximos como $\begin{aligned} F^{n} (x, y) & = C^{n} [F_{X} (x), F_{Y} (y)] \\ = C^{n} {{[F_{X}^{n} (x)]}^{1 / n}, {[F_{Y}^{n} (y)]}^{1 / n}} . \end{aligned}$ Por tanto, la cópula de los máximos viene dada por $C_{max} (u_{1}, u_{2}) = C^{n} (u_{1}^{1 / n}, u_{2}^{1 / n})$ o equivalente, $C_{max} (u_{1}^{n}, u_{2}^{n}) = C^{n} (u_{1}, u_{2}) .$

El resultado anterior dice que si $C_{max}$ es del mismo tipo que la cópula original $C$ , entonces la cópula tiene la estabilidad del máximo.

En otras palabras, esta propiedad dice la copula asociados con $(M_{X}, M_{Y})$ es la misma que $C (x, y)$

Se puede probar que la forma general de estas cópulas es

$C (u_{1}, u_{2}) = \exp {\ln (u_{1} u_{2}) A (\frac{\ln u_{1}}{\ln (u_{1} u_{2})})},$

donde $A (w)$ es una función de dependencia,

$A (w) = \int_{0}^{1} max [x (1 - w), w (1 - x)] d H (x)$

para cualquier $w \in [0, 1]$ y $H$ es una función de distribución sobre $[0, 1]$ . Resulta que $A (w)$ debe ser una función convexa que satisfaga $max (w, 1 - w) \leq A (w) \leq 1, 0 < w < 1$ y que cualquier función convexa diferenciable $A (w)$ que satisfaga esta desigualdad puede usarse para construir una cópula. Tenga en cuenta que la cópula de independencia resulta de establecer $A (w)$ en su límite superior $A (w) = 1$ . En el otro extremo, si $A (w) = max (w, 1 - w)$ , entonces hay correlación perfecta y, por tanto, dependencia perfecta con $C (u, u) = u$ .

La dependencia de la cola superior se puede escribir como

$\begin{aligned} λ_{U} & = lim_{u \to 1} \frac{1 - 2 u + C (u, u)}{1 - u} \\ = lim_{u \to 1} \frac{1 - 2 u + u^{2 A (1 / 2)}}{1 - u} \\ = lim_{u \to 1} 2 - 2 A (1 / 2) u^{2 A (1 / 2) - 1} \\ = 2 - 2 A (1 / 2) . \end{aligned}$

Algunos ejemplos de este tipo de cópulas son

Nombre	$A (w)$	$λ_{U}$
Gumbel	${[w^{θ} + (1 - w)^{θ}]}^{1 / θ}, θ \geq 0$	si $w = \frac{1}{2}$ entonces $2 - 2^{\frac{1}{θ}}$
Galambos	$1 - {[w^{- θ} + (1 - w)^{- θ}]}^{- 1 / θ}, θ > 0$	$2^{- 1 / θ}$

11.7.1 Cópulas Archimax

Combinando cópulas arquimedianas y de valor extremos se puede escribir las siguiente representación,

$C (u_{1}, u_{2}) = ϕ^{- 1} [{ϕ (u_{1}) + ϕ (u_{2})} A (\frac{ϕ (u_{1})}{ϕ (u_{1}) + ϕ (u_{2})})],$ donde $ϕ (u)$ es un generador arquimediano válido y $A (w)$ es una función de dependencia válida.

Nombre	$ϕ (u)$	$A (w)$	$C (u_{1}, u_{2})$
BB4	$u^{- θ} - 1, θ \geq 0$	$1 - {w^{- δ} + (1 - w)^{- δ}}^{- 1 / δ}, θ > 0, δ > 0$	${u_{1}^{- θ} + u_{2}^{- θ} - 1 - {[{(u_{1}^{- θ} - 1)}^{- δ} + {(u_{2}^{- θ} - 1)}^{- δ}]}^{- 1 / δ}}^{- 1 / θ}$

11.8 Estimación por máxima verosimilitud

Recuerde que la cópula es de la forma $F (x_{1}, \dots, x_{d}) = C [F_{1} (x_{1}), \dots, F_{d} (x_{d})]$

y su densidad es $f (x_{1}, \dots, x_{d}) = f_{1} (x_{1}) f_{2} (x_{2}) \dots f_{d} (x_{d}) c [F_{1} (x_{1}), \dots, F_{d} (x_{d})]$

Nota

La estimación de los parámetros de la cópula depende de la estimación de las marginales.

Entonces se puede escribir para $n$ datos

$\begin{aligned} l & = \sum_{j = 1}^{n} \ln f (x_{1, j}, \dots, x_{d, j}) \\ = \sum_{j = 1}^{n} \sum_{i = 1}^{d} \ln f_{i} (x_{i, j}) + \sum_{j = 1}^{n} \ln c [F_{1} (x_{1, j}), \dots, F_{d} (x_{d, j})] \\ = l_{w} + l_{c} . \end{aligned}$

Forma de estimación

Optimice las $d$ funciones $\ln (f_{i} (x_{i j})$ individualmente.
Use esos valores para construir los pseudo-verosimiludes ${\tilde{u}}_{i, j} = {\tilde{F}}_{i} (x_{i, j})$ .
Optimice la pseudo-verosimilitud de la cópula ${\tilde{l}}_{c} = \sum_{j = 1}^{n} \ln c ({\tilde{u}}_{1, j}, \dots, {\tilde{u}}_{d j})$ .

11.9 Medidas de mejor ajuste

Sabemos que $U_{1} = F_{1} (X_{1})$ y $U_{2} = F_{2} (X_{2})$ son ambas variables aleatorias uniformes $(0, 1)$ .

Ahora introduzca las variables aleatorias condicionales $V_{1} = F_{12} (X_{1} ∣ X_{2})$ y $V_{2} = F_{21} (X_{2} ∣ X_{1})$ . Entonces, las variables aleatorias $V_{1}$ y $U_{2}$ son $(0, 1)$ variables aleatorias uniformes mutuamente independientes.

Note que la variable aleatoria $V_{1} = F_{12} (X_{1} ∣$ $X_{2} = x$ ). Debido a que es una distribución aplicada a una variable aleatoria, debe tener una distribución uniforme $(0, 1)$ . Este resultado es cierto para cualquier valor de $x$ . Así, la distribución de $V_{1}$ no depende del valor de $X_{2}$ y por tanto no depende de $U_{2} = F_{2} (X_{2})$ .

El valor observado de la función de distribución de la variable aleatoria condicional $X_{2}$ dada $X_{1} = x_{1}$ es $F_{21} (x_{2} ∣ X_{1} = x_{1}) = C_{1} [F_{X_{1}} (x_{1}), F_{X_{2}} (x_{2})] .$ El valor observado $v_{2}$ de la variable aleatoria $V_{2}$ se puede obtener a partir de los valores observados de las variables aleatorias bivariadas $(X_{1}, X_{2})$ de $v_{2} = {\hat{F}}_{21} (x_{2} ∣ X_{1} = x_{1}) = {\hat{C}}_{1} [{\hat{F}}_{X_{1}} (x_{1}), {\hat{F}}_{X_{2}} (x_{2})] .$ Por lo tanto, podemos generar un conjunto univariado de datos que debería verse como una muestra de una distribución $(0, 1)$ uniforme si la combinación de distribuciones marginales y la cópula se ajusta bien a los datos.

El método sugerido para probar el ajuste es el siguiente

Nota

Paso 1. Ajuste y seleccione las distribuciones marginales utilizando métodos univariados.
Paso 2. Pruebe la uniformidad de la distribución condicional de $V_{1}$ .
Paso 3. Pruebe la uniformidad de la distribución condicional de $V_{2}$ .

Las pruebas a usar son las usuales que hemos visto en el curso.

Para más dimensiones, se pueden probar las variables dos a dos y comprobar el ajuste.

11.9.1 Laboratorio

library(copula)
library(tidyverse)

data(loss)
# loss data loss: pérdida de la compañía hasta cierto límite.
# alae: gastos relacionados con el reclamo (gastos legales, gastos por
# investigaciones, etc. )

ggplot(loss, aes(loss, alae)) +
  geom_point()

ggplot(loss, aes(log(loss), log(alae))) +
  geom_point()

Ajuste las variables loss y alae individualmente. Traten Pareto, lognormal, gamma, etc. ¿Cuál es mejor? (Noten que algunos valores están censurados) (usen coef(fit) para obtener los parámetros correctos.)
Construya las variables $U_{1}$ y $U_{2}$ para cada marginal. Compruebe que la hipotesis de uniformidad se cumple.
Use cópulas Frank, Gumbel, Normal y t para modelar la distribución conjunta de $U_{1}$ y $U_{2}$ . (revise la función archCopula).
Use la funciones contour y persp para visualizar la copula.
Revisen la tau de Kendall y la dependencia de la cola para caso.
Calcule la distribuciones condicionales usando cCopula y verifique el supuesto de uniformidad.
Finalmente, calcule el VaR al 95% y 99% de cada margen asumiendo independencia. Usando la función rMvdc genere datos aleatorios de cada margen usando la cópula y calcule los mismos niveles de VaR. Compare los resultados.

11.10 El rol de los deducibles

Cada variable puede tener su propio deducibles y las variables en los margenes podrían ser datos individuales o agrupados. Esto genera diferencias para la construcción del estimador de máxima verosimilitud.

En este caso explicaremos las diferencias en el caso bivariado. Recordemos que

$\begin{aligned} F (x, y) & = C [F_{1} (x_{1}), F_{2} (x_{2})] \\ f (x, y) & = f_{1} (x_{1}) f_{2} (x_{2}) c [F_{1} (x_{1}), F_{2} (x_{2})] \end{aligned}$

donde $\begin{aligned} C_{1} (u_{1}, u_{2}) & = \frac{\partial}{\partial u_{1}} C (u_{1}, u_{2}) \\ C_{2} (u_{1}, u_{2}) & = \frac{\partial}{\partial u_{2}} C (u_{1}, u_{2}), \\ c (u_{1}, u_{2}) & = C_{12} (u_{1}, u_{2}) = \frac{\partial}{\partial u_{1}} \frac{\partial}{\partial u_{2}} C (u_{1}, u_{2}) . \end{aligned}$

En el caso de datos agrupados solo hay que considerar el caso cuando el dato cae sobre intervalo. Llamemos $[a_{1}, b_{1}]$ y $[a_{2}, b_{2}]$ los intervalos respectivos para $X_{1}$ y $X_{2}$ .

Consideramos cuatro casos:

Caso #1: Datos individuales para $X_{1}$ y $X_{2}$ .

En este caso, se tiene un factor muy similar al visto para el caso univariado. Si $X_{1}$ o $X_{2}$ caen por debajo de su deducibles no son tomadas en cuenta.

$\begin{aligned} \frac{f (x_{1}, x_{2})}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + F (d_{1}, d_{2})} \\ = \frac{f_{1} (x_{1}) f_{2} (x_{2}) c [F_{1} (x_{1}), F_{2} (x_{2})]}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + C [F_{1} (d_{1}), F_{2} (d_{2})]} . \end{aligned}$

Caso #2: Dato individual para $X_{1}$ y dato agrupado para $X_{2}$ .

Tenemos lo siguiente

$\begin{aligned} \frac{\frac{\partial}{\partial x_{1}} F (x_{1}, b_{2}) - \frac{\partial}{\partial x_{1}} F (x_{1}, a_{2})}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + F (d_{1}, d_{2})} \\ = \frac{f_{1} (x_{1}) {C_{1} [F_{1} (x_{1}), F_{2} (b_{2})] - C_{1} [F_{1} (x_{1}), F_{2} (a_{2})]}}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + C [F_{1} (d_{1}), F_{2} (d_{2})]} . \end{aligned}$

Caso #3: Dato individual para $X_{2}$ y dato agrupado para $X_{1}$ .

$\begin{aligned} \frac{\frac{\partial}{\partial x_{2}} F (b_{1}, x_{2}) - \frac{\partial}{\partial x_{2}} F (a_{1}, x_{2})}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + F (d_{1}, d_{2})} \\ = \frac{f_{2} (x_{2}) {C_{2} [F_{1} (b_{1}), F_{2} (x_{2})] - C_{1} [F_{1} (a_{1}), F_{2} (x_{2})]}}{1 - F_{1} (d_{1}) - F_{1} (d_{2}) + C [F_{1} (d_{1}), F_{2} (d_{2})]} . \end{aligned}$
Caso #4: Ambos datos agrupados.

$\begin{matrix} \frac{F (b_{1}, b_{2}) - F (a_{1}, b_{2}) - F (b_{1}, a_{2}) + F (a_{1}, a_{2})}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + F (d_{1}, d_{2})} \\ {C [F_{1} (b_{1}), F_{2} (b_{2})] - C [F_{1} (a_{1}), F_{2} (b_{2})] \\ = \frac{- C [F_{1} (b_{1}), F_{2} (a_{2})] + C [F_{1} (a_{1}), F_{2} (a_{2})]}}{1 - F_{1} (d_{1}) - F_{2} (d_{2}) + C [F_{1} (d_{1}), F_{2} (d_{2}))]} . \end{matrix}$

11.11 Simulación de copulas

Para efectos de análisis de la cópula y las marginales, es necesario definir un proceso para generación de valores aleatorios.

11.11.1 Cópulas Gaussianas

Un vector gaussiano $d$ -dimensional tiene la caracteristica de que

$X = μ + L Z$

donde $Σ = L L^{⊤}$ . Entonces para generar números aleatorios a partir de la cópula se puede hacer lo siguiente:

Calcule el factor de Cholesky $L$ de la matriz de correlación $P$ .
Genera una muestra $Z_{1}, \dots, Z_{d} \overset{ind.}{\sim} N (0, 1)$ .
Calcule $X = L Z$ .
Devuelve $U = (Φ (X_{1}), \dots, Φ (X_{d}))$ .

11.11.2 Cópulas $t$

Este caso es similar al gaussiano, salvo una modificación:

Calcule el factor de Cholesky $L$ de la matriz de correlación $P$ .
Genera una muestra $Z_{1}, \dots, Z_{d} \overset{ind.}{\sim} N (0, 1)$ .
Genere una muestra $W \sim I G (\frac{ν}{2}, \frac{ν}{2})$ independiente de $Z$ .
Calcule $X = \sqrt{W} L Z$ .
Devuelve $U = (t_{ν} (X_{1}), \dots, t_{ν} (X_{d}))$ .

11.11.3 Cópulas arquimedianas

Para el caso de las arquimedianas, primero hay que definir lo siguiente.

Sea $V$ una variable aleatoria no negativa con distribución $F$ . La transformada de Laplace-Stielties de $F$ está definida por $LS [F] (t) = \int_{0}^{\infty} \exp (- t v) d F (v) = E (\exp (- t V)), t \in [0, \infty) .$

La función $F$ se puede recuperar a partir de la inversa ${LS}^{- 1} [ψ]$ . El uso de esta función es debido al teorema de Bernstein. Este dice que $ψ$ es completamente monótona si y solo si $ψ$ es la transformada de Laplace-Stielties de una distribución $F$ en los reales positivos con $F (0) = 0$ .

La variable aleatoria $V \sim F$ se cononce como frailty y $F$ es la distribución frailty.

Se puede probar que

$U = (ψ (\frac{E_{1}}{V}), \dots, ψ (\frac{E_{d}}{V})) \sim C$

donde $E_{1}, \dots, E_{d} \overset{ind}{\sim} Exp (1)$ son independientes de $V$ .

El algoritmo general es

Muestree $V \sim F = L S^{- 1} [ψ]$ .
Muestree $E_{1}, \dots, E_{d} \overset{ind}{\sim} Exp (1)$ , independiente de $V$ .
Devuelva $U = (ψ (E_{1} / V), \dots, ψ (E_{d} / V))$ .

11.11.4 Laboratorio

Use el algoritmo de construcción de cópulas gaussianas con matrices covarianza $(\begin{matrix} 16 & 4 \\ 4 & 2 \end{matrix}) (\begin{matrix} 1 & 0.5 \\ 0.5 & 1 \end{matrix})$ Use 1000 valores. Compare ambos resultados.
Construya una copula normal asumiendo que la $τ_{K} = 0.5$ . Revise la función iTau para encontrar el parámetro correcto.
Genere con rCopula y haga el plot de estos resultados. Comparelos con el punto estos resultados. Comparelos con el punto 1.
Suponga que se quiere simular una cópula $t$ con 4 grados de libertad. Repita lo puntos 1 a 3 para este caso. W puede simularse como $W = ν / T$ con $T \sim χ_{ν}^{2}$
Para 5 variables, ajuste una cópula Gumbel con $τ_{K} = 0.5$ . Use iTau de nuevo.
Para generar manualmente los valores aleatorios de la cópula se necesita lo siguiente

family = "Gumbel"
cop <- getAcop(family) 
V <- cop@V0(n, theta = parametro_de_iTau)

Revise la ayuda de acopula. 7. Compare este resultado con rCopula.