Describiendo Bitcoin - I
Bitcoin (BTC en adelante por sus siglas) es una moneda digital creada en el 2008 por una entidad bajo el pseudonimo de Satoshi Nakamoto, que sirve de intercambio como otra moneda física. La característica más resaltante es que es una moneda descentralizada, es decir no existe una autoridad o ente de control que sea responsable de su emisión y registro de sus movimientos y además esta blindada contra la inflación, ya que existe un número límite de monedas. La tecnología que usa para la transferencia o movimientos de la moneda digital es la cadena de bloques o Blockchain, la cual en términos simples lleva un registro de cada movimiento o etiqueta, y se copia en cada cadena de bloques de manera que todos los usuarios de la cadena deben tener la misma información para validar la transacción, lo que hace muy difícil la falsificación. Si quieres saber más te dejo información aquí
Leer información desde (CSV)
library(tidyverse)
btc <- read.csv("dailyDataBTC-USD.csv", stringsAsFactors = F, header = T)
btc <- btc %>% mutate(fecha = as.Date(as.POSIXct(unix, origin = "1970-01-01"))) %>% arrange(fecha)
min(btc$fecha)
#> [1] "2020-12-28"
max(btc$fecha)
#> [1] "2021-10-23"
max(btc$fecha)-min(btc$fecha)
#> Time difference of 299 days
Para fines prácticos usaremos este archivo para el análisis. Pero te dejaré un link para que puedas extraer informacion desde la una API.
Como un primer análisis, mostraremos la serie temporal del bitcoin con su precio ajustado al cierre diario.
library(ggplot2)
btc_graph <- btc %>%
ggplot( aes(x=fecha, y=close)) +
geom_line(color="#69b3a7") +
ylab("Bitcoin ($)")
btc_graph
A partir del gráfico, solo podemos observar que el precio en este lapso de tiempo, formó un soporte alrededor de los 30 mil y un máximo de 65 mil. Ahora mencionaremos 2 conceptos básicos para empezar a analizar el bitcoin y cualquier otro instrumento bursátil.
Rendimiento o Retorno Simple y continuo
Al iniciar a estudiar los modelos de finanzas cuantitativas básicos, como obtener el riesgo histórico de un activo, o al intentar aplicar el modelo de Markowitz para un portafolio de inversión, necesitamos la variable retorno del activo. Para esto existen modelos que usan el rendimiento simple o aritmético y otros el compuesto o logarítmico. Pero ¿Cuándo usar uno u otro? ¿Son iguales o diferentes? Intentaré poner sobre la mesa las ventajas y los usos de cada uno.
Aritmético o Simple
Se calcula como la variación porcentual de 2 precios en distintos momentos: $$Rs = \frac{P_t - P_{t-1}}{P_{t-1}}$$ Esta forma del cálculo de los retornos hace que se encuentren normalizados, es decir son comparables con otra serie de retornos de otro activo a pesar de que las magnitudes de sus precios sean considerablemente diferentes. Esto también debe usarse para el cálculo de la matriz de covarianzas en nuestros análisis, a fin de poder diversificar una cartera con el modelo de Markowitz. La rentabilidad acumulada de un periodo de tiempo es la media geométrica de las rentabilidades que lo componen. $$R_{acumulada} = \sqrt[N]{\prod_{i=1}^{N}Rs_i}$$ Mas adelante este será un punto en contra para el retorno simple.
Logarítmico o Continuo
Se calcula como la diferencia de los precios en logaritmos naturales: $$Rc = \ln{(\frac{P_t}{P_{t-1}})}$$ De la fórmula de arriba es fácil deducir la siguiente relación: $$Rc = \ln{(1+Rs)}$$ La rentabilidad acumulada de un periodo de tiempo es la sumatoria de las rentabilidades que lo componen, gracias a las propiedades de los logaritmos. $$R_{acumulada} = \sum_{i=1}^{N}Rc_i = \sum_{i=1}^{N}ln{(1+Rs_i)}$$
En muchos modelos se asumen que la distribución de los retornos de un activo sigue una distribución normal, según esto los retornos podrían ir hasta valores de -$\infty$ y sabemos que la pérdida máxima es del 100% de la inversión. Otro problema de asumir esta distribución es que constantemente estará a prueba la curtosis, que da la forma a las colas de la distribución que en muchos casos serán más pesadas que una normal.
De este supuesto entonces se desprende que tanto el retorno simple y el continuo se distribuyen como una normal. En particular, al ser el retorno continuo el logaritmo de 1 + Rs, se dice que 1 + Rs se distribuye como una lognormal. Por los teoremas de convolución, para el caso del retorno simple, el retorno acumulado es la productoria de variables aleatorias normales, cuyo resultado no se distribuye como una normal, mientras que, en el caso continuo, el retorno acumulado es hallado como la suma de variables normales cuyo resultado es una normal, mostrándose así una gran ventaja sobre el simple.
Histograma de retornos BTC
Ahora vamos a empezar con un pequeño análisis de cómo se comportan los rendimientos logarítmicos diarios del BTC en el periodo de tiempo en estudio. Una manera simple de observarlo sería construir un histograma y obtener medidas que nos pueden ser muy informativas:
Cripto | Retorno Esperado(%) | Volatilidad(%) |
---|---|---|
BTC | 0.27 | 4.43 |
Métrica | Valor Retorno(%) |
---|---|
VaR 99% | -11.88 |
VaR 95% | -6.46 |
TVaR 99% | -14.38 |
TVaR 95% | -9.80 |
Como sabemos, el histograma es la distribución empírica de la variable aleatoria en estudio, en este caso son los retornos diarios del Bitcoin. En esta vista podemos observar preferencias o acumulaciones en ciertos rangos representados por una barra de mayor altura, lo cual significa que con frecuencia los retornos se agrupan en esa área y también poder observar los mínimos, máximos y medidas de tendencia central, en particular la linea roja vertical representa el VaR al 95%. Pasaremos a explicar brevemente cada métrica descriptiva y para ello vamos a suponer que queremos tomar una posición en el mercado Spot con un capital de 100 USD, es decir comprar, mantener y luego vender.
Probabilidad de ganar $$P(Rc > 0) = \frac{Cuenta\ Días\ Positivos}{Total\ Días}$$ En el periodo analizado, en un día cualquiera existe un 52.84% de que sea un día con un retorno positivo.
Retorno Promedio $$\overline{Rc} = \frac{\sum_{i=1}^{N}{Rc_i}}{N}$$ Nos indica cual fue la rentabilidad diaria promedio en el periodo (0.27%).
Retorno Positivo $$\overline{Rc+} = \frac{\sum_{i=1}^{N+}{Rc_i+}}{Cuenta\ Días\ Positivos}$$ Nos informa, que si el día en el que hemos abierto una posición de compra (posición Long), y éste resulta en un movimiento al alza, el retorno promedio esperado sería de 3.38%.
Retorno Negativo $$\overline{Rc-} = \frac{\sum_{i=1}^{N-}{Rc_i-}}{Cuenta\ Días\ Negativos}$$ Al contrario del apartado anterior, si el día resulta en un movimiento a la baja, esperamos tener un retorno promedio de -3.21%.
Volatilidad o Riesgo $$\widehat {\sigma_R} = \sqrt\frac{\sum_{i=1}^{N}{(Rc_i-\overline{Rc})^{2}}}{N-1}$$ Esta medida de dispersión nos indica en cuanto se puede desviar la rentabilidad promedio esperada tanto positiva como negativamente, esto se le conoce como la volatilidad, que en este caso es de 4.43%. Piense en esta medida también como el riesgo o incertidumbre debido a los movimientos del mercado.
Valor en Riesgo o VaR No Paramétrico $$VaR_{q} = quantil(1-q) = F_R^{-1}(1-q) \ ;para\ q\in<0,1>$$ Otra medida de riesgo adicional a la de la volatilidad es la del VaR. Si el inversor está interesado en saber cuál es la máxima pérdida en un periodo con un nivel de confianza asociado, esta es la del VaR. Por ejemplo, en el caso en estudio el VaR(95%) es -6.46%, el cual indica que con un nivel de confianza del 95%, esperamos tener una perdida máxima en un día de 6.46% sobre la inversión. Otra manera intuitiva en este caso, pero que no se recomienda usar en el VaR no Paramétrico sin simulaciones de Montecarlo es tener como referencia un periodo de retorno, es decir con qué frecuencia se da el suceso de esta pérdida, en este caso es cada 20 días aproximadamente. Para llegar a este resultado es tomar la siguiente fórmula: $$Periodo\ Retorno = \frac{1}{1-q} \ q\in<0,1>$$
TVaR o CVaR $$TVaR_{q} = E[R/R<=VaR_{q}]$$ Comúnmente conocido como Tail Value at Risk y también como Conditional Value at risk(CVaR) o expected shortall es la pérdida esperada por una cartera en un periodo determinado mayor al umbral del VaR a un nivel de confianza. Esta medida de riesgo es muy usada en seguros y en el sistema financiero y en mucha de la bibliografía se considera que este cumple con las propiedades de una medida coherente (Denuit Michael, Dhaene Jan, Goovaerts Marc, Kaas Rob, ACTUARIAL THEORY FOR DEPENDET RISKS, MEASURES, ORDERS AND MODELS, 2005). En este ejemplo, esta medida responde a la pregunta si en el peor de los casos se rompa el umbral de perdida máxima esperada (VaR), cuanto en promedio se esperaría de pérdida en ese escenario, que para BTC sería de -9.8% Tvar95%.
Como mencionamos anteriormente, suponiendo que entramos en una posición de compra en el mercado spot y asumiendo que el periodo analizado es suficiente y representativo para esperar que ésta se replique en el futuro, se esperaría tener más días al alza ya que este tiene una probabilidad del 52.84%, también esperarías tener un retorno promedio en el día de 0.27% de tu inversión, con una volatilidad de 4.43%, con una probabilidad máxima de perdida al 95% de 6.46% cada 20 días y con una perdida promedio esperada mayor al 6.46% de 9.80%. Esta información puede ser un punto de partida a considerar para poder compararlo con las mismas métricas en otras criptomonedas y ver en cuales prefieras invertir. Si deseas tener una estrategia con mas de 1 criptomoneda a la vez, es importante que se cumpla la propiedad de subaditividad, que refleja la idea que el riesgo puede ser reducido por la diversificación. No está demás decir que este ejemplo es sólo informativo y educativo y no es ningún consejo de inversión. Espero haya podido despertar la curiosidad y que tengas un ejemplo de cómo las probabilidades y la estadística están incluida en estos temas.