Um dos conceitos mais básicos no Mercado Financeiro, bem como na Estatística, é o de dispersão. A forma usual de se medir a dispersão é considerar que os dados se distribuem normalmente e calcular o desvio-padrão.
O desvio-padrão tem certas propriedades que deveriam ser observadas e, caso elas não ocorram, certos cuidados precisam ser tomados. Quem usa cegamente esta e outras ferramentas, sem compreender suas propriedades, não consegue solucionar muitos problemas simples, e muito menos lidar com situações inesperadas. Um problema simples é quando a pessoa tem uma estratégia otimizada para funcionar com timeframe de 1 dia, mas se numa situação em que precisa usar a mesma estratégia com timeframe de 15 minutos. Se a pessoa tiver alguma noção sobre os significados de média e desvio-padrão, poderá considerar que 1 dia tem 24 horas, portanto 96 ciclos de 15 minutos. Assim, uma média móvel de 20 períodos de 1 dia deveria ficar muito semelhante a uma média móvel de 1920 períodos de 15 minutos, bem como os demais indicadores. Outra propriedade a ser considerada é que o desvio-padrão cresce aproximadamente com a raiz quadrada do tamanho do período considerado. Assim, se temos uma volatilidade de R$ 11,00 num período de 1000 horas, espera-se que ela seja em torno de R$ 1,10 em 10 horas, pois um período 100 vezes menor deveria ser 10 vezes menos volátil. Na verdade, quando se fala em volatilidade no Mercado, se está falando de desvio-padrão dos logaritmos, conforme já comentamos em outros artigos. Pois bem, estes são dois casos típicos, em que um conhecimento básico ajuda a dar soluções rápidas e apropriadas. No EURUSD, por exemplo, 3000 períodos de 15 minutos têm volatilidade de 0,0291. Estes 3000 períodos correspondem a aproximadamente 1 mês (31,25 dias), então verificamos que em 31 dias a volatilidade é realmente de 0,0287, diferença de apenas 1,4%. Outro exemplo: no ouro temos volatilidade de 1050 períodos de 4 horas, o que equivale a 25 períodos de 1 semana (25 x 7 x 24 / 4 = 1050). Ao conferir, vemos que a volatilidade em 1050 períodos de 4 horas é $ 52,81, enquanto nas 25 semanas é $ 49,42. Enfim, é coerente e se aplica na grande maioria dos casos. Mas porque não em todos os casos, já que um período de 1 dia sempre tem 24 horas, 1 semana sempre tem 7 dias etc.? Note que não estamos falando de um dia arbitrário, mas sim do MESMO DIA, ou seja, entre agora e 30 dias atrás e entre agora e 720 horas atrás (24 x 30 = 720). Deveria ser válido sempre, mas na prática não é por três motivos, sendo que dois deles são bastante óbvios: 1) Medias ponderadas (exponencial, linear weighted, smoothed) atribuem maior peso aos dados mais recentes de maneira diferente se usarmos 720 ou 30 períodos. Então é necessário usar médias simples para que funcione. . 2) Qual valor de cada candle deve ser considerado? Isso também faz diferença. Em candles diários e semanais, o CLOSE é o mais indicado, por geralmente representar o maior volume. Mas também serve o OPEN. Não são tão indicados o HIGH e LOW, que podem assumir valores exagerados, e não são indicados MEDIAN, WEIGHTED e TYPICAL porque eles atenuam os extremos. 3) O terceiro motivo é mais interessante, por isso deixaremos para discutir exclusivamente no fórum destinado a conversas dos cotistas. Recentemente fiz alguns testes usando o Saturno V 3.0 com timeframe de 1 hora, e depois multipliquei alguns parâmetros por 4,9 e por 24, dependendo do caso, para usá-lo em timeframe de 1 dia e não ter que gerar outro arquivo FXT (não confundir o timeframe com a granulosidade da base. A granulosidade da base é tick-by-tick, os timeframes podem ter 1 minuto, 1 hora, 1 mês etc.). Para minha surpresa, os resultados foram muito diferentes. Então fui verificar qual poderia ter sido a causa. O suspeito era o cálculo de médias e desvios-padrão e, de fato, era o culpado. Teoricamente, um período de 25 meses deve ter volatilidade cerca de 5 vezes maior que o período de 1 mês (raiz quadrada de 25). Mas como as propriedades gerais do Mercado não permanecem, em média, as mesmas, seria normal que houvesse flutuações consideráveis. Porém o desvio-padrão de 12 meses deveria ser quase idêntico ao de 365 dias, por cobrirem exatamente o mesmo período, e as pequenas diferenças deveriam decorrer apenas do fato de os preços terem mais possibilidades de oscilar dentro dos candles maiores. Claro que em tal caso se deve usar o método “simple”, isto é, sem ponderação em função do tempo. Mas não é o que se observa na prática. No caso da IBM, por exemplo, um período de 52 semanas tem volatilidade $ 9,43, enquanto um período de 365 dias tem volatilidade de $ 18,07!!! Quase o dobro! Isso usando exclusivamente os preços de fechamento, para evitar que as médias dos candles (Typical, Weighted, Median) agravassem o problema. Mesmo assim, houve um erro de 92%! No caso do ouro, que comentamos pouco acima, se usar 2100 períodos de 4 horas, em vez de 1050, o problema também se manifesta! Com 2100 períodos temos volatilidade $ 101,94, mas com 50 semanas (50 x 7 x 24 / 4 = 2100) a volatilidade é $ 56,78! Esse problema também afeta as médias e, certamente, todos os demais indicadores. Em suma, isso significa que quando se fala em “volatilidade”, não basta definir o período a que se está fazendo alusão, mas também o timeframe usado no cálculo. O ideal seria que todos os indicadores, especialmente a volatilidade e as médicas, fossem calculados usando bases de ticks, mas isso teria o sério inconveniente de demandar muito tempo, pois 1 ano tem cerca de 5 milhões de ticks em divisas de maior liquidez, então é muito mais rápido calcular a volatilidade de 1 ano usando 52 semanas, sobretudo numa otimização que requer 10.000 repetições do mesmo teste.