top of page

20 de junho de 2014

SATURNO V T 100G EM 129 ANOS DE ÍNDICE DOW JONES

por Hindemburg Melão Jr.

Embora o Índice Dow Jones tenha sido criado em 1896, com base na média aritmética de 12 das mais importantes empresas dos Estados Unidos, pode-se recriar o índice com base em critérios análogos e obter dados sobre a evolução que teria o DJI caso existisse antes de 1896. No site http://www.measuringworth.com/datasets/DJA/index.php estão disponíveis as cotações diárias desde 16/2/1885. No mesmo site podemos encontrar cotações anuais do ouro desde 1257, e evolução da taxa de juros na Grã Bretanha desde 1265, porém a volatilidade no ouro, segundo o site, se mantinha em 0 durante décadas, além de a liquidez ser muito baixa e o número de cotações disponíveis (poucas centenas) ser insuficiente para uma modelagem. Em outras fontes, encontrei cotações do trigo desde 1209, cotações do arroz na China desde 961 d.C., cotações de mostarda, agrião e gergelim na Babilônia entre 385 a.C. e 61 a.C. e cotações de algumas commodities no Império Bizantino entre 361 d.C. e 1401 d.C. Estes dados permitem a reconstrução de cotações de algumas commodities desde o século IV a.C., porém está repleto de descontinuidades, a ausência de informações sobre as unidades monetárias de diferentes regiões dificulta a unificação dos dados, que acabam servindo mais como curiosidade, sem ter muita utilidade para fins de modelagem de estratégias. Por outro lado, os dados sobre o DJI apresentam boa liquidez, boa volatilidade, e são bastante semelhantes aos dados atuais, sob diversos aspectos fundamentais.

A plataforma de back tests que utilizamos só aceita datas entre 1/1/1970 e 31/12/2037. Inclusive o Excel 2013 não reconhece datas anteriores a 1/1/1900 (aceita 0/1/1900, que seria 31/12/1899, mas abaixo disso dá mensagem de erro). Para adequar o DJI desde 1885 para ser legível na plataforma utilizada, os dados diários foram convertidos em minutos. Isso não afeta em nada a estrutura de dados. Com esta adaptação, 1 dia passa a ser representado por 1 minuto. Além disso, o método de cálculo de lucro em pontos, habitualmente aplicado nos índices, não é apropriado quando se tem um instrumento financeiro que cresce exponencialmente, exceto se houver revisões periódicas no cálculo. Como o DJI começou com valor perto de 30 pontos, em 1885, e atualmente está em 17.000 pontos, o cálculo de lucro apresenta um fator de correção de mais de 500:1, o que inviabiliza utilizar as cotações do DJI desta forma. Por isso foi extraído o logaritmo neperiano do DJI e as cotações usadas nos testes foram do ln(DJI) com 5 decimais. Os dois gráficos a seguir mostram as cotações do DJI e do ln(DJI), que fica visualmente igual a um gráfico de DJI com escala logarítmica. A importação de dados do segundo gráfico foi feita usando AUDCHF, já que não existe o equivalente a ln(DJI).


ree

Em escala logarítmica, pode-se visualizar melhor diversos momentos críticos na história do DJI, como a crise de 1929, que continua sendo a mais grave da história, enquanto a crise de 2008 não é muito pior que as de 1907 ou 1937.

As cotações de DJI disponíveis no site não incluem máximo, mínimo e abertura a cada dia. Incluem apenas o valor de fechamento de cada dia. Para realizar os back tests, é necessário ter candles completos, que foram gerados por meio de processos de Wiener, com 200 ticks internos em cada candle, usando o fechamento de cada dia para determinar a abertura do dia seguinte. Isso possibilita simular uma situação semelhante a que se teria caso estivessem disponíveis as cotações do DJI a cada 5 minutos desde 1885.


ree

Para verificar a qualidade desse tipo de geração de candles, o Saturno V T 100 g0002 foi testado em dados recentes do DJI tick-by-tick de 2013 a 2014, e depois no DJI com 200 ticks artificiais por dia de 2013 a 2014. Os resultados foram muito semelhantes, conforme tabela ao lado. A similaridade de 82% no balanço está um pouco abaixo do desejado, mas como se trata de um estudo para validação de uma série histórica, em vez de ser uma otimização para selecionar configurações a serem usadas em contas reais, não constitui um problema preocupante. Além disso, reconstituir todas as cotações intradiárias usando apenas cotações EOD (End Of Day) e mesmo assim conseguir uma similaridade tão boa, é um resultado bastante positivo.

Usando o período de 1885 a 1903 para otimização, e rodando o genótipo campeão nos 100 anos seguintes, o resultado foi acima das expectativas. Em artigo anterior, no qual o Saturno 6.1 foi testado em 82 anos de DJI, otimizado entre 1928 e 1935 e depois testado nos 75 anos seguintes, a melhor configuração obtida na otimização não foi capaz de gerar muito mais que 7,1% ao ano, em média, que é melhor que os 4,2% ao ano de Buy & Hold do índice, mas está muito aquém das performances que o Saturno consegue em EURUSD. Também o máximo drawdown da versão 6.1 em DJI foi perto de 50%, enquanto Buy & Hold chegou a quase 90%, portanto o Saturno V 6.1 se mostrou mais rentável, mais estável e com menor risco do que Buy & Hold do DJI.

Agora os testes com a versão T 100g se mostraram bem mais impressionantes. Logo na primeira otimização (o campeão entre 10.496 genótipos testados), já alcançou lucro anual médio de 14,77% com máximo drawdown de 44,08%. A prática de Buy & Hold no DJI no mesmo período teria gerado 4,99% de lucro ao ano, com máximo drawdown de 89,36%. O DJI neste período extendido permanece semelhante ao DJI de 1928 a 2010, mas o Saturno V T 100 já se mostrou muito superior ao Saturno V 6.1. Além de ter melhor performance que o 6.1, foi constatado que os problemas enfrentados pelo Saturno V 6.1 no ano 1966 não foram marcantes para a versão T 100, embora haja uma queda de performance em 1965-1967. A diferença é que a versão 6.1 afundava em 1966 e não conseguia mais operar daí em diante, se usasse a configuração da otimização feita entre 1928 e 1935. Seria fácil resolver isso, fazendo uma nova otimização usando dados de 1950 a 1966, conforme descrito no artigo da época. Porém o Saturno V T 100 não precisa disso. Ele se adapta ao novo cenário sem necessidade de qualquer intervenção adicional, e após uma breve queda de performance em 1965-1967 ele volta a ter bons resultados nos anos seguintes.

Em otimizações posteriores, o Saturno V T 100g alcançou performances ainda mais notáveis, com média anual de 36,34% e máximo drawdown de apenas 17,90%. Esse resultado foi obtido sem alavancagem (usando 1% da carteira em cada operação, com alavancagem de 100:1). Também é interessante ressaltar que em alguns dos momentos que a maioria dos fundos e bancos quebraram, o Saturno V teve grande sucesso. Na crise de 1929, o Saturno teve ganhos acima da média, bem como na crise da Grécia em 2010. Nas crises de 1907, 1937, 1973, 1987-88, 1999-2000, 2007-2008, ele atravessou as crises com indiferença, mantendo aproximadamente mesma performance que em qualquer outro momento escolhido ao acaso, demonstrando grande robustez às turbulências no Mercado. Na verdade, seria esperado que o Saturno performasse melhor nestes momentos de longas quedas, já que se trata de um sistema de tendência.

A importância desse estudo está principalmente na confirmação da estabilidade a longo prazo da versão T 100g do Saturno V. Usando exclusivamente dados de 1885 a 1903, o Saturno V pode ser otimizado de modo a gerar um genótipo capaz de se manter positivo nos 100 anos seguintes, sem necessidade de novas atualizações ou aprimoramentos. Em parte isso se deve aos melhores critérios de adaptabilidade. O Saturno V atravessa grandes cenários de euforia, grandes cenários de crise, pânico, depressão, estagnação, e sua performance é aproximadamente estável em qualquer cenário. O gráfico abaixo mostra um dos estudos realizados sobre a homogeneidade do Saturno V negociando DJI:


ree

Para exacerbar as oscilações e torná-las mais visíveis, foi assumido um nível de risco acima do habitual, o que resultou em performances perto de 119% ao ano, em média. O gráfico, em escala logarítmica, mostra as curvas de evolução de uma carteira hipotética de $ 100.000 que tivesse sido administrada pelo Saturno V entre 1885 e 2014, negociando o índice Dow Jones. As performances foram segmentas em 11 períodos de aproximadamente 12 anos cada, exceto o último período, que tem 9 anos, a fim de comparar como o Saturno se comporta em épocas diferentes. O primeiro período tem início em 16/2/1885.

Podemos observar uma similaridade bastante grande entre o desempenho em diferentes épocas. No eixo das abscissas está o número de operações realizadas, que se mostrou uma variável mais fortemente correlacionada com a performance, ou seja, para igual número de operações em duas épocas diferentes, a performance é mais semelhante do que para dois intervalos de tempo iguais em duas épocas diferentes.

Aproximadamente no meio da série 4 ocorre a quebra da Bolsa de Nova Iorque, resultando em ganhos acima do normal para o Saturno, por pegar tendências particularmente fortes. O mesmo ocorre na crise de 2010, por volta de metade da série 11, porém não tão forte. Excetuando estes dois casos, as outras séries podem ser estratificadas em dois grupos, sendo as componentes de cada grupo muito semelhantes entre si. É interessante que a crise na Grécia tenha sido um problema para a versão 4 do Saturno, mas é uma dádiva para a versão 6 e posteriores ganharem acima do normal.

Uma análise de conglomerados aponta dois estratos principais e um estrato formado por anomalias. O primeiro estrato vai de 1885 a 1897. Ao que parece, o comportamento das 12 empresas que compunham o índice passaram a ter um comportamento sensivelmente diferente depois que o índice passou a existir oficialmente. Também faz parte deste estrato o período que vai de 1946 a 1967. O início deste período provavelmente está definido pelo fim da segunda guerra e/ou pelo acordo de Bretton Woods. No ano de 1967 eu não sei dizer qual o evento relevante que altera de forma permanente o comportamento do índice.

O outro estrato é composto pelos demais períodos. As exceções ocorrem de 1929 a 1932, com a quebra da NYSE, e no início de 2010, com a crise na Grécia e seus efeitos sobre a economia da Europa e do mundo. Curiosamente, a crise do subprime, em 2007-2008, não afeta tanto as propriedades gerais do DJI, apenas produz uma queda com propriedades gerais normais, semelhante à de 1907, 1937, 1987-1988 ou 1999-2000.

Podemos observar uma homogeneidade muito grande no comportamento geral das curvas de evolução da carteira em diferentes épocas, especialmente nas épocas que fazem parte de um mesmo estrato. Com um nível tão elevado de homogeneidade, torna-se possível fazer prognósticos mais precisos de performance, com menos riscos de erro na projeção.

Nos dois casos citados (1929 e 2010) em que houve anomalias significativas nas performances, ambas tornaram os resultados melhores do que o normal, mas há duas outras anomalias com efeito oposto. A terceira anomalia não está visível no gráfico porque ela ocorre bem no início da série 6, por volta de 1946-1947, e esta implica uma queda de performance, empurrando a curva para o grupo de baixo, e há outra no final da série 10, por volta de 2002-2003, que também empurra a série para baixo. Esta de 2002-2003 coincide com a época que o Euro entrou em circulação como moeda física, mas não sei se este foi o fator determinante deste efeito.

Simulações como esta são extremamente importantes e preciosas, para validar uma estratégia por longos períodos, por envolver uma grande variedade de situações raras, que ocorrem uma vez a cada várias décadas, e podem não figurar nos cenários dos últimos 10, 20 ou 30 anos, mas podem ocorrer num período de 50 ou 100 anos. Os resultados obtidos pelo Saturno V em 129 anos de DJI mostram um nível sem precedentes, em termos de estabilidade e homogeneidade. A amplitude máxima de variabilidade nos resultados do Saturno é cerca de metade da variabilidade no DJI, portanto o nível de exposição ao risco assumido pelo Saturno é menos da metade do que o risco assumido por quem praticasse Buy & Hold do índice Dow Jones no mesmo período, enquanto a performance anual do Saturno é 7 vezes maior que no DJI. Isso representa uma relação risco/recompensa cerca de 15 melhor do que Buy & Hold.

Mas o que dizer sobre back tests em dados sintéticos de 1.000 anos, 100.000 anos e até 1.000.000 de anos? A resposta é: na maioria dos casos, são completamente inúteis. Há uma imensa diferença entre interpolar dados reais para preencher candles com ticks artificiais, e usar um pequeno conjunto de parâmetros, arbitrariamente escolhidos entre as propriedades dos dados reais, para extrapolar dados e gerar séries inteiras de cotações artificiais. Preencher candles com ticks artificiais, desde que isso seja feito adequadamente, é um procedimento legítimo e que pode ser facilmente validado. Basta escolher um trecho de alguns anos do histórico em que se tenha ticks reais, rodar o back test para uma estratégia, depois remover os ticks destes candles, preencher com ticks artificiais e rodar novamente a mesma estratégia. Se os resultados forem semelhantes, indica que o procedimento é válido. No caso de gerar milhares ou milhões de anos de ticks artificiais, a menos que se faça um teste adequado para testar a hipótese de que estas cotações artificiais são representativas do que seria esperado em cenários reais, estes históricos não servirão para nada. Mas isso é tema para outro artigo.


Obrigado! Mensagem enviada. Para saber mais como adquirir o direito de uso de nossas licenças, leia mais em "FAQ", "ADQUIRIR" e em "APRESENTAÇÃO".

© 2010-2022 Saturno V - Todos os direitos reservados. Não comercializamos nem distribuímos cotas de fundos de investimento nem qualquer outro instrumento financeiro. Comercializamos licenças de uso do software "Saturno V", sistema automático de investimentos.

  • LinkedIn ícone social
  • YouTube ícone social
  • Facebook
  • Instagram
  • quora
bottom of page