пятница, 18 мая 2018 г.

Análise estatística do sistema de negociação


Guia para o desenvolvimento do sistema de negociação.
A evolução contínua do software de análise técnica simplificou a criação de sistemas de negociação automatizados por computador. Alguns sistemas apenas geram os sinais para o comerciante seguir, enquanto outros colocam os negócios no mercado em nome do trader. No entanto, ser capaz de programar sua plataforma de negociação favorita é apenas o começo. Você deve ter uma estrutura para testar suas teorias de negociação para ter certeza de que os backtests lucrativos não são meramente por sorte, mas são os resultados da modelagem robusta do comportamento de um mercado.
Esta série de artigos irá apresentar uma abordagem simplificada para o desenvolvimento de um sistema de negociação para o mercado forex de varejo. A ferramenta de desenvolvimento de sistema que usaremos será 4 (4), embora as idéias e o processo apresentados se apliquem a uma ampla gama de plataformas de software. A metodologia abrangerá conceitos gerais direcionados ao operador de sistema iniciante. Quando tomamos atalhos por conveniência, encaminhamos o leitor a recursos adicionais para informações mais detalhadas.
Existem cinco fases distintas no desenvolvimento do sistema de negociação:
Fase 1: Desenvolvimento do modelo de mercado e do sistema automatizado básico & mdash; o sistema automatizado básico implementa esse modelo, mas não incorpora perdas de parada ou metas de lucro. O sistema básico é para o único propósito de coletar dados para análise estatística usada nas fases posteriores de desenvolvimento.
Fase 2: gestão de riscos & mdash; o stop loss inicial (ISL). Usando os dados coletados na Fase 1 e com base na análise estatística desses dados, adicionamos um ISL à estratégia de negociação. Usamos a otimização para encontrar um parâmetro de perda que atenda às nossas necessidades. Usaremos análise de avanço para testar essa versão do sistema.
Fase 3: gerenciamento de lucros & mdash; a meta de lucro (PT). Como na Fase 2, usaremos a análise estatística de nossos dados para incorporar uma meta de lucro ao sistema. Novamente, usaremos a otimização para encontrar uma meta de lucro apropriada e, em seguida, usaremos a análise de avanço para testar essa versão do sistema.
Fase 4: gerenciamento de dinheiro & mdash; o algoritmo de tamanho comercial (TSA). Esta fase não depende dos dados coletados na Fase 1. Em vez disso, incorporaremos o método popular de tamanho de negociação de fração fixa para determinar quantos lotes são alocados para cada transação. A literatura de comércio popular está repleta de conselhos para restringir o risco por negociação dentro de um intervalo de 1% a 3% do patrimônio da conta. Nós executaremos nossa otimização usando essas porcentagens e, novamente, usaremos a análise de avanço para testar essa versão do sistema.
Em conjunto, as fases 2 a 4 abrangem a gestão comercial, mas há mais um passo crítico:
Fase 5: análise de Monte Carlo & mdash; muitos traders param após a Fase 4. No entanto, nossos testes não estão completos nessa conjuntura e o sistema não está pronto para implementação (supondo que seja lucrativo). Apesar de nossa análise de caminhada, não podemos ter certeza de que nossos resultados não são por sorte. Em outras palavras, nosso modelo pode não descrever o comportamento do mercado com precisão; resultados favoráveis ​​podem ter se beneficiado de um ambiente de mercado cuja ação de preço acabou de coincidir com nossa lógica. A análise de Monte Carlo ajudará a determinar se nosso modelo foi bem-sucedido por causa da sorte (aleatoriedade) ou sua capacidade de identificar e explorar um padrão real de mercado.
Este artigo cobrirá a Fase 1; artigos subseqüentes abrangerão as fases de 2 a 5.

Análise estatística, Backtests & amp; negociação automatizada: qual caminho seguir?
Análise estatística, Backtests & amp; negociação automatizada: qual caminho seguir?
Esta é uma discussão sobre análise estatística, backtests & amp; negociação automatizada: qual caminho seguir? dentro dos fóruns do Trading Software, parte da categoria Comercial; Oi pessoal, estou aprendendo negociação de futuros e passei o último ano lendo, aprendendo, negociando papel, tentando.
Até agora eu tenho focado principalmente em leitura de fita, pegadas, TA, perfil de mercado e volume e outras técnicas discricionárias, mas quanto mais eu aprendo mais eu sinto a necessidade de ser capaz de:
2) Realize extensos backtests programando minhas idéias de negociação.
3) Possivelmente configurar alguns algoritmos básicos de negociação automatizada.
Já estou familiarizado com o Excel, mas duvido que seja suficientemente poderoso para realizar análises estatísticas intraday e / ou backtests em amostras grandes.
Eu também ouvi sobre o Matlab. Mas é realmente necessário usar um programa de terceiros para análise estatística e backtests ou devo usar minha plataforma de negociação diretamente?
E quanto a linguagem de programação C ++? Easylanguage? Outro? Algumas opções estão disponíveis, não sei qual direção devo seguir.
2) Realize extensos backtests programando minhas idéias de negociação.
3) Possivelmente configurar alguns algoritmos básicos de negociação automatizada.
A linguagem mais avançada que eu recomendaria seria o Java (a maioria dos aplicativos de Trading tem uma interface Java), o mais fácil que eu recomendaria seria o Excel VBA.
Mas não é o mesmo com o Easy Language? E C ++ (Sierra Chart)?
Ouvi dizer que, especialmente para o Easy Language, há uma comunidade muito ativa, muitos recursos (mal posso esperar para ler os livros que você mencionou), etc.
Mas o que você disse sobre código reutilizável, estatísticas, redes neurais, matemática vetorial. Isso também é válido para C ++ ou é apenas para o DotNet?
Todo mundo está falando sobre backesting e sistema automatizado, mas poucos sobre a análise estatística que é necessária para configurar um sistema antes de colocá-lo em um backtest (ou, mais provavelmente, eu não sei como procurar corretamente por isso no Google.).
Qual software as pessoas usam para isso? Você usa diretamente sua plataforma de negociação? É adequado para esse fim?
Sobre o Excel: É possível realizar uma análise Intraday abrangente? O máximo de linhas é 65000 ou algo assim. Parece muito distante do que é necessário para fazer uma análise estatística em vários anos.

Análise do Sistema de Negociação.
A análise adequada do sistema de negociação ajuda a encontrar sistemas de negociação que funcionem. Comerciantes bem-sucedidos precisam de várias taxas de desempenho e formas descritivas de visualizar os resultados. MultiCharts & rsquo; O relatório de desempenho estratégico é uma ferramenta poderosa usada pelos CTAs e comerciantes regulares para avaliar estratégias.
Mais de 200 maneiras de medir seu desempenho.
Ao seu alcance, você tem mais de 200 medições de desempenho disponíveis. Alguns dos mais úteis estão localizados no resumo de desempenho da estratégia, índices de desempenho, análise de tempo, lista de negociações, análise de comércio total, outliers, run-up e drawdown, análise de séries comerciais e análise periódica.
Relatório de desempenho estratégico.
Relatório de desempenho estratégico.
Relatório de desempenho estratégico.
Analisando resultados de backtesting.
Os Índices de Desempenho e Resumo de Desempenho da Estratégia permitem a análise rápida de suas métricas de estratégia de negociação. Você pode acessar o lucro ou prejuízo geral obtido pela estratégia de negociação, valores de taxas diferentes, dados detalhados de curva de patrimônio e informações muito mais importantes ao seu alcance.
Acompanhamento pelo tempo e pelo comércio.
As informações na tabela Análise de tempo avaliam os resultados estritamente do ponto de vista do tempo. Você define o prazo para exibir os resultados usando a guia Exibir da caixa de diálogo Configurações. Lista de negociações exibe o relatório completo de trade por comércio.
Análise total e outlier.
O Total Trade Analysis exibe o desempenho geral da estratégia de negociação. Outliers ou outliers trades são aqueles que excedem o comércio médio por um valor significativo (mais ou menos três (3) desvios-padrão).
Análise de séries de run-up / drawdown e trade.
Análise de série de run-up / drawdown e trade O run-up é medido como aberto à maior alta não realizada do trade para uma posição longa; rebaixamento é do aberto para o menor baixo não realizado do comércio para uma posição curta. O Trade Series Analysis exibe medidas estatísticas baseadas nos negócios vencedores e perdedores.
Relatório de desempenho estratégico.
Relatório de desempenho estratégico.
Análise estatística.
Todo operador profissional que deseja explorar plenamente o potencial da negociação algorítmica precisa entender as estatísticas e conhecer os métodos estatísticos mais amplamente utilizados, que podem ser úteis para avaliar a potencial robustez das estratégias de negociação. Trade Series Statistics exibe informações sobre as consecutivas séries de negociações ganhadoras (perdedoras).
A estratégia de compra e manutenção.
Esta é uma estratégia de investimento passivo de longo prazo na qual um investidor compra e detém ações por um longo período de tempo, independentemente da flutuação neste mercado. Se você está tentando comparar o lucro líquido total da estratégia e o Retorno Compra / Retenção, lembre-se de ter em mente que a estratégia comprar e manter pode levar a grandes perdas, além de riscos, porque seus investimentos ainda estão expostos a movimentos do mercado. para todo o período.
Relatório de desempenho estratégico.
Gráficos interativos que mostram a imagem completa.
O MultiCharts inclui 28 gráficos interativos para exibir valores relativos e absolutos. Drawdown, por exemplo, é mostrado em valores relativos, o que permite que você veja a imagem realista.
Relatório de desempenho estratégico.
Relatório de desempenho estratégico.
Relatório de desempenho estratégico.
Redução relativa.
Este gráfico equilibra o patrimônio líquido em relação ao número de transações para todas as negociações fechadas e também inclui os dólares de saque e as porcentagens de rebaixamento.
Insight usando gráficos de curva de capital.
Este gráfico permite uma melhor percepção do desempenho das negociações do que um gráfico usual de curva de capital. Ele exibe o lucro líquido em uma base barra a barra revelando levantamentos de capital e descobertas.
Curva de capital com detalhes de rebaixamento.
Este gráfico detalhado de curva de patrimônio combinada com Drawdown ($) e Drawdown (%).
Equity run-up e rebaixamento.
Esses gráficos ilustram a redução do patrimônio líquido versus o aumento de capital em dólares e porcentagens.
Análise geral do desempenho comercial.
Este gráfico exibe um patrimônio líquido (em $) versus o número de negociação para todos os negócios fechados. Este gráfico de patrimônio para todos os fins é melhor usado para análise geral do desempenho comercial.
Total de negócios e negociações vencedoras.
Esses gráficos exibem o lucro (em $) versus o número de negociação para todos os negócios ou para todas as negociações vencedoras. A linha horizontal representa o comércio médio.
Determinando paradas de proteção.
O gráfico da Máxima Inflação Adversa é melhor usado para determinar paradas de gerenciamento de dinheiro protetoras para uma estratégia de negociação. Ele representa o Lucro / Perda vs. Desembolso de cada transação em um formato de gráfico de dispersão.
Determinando paragens à direita.
O gráfico Máximo de Excursão Favorável é melhor usado para determinar as paradas finais para uma estratégia de negociação. Mostra o Lucro / Perda vs. Desembolso realizado em um formato de gráfico de dispersão. As setas verdes representam as negociações vencedoras, e as setas vermelhas representam negociações perdedoras.
Avaliações de longo prazo
O gráfico Máximo de excursões favoráveis ​​usa porcentagens em vez de valores em dólar. Este gráfico é melhor usado para avaliações de longo prazo.
Gráficos de um clique.
Em MultiCharts, pesquisar uma transação específica leva apenas um clique. Você tem 16 parâmetros de qualificação para filtrar todas as negociações e, assim que identificar o negócio que lhe interessa, basta um clique para exibi-lo em um gráfico. Isso permite que você veja a negociação no relatório e a representação do gráfico gráfico quando a transação foi criada, permitindo que você identifique rapidamente falhas na entrada e saída de métodos e melhore a lógica de negociação.

Análise Estatística em Câmbio.
Os operadores que exploram estratégias de negociação automatizadas têm, provavelmente, a vantagem mais significativa sobre os operadores discricionários na possibilidade de utilizar análises estatísticas abrangentes e precisas. Hoje em dia, os comerciantes podem executar muitas operações estatísticas em poucos segundos graças à ampla gama de software de negociação analítica e de programação (como Tradestation, Multicharts, Microsoft Excel, Matlab etc.) que são amplamente acessíveis para os operadores individuais. Todo operador profissional que deseja explorar plenamente o potencial da negociação algorítmica precisa entender as estatísticas e conhecer os métodos estatísticos mais amplamente utilizados, que podem ser úteis para avaliar a potencial robustez das estratégias de negociação.
Deve ser salientado que não são necessários métodos estatísticos quando não há incerteza. Se todos os alunos da escola secundária "A" se graduaram com sucesso enquanto todos os alunos da escola secundária "B" não o fizeram, então não há necessidade de análise estatística. No entanto, quando as consequências potenciais dos dados observados são incertas, a análise estatística é a única maneira de esboçar conclusões razoáveis. Em um ambiente tão incerto quanto a troca é a análise estatística é a única maneira de diferenciar entre as regras que são estatisticamente significativas daquelas que não são. A análise técnica na negociação visa identificar as regras recorrentes baseadas em dados históricos na forma de padrões de preços ou vários indicadores e depois extrapolá-los em dados futuros. No entanto, a característica inerente da extrapolação é a incerteza. Quando se fala de negociação com dinheiro real, a incerteza não é a palavra que o negociador quer ouvir. Se, no entanto, entendermos quais métodos estatísticos são relevantes e como usá-los, a probabilidade de negociação bem-sucedida e lucrativa aumenta significativamente.
O princípio básico de todos os métodos estatísticos é o teste de hipóteses estatísticas. Permite avaliar se os dados recuperados experimentalmente estão de acordo com a presunção definida antes do teste. Ao testar a hipótese estatística, é sempre necessário comparar duas hipóteses. Uma hipótese, chamada hipótese nula H 0, é a hipótese que está sendo submetida ao teste. Por exemplo, pode-se testar a hipótese de que todos os estudantes do ensino médio na República Tcheca terão melhores resultados no exame final de língua inglesa do que os estudantes de escolas técnicas na República Tcheca. Por outro lado, a hipótese alternativa H 1 presume que os estudantes do ensino médio não terão melhores resultados no exame final de língua inglesa do que os estudantes de escolas técnicas da República Tcheca. Para testar a hipótese nula H 0 contra a hipótese alternativa H 1, usaremos a chamada estatística T, que é chamada de critério de teste. O critério de teste é a função de seleção aleatória. Essa função está relacionada à hipótese nula H 0. A distribuição dessa função é conhecida desde que a hipótese nula não seja rejeitada. Vamos agora demonstrar o teste de hipóteses estatísticas e seu significado na troca de negociação:
Esta hipótese é baseada na presunção de que nenhuma das regras de análise técnica (não importa se ele usa padrões de preços, indicadores, etc.) tem poder preditivo e que o backtest lucrativo não foi nada mais do que uma coincidência. Para o nosso propósito, a coincidência significa conformidade positiva, mas acidental, entre o sinal da regra e as tendências de mercado subsequentes na amostra de dados históricos (os chamados dados na amostra) usados ​​para testar a regra.
A Hipótese Alternativa H 1.
Por outro lado, se as observações de mercado forem contrárias às previsões feitas pela hipótese nula, a hipótese nula foi rejeitada. Em vez disso, a hipótese alternativa H 1 é aceita e baseia-se no pressuposto de que a regra da análise técnica tem poder preditivo. A hipótese alternativa H 1 serve como evidência de que a taxa de retorno é muito alta para ser razoavelmente atribuída à coincidência. Se a regra da análise técnica não tivesse poder preditivo, a taxa de retorno seria menor ou igual a zero em dados desconhecidos (os chamados dados fora da amostra). Se usar dados retificados, a taxa de retorno será igual a zero. O princípio de testar os dados desmembrados e por que usar os dados retificados será explicado nos artigos a seguir.
Neste capítulo, apresentamos a importância do uso da análise estatística na negociação. A presunção básica da análise estatística na negociação é que a análise técnica visa revelar regras recorrentes a partir de dados históricos na forma de padrões ou de vários indicadores e depois extrapolá-los para o futuro. A Hipótese Nula H 0 presume que todas as regras da análise técnica são sem poder preditivo. É um contrário à hipótese alternativa H 1, que presume que a regra tenha poder preditivo. No próximo artigo, vamos nos concentrar em explicar o princípio do critério de teste.

Análise estatística do sistema de negociação
Uma das primeiras citações do livro define o conceito que abrange:
O método científico é a única maneira racional de extrair conhecimento útil dos dados de mercado e a única abordagem racional para determinar quais métodos de TA têm poder preditivo. Eu chamo isso de análise técnica baseada em evidências (EBTA).
Aronson introduz logo no conceito de objetivo (TA) vs. subjetivo (TA). Uma reivindicação objetiva é uma proposição significativa, que pode ser verificada sem ambigüidade. Para nós, desenvolvedores de sistemas mecânicos: um conjunto de regras que podem ser testadas novamente. Por outro lado, a análise técnica subjetiva consistiria de abordagens como a Elliot Wave Analysis.
No entanto, a análise técnica objetiva não é suficiente por si só: você ainda precisa de uma inferência estatística rigorosa para tirar conclusões sobre seu poder preditivo.
Primeira parte: as fundações
A primeira parte do livro estabelece os fundamentos metodológicos, filosóficos, psicológicos e estatísticos da EBTA.
O primeiro tópico abordado é a necessidade de benchmarking para avaliar as regras objetivas e introduz o conceito de desvantagem, que discuti anteriormente.
O segundo tópico trata da psicologia cognitiva e dá exemplos de diferentes tipos de preconceitos comportamentais que podem nos enganar e nos fazer acreditar em análises técnicas subjetivas:
Reconhecimento de padrões Tendência de confirmação Viés de retrospectiva Excesso de confiança Correlações ilusórias Mis-percepção de aleatoriedade.
O antídoto para essas armadilhas da mente & # 8221; é o método científico. O método científico genérico é abordado no terceiro capítulo com alguma história e filosofia da ciência e raciocínio lógico. O método científico & # 8211; que pode e deve ser aplicado à Análise Técnica & # 8211; contém 5 etapas:
TA subjetiva não está em conformidade com o método científico e o autor apresenta um interessante estudo de objetivação de um padrão TA subjetivo (Head e Shoulders) para torná-lo testável (mostra que Head and Shoulders é inútil em ações e tem valor duvidoso sobre moedas) .
Análise estatística dos resultados do teste de retorno.
Os próximos três capítulos introduzem e cobrem a análise estatística. O início desta parte fornece uma boa atualização da inferência estatística, começando com conceitos como distribuição de frequência, desvio padrão, probabilidades e valores-p. O exemplo de amostragem e inferência estatística usando contas em uma caixa é uma boa ilustração e um paralelo bastante claro com o mundo dos testes de regras de negociação.
O livro passa para conceitos como teste de hipóteses, significância estatística e intervalo de confiança, etc. e como eles se relacionam ao teste de regras.
Uma das principais questões dos resultados de back-testing é que eles representam apenas uma amostra de como os sistemas / regras funcionam. Aronson apresenta a abordagem estatística clássica para derivar a distribuição amostral (necessária para realizar a inferência estatística) com base em uma única observação / amostra. No entanto, isso pressupõe a normalidade da distribuição, que é improvável que esteja correta ao lidar com dados financeiros.
Novos Métodos Científicos para o Back-Testing.
Este último conceito leva à introdução dos dois métodos alternativos para derivar a distribuição de amostragem e realizar inferência estatística nos resultados do back-test. Estes são dois métodos baseados em computador:
Ambos os métodos estimam a distribuição amostral aleatoriamente por reamostragem (reutilização) da amostra original de observação. Uma estatística de teste é então calculada para cada resample.
Na prática, o método de bootstrap usa a reamostragem com a substituição dos retornos da estratégia diária para gerar várias estatísticas de teste aleatório usadas para aproximar uma distribuição de amostragem.
O método de permutação de Monte Carlo alcança o mesmo resultado ao desacoplar e permutar a direção da posição (ou seja, longa ou curta) com os retornos diários do instrumento.
Usando a inferência estatística coberta nos capítulos anteriores, pode-se decidir se os resultados encontrados no back-test são estatisticamente significativos ou o produto da chance aleatória.
Esses dois métodos são o principal take-away do livro, pois são valiosos para identificar o grau de aleatoriedade em uma regra de back-testada. Isso provavelmente deve fazer parte de uma metodologia de pesquisa de sistema de negociação padrão e abordarei esses dois métodos em mais detalhes em posts posteriores.
Na mineração de dados.
Os métodos acima lidam apenas com uma regra / backteste. No entanto, raramente testamos a única regra isolada: a maioria dos back-testing testaria valores, regras e combinações de vários parâmetros para tentar identificar os que apresentam melhor desempenho: isso é mineração de dados.
No entanto, é errado esperar que o desempenho futuro dos sistemas com o melhor desempenho se mantenha em linha com os resultados passados ​​e testados. Os sistemas com melhor desempenho podem ter valor intrínseco, mas parte de seu desempenho excessivo é devido a variações aleatórias. Se você executar 1.000 regras diferentes sem poder preditivo, todas elas terão alguma chance aleatória de produzir uma partida variável da média zero. O & # 8220; mais sortudo & # 8221; A regra estará mais longe no lado direito da média zero (e, portanto, pegou o minerador de dados), apesar de não ter valor intrínseco.
Mineração de dados introduz um viés, que exagera o valor do & # 8220; melhor & # 8221; regra em comparação com as variações aleatórias esperadas. O viés de mineração de dados está ligado a vários fatores:
Aumenta com o número de regras back-testadas Diminui com o tamanho da amostra usado em back-testing. Diminui com a correlação dos resultados das regras testadas novamente. Aumenta com a frequência de outliers na amostra de teste de retorno. Diminui com a variação nos retornos testados entre as regras consideradas.
Isso é ilustrado com exemplos e gráficos. O restante do capítulo se concentra em métodos para reduzir / corrigir o viés da mineração de dados e adaptar o método de bootstrap (usando a verificação de realidade da White) e a permutação de Monte Carlo a ser usada na & # 8220; data mining & # 8221; modo (em vez de teste de regra única).
Em conclusão, a mineração de dados é um método válido para descobrir a (s) melhor (s) regra (s), mas o pesquisador deve garantir que os resultados sejam estatisticamente significantes para evitar o risco de descobrir “o mais sortudo” # 8221; regras.
Um tour da EMH e aplicação de métodos.
O capítulo seguinte lida com a Hipótese do Mercado Eficiente, que leva um pouco de espancamento pelo autor. O ponto principal é que, do ponto de vista empírico e teórico, a EMH contém falhas, o que suporta a ideia de AT bem sucedida.
A última parte do livro apresenta um conjunto diversificado de regras e parâmetros (6.402 combinações) e tenta testar sua significância estatística. As regras são bastante simples e os resultados não destacam poder preditivo significativo em nenhuma regra.
Revisão Conclusão.
Este livro é uma leitura muito interessante, no lado longo, com mais de 450 páginas. Mesmo que eu tenha gostado disso, às vezes eu estava me encontrando esperando que o autor não expandisse tanto em alguns tópicos introdutórios (a história e a filosofia da ciência é bastante interessante, mas poderia muito bem ser lida para chegar ao & # 8220; juicier & # 8221; peças mais rápidas). Se você estiver com pressa, aconselho a concentrar-se nos capítulos 4, 5 e 6, onde os métodos reais de bootstrap e Monte Carlo são apresentados e discutidos, e a discussão sobre viés de mineração de dados é interessante e muito relevante. Para um leitor novo desses conceitos, os capítulos iniciais forneceriam uma introdução abrangente dos conceitos fundamentais de raciocínio científico e análise estatística antes de colocá-los todos juntos na aplicação.
Para mais informações, alguns dos comentários sobre a amazon são bastante perspicazes (principalmente positivo, embora o livro tenha sua cota de avaliações de 1 estrela). Há também um site complementar ao livro com mais informações e resultados detalhados dos testes realizados na última parte do livro.
16 Comentários até agora & darr;
& # 8220; Diminui com a correlação dos resultados das regras testadas novamente. & # 8221;
Você está dizendo que enquanto mais regras aumentam o viés, se elas são altamente correlacionadas entre si, esse aumento é mitigado?
Correto (bem, estou apenas repetindo o que diz Aronson & # 8230 ;-):
com muitos resultados não correlacionados (diferentes), há uma probabilidade maior de que um conjunto de resultados erre no lado da sorte / super desempenho.
Se você pensar no exemplo extremo de 1.000 resultados de testes de regras perfeitamente correlacionados (ou seja, resultados idênticos), não há viés de mineração de dados (ou seja, porque o processo de mineração de dados não descobriu uma regra com desempenho exagerado por acaso: eles são tudo o mesmo)
Isso é o que eu pensei, apenas buscando alguma confirmação & # 8230; Bem, essa pequena citação me fez pensar em algumas possíveis novas maneiras de avaliar a robustez dos sistemas.
Talvez tendo a correlação pareada média para um conjunto de regras para ajustar o t-stat? Ou o número de regras multiplicado por (1 & # 8211; absoluta de correlação paritária média) para obter o seu & # 8220; ajustado & # 8221; número de regras independentes?
Aronson vai para a matemática de como ajustar o viés das regras & # 8217; correlações?
E sim, 1000 regras, todas com uma correlação pareada de 1, seriam completamente equivalentes a ter apenas uma regra & # 8230; um pouco relacionado, você leu um artigo sobre SSRN intitulado “Distinção de Estratégia e Desempenho do Fundo de Hedge”? Google, se você não tiver.
Eu tenho este livro e posso recomendá-lo completamente. Implementei as ideias da Aronson em scripts R e nas funções do Octave C ++ e agora elas formam a espinha dorsal da minha metodologia de testes. Eu aprendi com o uso desses testes que muito poucos indicadores etc. realmente têm alguma validade estatística e eu me conforto com o fato de que agora tenho o conhecimento de não arriscar meu dinheiro em TA tão duvidosa.
Excelente revisão Jez, ansioso para seus posts em Monte Carlo e bootstrapping.
Aronson realmente não entra em uma explicação matemática / teórica de cada fator no viés de mineração de dados & # 8211; em vez disso, ele apresenta resultados baseados em simulações computadorizadas usando algumas regras artificiais onde ele pode controlar cada fator. Os resultados são apresentados em um gráfico que mostra que o viés de mineração de dados cai lentamente para correlações entre 0 e 0,8 e, em seguida, mais drasticamente além da marca de 0,8 (ou aproximadamente) & # 8211; quanto mais regras / sistemas estão sendo testados, maior o limiar de correlação para uma grande queda de viés de mineração de dados (ou seja, 10 regras testadas começam a cair mais pesadamente em 0.7, enquanto que para 1000 regras ele cai para 0.95).
Sua idéia de ajustar o t-stat com base na correlação de regras soa bem & # 8211; no entanto Aronson não vai nessa direção, mas ele descreve como adaptar os métodos de bootstrap e Monte Carlo para explicar o viés de mineração de dados.
Obrigado pela sugestão de papel & # 8211; Eu vou dar uma olhada.
Eu também sinto que alguns dos conceitos e métodos da Aronson serão incorporados na minha metodologia de teste padrão & # 8211; Como eu estou dizendo no post, este livro ensina você a pescar! & # 8230;
Será necessário codificar isso como você fez em R e Octave C ++ (embora eu ainda não tenha aprendido essas ferramentas e possa ter uma rota de implementação de TI diferente & # 8230;)
O viés caindo lentamente até o.8 faria sentido matematicamente, desde que r quadrado é a correlação ao quadrado, então seguir uma lei de poder faz sentido.
Em última análise, soa como 6 a 12 e meia dúzia para o outro. Com centenas de regras altamente correlacionadas, mas baixo viés de datamining, contra centenas de regras não correlacionadas com alto viés, parece que a borda líquida seria zero. É claro que se a taxa na qual o viés cai não é linear em relação à taxa, a correlação aumenta, então pode haver um "sweet spot" # 8221 ;.
Coisas interessantes, pegando o livro de Aronson, tem estado na minha lista de tarefas por um tempo.
Análise técnica baseada em evidências [& # 8230]
O método [& # 8230;] para avaliar a significância estatística de um resultado de back-test apresentado por Aronson (em EBTA) é a Permutação de Monte Carlo. Esta é uma extensão do método clássico de Monte Carlo, aplicado a [& # 8230;]
Muito divertido ler alguns dos comentários malucos do livro sobre a Amazônia, parece ser alguns rancores sobre. É incrível como as pessoas trabalharam sobre TA!
Oi Andrew, depois de todos os seus testes, quais são os poucos indicadores que vale a pena usar?
Os indicadores que acho que têm algum valor são aqueles baseados em conceitos de Processamento Digital de Sinal, como filtros de baixa defasagem, filtros de alta frequência, medidas de periodicidade e indicadores adaptativos. Parâmetros de comprimento fixo não cortam a mostarda para mim.
Bom livro, mas (e bastante grande & # 8220; MAS & # 8221;) & # 8211; nenhuma palavra sobre overfitting & # 8221 ;. Assim como não é um problema em tudo.
Eu percebo que estou chegando a este ponto um pouco atrasado, mas sobre o tópico de sobreposição de um conselho parece ser que, em vez de tentar maximizar um critério como o lucro, você deve tentar maximizar a robustez de seus resultados.
Portanto, se o seu Lucro máximo vem de um pico para um conjunto de parâmetros, quando todos os outros parâmetros da vizinhança geram perdas, é provável que sua estratégia não seja robusta e sua estratégia não será executada fora da amostra. Portanto, é melhor procurar o maior patamar de lucro, mesmo que não seja tão alto quanto o maior pico de lucro.
O problema é a quantidade de parâmetros em uma estratégia de média móvel bastante simples que tende a ser grande quando você começa a adicionar filtragem / paradas / derrapagens etc. Alguém sabe uma boa maneira de visualizar esses problemas dimensionais em um espaço dimensional menor? Isso pode ser feito numericamente, mas você perde a intuição.
Bom trabalho, continue assim.
Deixe um comentário (Cancelar)
Atualizações gratuitas.
Posts populares.
Procure no blog Au. Tra. Sy.
Corretor Global de Futuros.
Blog Au. Tra. Sy, pesquisa e desenvolvimento de Trading Sistemático, com um sabor de Trend Following.
Disclaimer: O desempenho passado não é necessariamente indicativo de resultados futuros. A negociação de futuros é complexa e apresenta o risco de perdas substanciais; como tal, pode não ser adequado para todos os investidores. O conteúdo deste site é fornecido apenas como informação geral e não deve ser considerado como recomendação de investimento. Todo o conteúdo do site, não deve ser interpretado como uma recomendação para comprar ou vender qualquer título ou instrumento financeiro, ou para participar de qualquer estratégia de negociação ou investimento em particular. As idéias expressas neste site são unicamente as opiniões do autor. O autor pode ou não ter uma posição em qualquer instrumento financeiro ou estratégia citada acima. Qualquer ação que você tome como resultado de informações ou análises neste site é, em última instância, de sua exclusiva responsabilidade.
OS RESULTADOS DE DESEMPENHO HIPOTÉTICOS TÊM MUITAS LIMITAÇÕES INERENTES, ALGUNS DOS QUAIS SÃO DESCRITOS ABAIXO. NENHUMA REPRESENTAÇÃO ESTÁ SENDO FEITA QUE QUALQUER CONTA PODERÁ OU POSSIBILITAR LUCROS OU PERDAS SIMILARES AOS EXIBIDOS; DE FATO, HÁ DIFERENÇAS FREQUENTEMENTE DIFERENCIADAS ENTRE OS RESULTADOS DE DESEMPENHO HIPOTÉTICOS E OS RESULTADOS REALIZADOS SUBSEQÜENTEMENTE ATINGIDOS POR QUALQUER PROGRAMA DE NEGOCIAÇÃO PARTICULAR. UMA DAS LIMITAÇÕES DOS RESULTADOS DE DESEMPENHO HIPOTÉTICOS É QUE SÃO GENERALMENTE PREPARADOS COM O BENEFÍCIO DE HINDSIGHT. ALÉM DISSO, A NEGOCIAÇÃO HIPOTÉTICA NÃO ENVOLVE O RISCO FINANCEIRO, E NENHUM REGISTRO DE NEGOCIAÇÃO HIPOTÉTICA PODE COMPLETAMENTE CONTA PARA O IMPACTO DO RISCO FINANCEIRO DE NEGOCIAÇÃO REAL. POR EXEMPLO, A CAPACIDADE PARA SUPORTAR PERDAS OU ADERIR A UM PROGRAMA DE NEGOCIAÇÃO EM PARTICULAR DENTRO DA NEGOCIAÇÃO DE PERDAS SÃO PONTOS MATERIAIS QUE TAMBÉM PODEM AFETAR DE ACORDO, DE FORMA ALTA, OS RESULTADOS DA NEGOCIAÇÃO. EXISTEM NUMEROSOS OUTROS FATORES RELACIONADOS COM OS MERCADOS EM GERAL OU PARA A IMPLEMENTAÇÃO DE QUALQUER PROGRAMA DE NEGOCIAÇÃO ESPECÍFICO QUE NÃO PODE SER TOTALMENTE CONSIDERADO PARA A ELABORAÇÃO DE RESULTADOS DE DESEMPENHO HIPOTÉTICOS E TODOS OS QUE PODEM AFETAR COM ANTECEDÊNCIA OS RESULTADOS DA NEGOCIAÇÃO.
ESTAS TABELAS DE DESEMPENHO E RESULTADOS SÃO HIPOTÉTICOS NA NATUREZA E NÃO REPRESENTAM A NEGOCIAÇÃO EM CONTAS REAIS.

Комментариев нет:

Отправить комментарий