O que é Overfitting?
O sobreajuste é um erro de modelagem que ocorre quando uma função é muito próxima de um conjunto limitado de pontos de dados. A super adaptação do modelo geralmente assume a forma de criar um modelo excessivamente complexo para explicar as idiossincrasias nos dados em estudo.
Na realidade, os dados frequentemente estudados apresentam algum grau de erro ou ruído aleatório. Portanto, tentar fazer com que o modelo esteja em conformidade muito próximo a dados ligeiramente imprecisos pode infectar o modelo com erros substanciais e reduzir seu poder preditivo.
Principais Takeaways
- O ajuste excessivo é um erro de modelagem que ocorre quando uma função é muito próxima de um conjunto limitado de pontos de dados. Os profissionais financeiros sempre devem estar cientes dos perigos de ajustar demais um modelo com base em dados limitados.
Entendendo a sobreajuste
Por exemplo, um problema comum é o uso de algoritmos de computador para pesquisar bancos de dados extensos de dados históricos do mercado, a fim de encontrar padrões. Dado estudo suficiente, muitas vezes é possível desenvolver teoremas elaborados que parecem prever coisas como retornos no mercado de ações com grande precisão.
No entanto, quando aplicados a dados fora da amostra, esses teoremas podem ser apenas a super adequação de um modelo ao que na realidade eram apenas ocorrências aleatórias. Em todos os casos, é importante testar um modelo em relação a dados que estão fora da amostra usada para desenvolvê-lo.
Os profissionais financeiros sempre devem estar cientes dos perigos de sobrescrever um modelo com base em dados limitados.
