企业网站的基本功能有哪些,网站建设策划优点,网站策划设计,搜索引擎关键词竞价排名首先#xff0c;让我们看一个小的单变量时间序列数据#xff0c;我们将用作上下文来理解这三种回测方法#xff1a;太阳黑子数据集。该数据集描述了刚刚超过 230 年#xff08;1749-1983 年#xff09;观察到的太阳黑子数量的每月计数。
数据集显示了季节之间差异很大的…首先让我们看一个小的单变量时间序列数据我们将用作上下文来理解这三种回测方法太阳黑子数据集。该数据集描述了刚刚超过 230 年1749-1983 年观察到的太阳黑子数量的每月计数。
数据集显示了季节之间差异很大的季节性。 首先对数据集进行训练-测试划分
使用多个训练测试拆分将导致训练更多模型进而更准确地估计模型在未见数据上的性能。 训练-测试拆分方法的一个限制是训练的模型在测试集中的每个评估中被评估时保持固定。 这可能是不现实的因为模型可以在新的每日或每月观察可用时重新训练。下一节将解决这个问题。
向前验证
在实践中我们很可能会在新数据可用时重新训练我们的模型。 这将为模型提供在每个时间步进行良好预测的最佳机会。我们可以在这个假设下评估我们的机器学习模型。 1.最少观察次数。首先我们必须选择训练模型所需的最少观察次数。如果使用滑动窗口这可能被认为是窗口宽度见下一点。 2.滑动或扩展窗口。接下来我们需要决定模型是使用所有可用数据进行训练还是仅根据最近的观察结果进行训练。这决定了使用滑动窗口还是展开窗口。