永洪社区

标题: 线性回归训练集占比参数调整 [打印本页]

作者: yhdata_299631f7    时间: 2023-7-11 09:16
标题: 线性回归训练集占比参数调整
线性回归数据集,在算法里面调整训练集占比参数,系统默认是0.8,手动调成了0.9,能否调成1或者0.99呢

作者: yhdata_yzm    时间: 2023-7-11 09:16
在线性回归算法中,训练集占比参数通常指的是将原始数据集划分为训练集和测试集时,训练集所占的比例。常见的做法是将数据集按照指定的比例划分为训练集和测试集,以便评估模型在未见过的数据上的性能表现。

一般情况下,将训练集占比参数设置为0.8是为了保留一部分数据用于测试,以便评估模型的泛化能力。然而,你可以根据实际需求调整训练集占比参数,包括将其调整为1或0.99。

如果将训练集占比参数设置为1,即使用全部的数据作为训练集,那么你将没有留下数据用于模型的测试和评估。这可能会导致模型在未见过的数据上的性能表现不佳,因为你没有对模型进行充分的验证。

如果将训练集占比参数设置为0.99,即使用99%的数据作为训练集,这样留下的1%数据可以用于测试和评估模型。尽管这种情况下有少量数据用于评估模型的性能,但在实际应用中,这样的数据量可能仍然过小,无法充分验证模型的泛化能力。

因此,在调整训练集占比参数时,需要权衡考虑数据量、模型的性能评估以及对模型泛化能力的要求。根据具体情况,你可以选择适当的训练集占比参数,使得模型能够得到合理的训练和评估。




欢迎光临 永洪社区 (https://club.yonghongtech.com/) Powered by Discuz! X3.4