预训练硬件要求

#7
by magic123456 - opened

作者您好!看到文章中讲到所有实验均在32个NVIDIA A100 上进行。这里的实验指的是预训练吗,大概训练的多久呀?
现在的模型的大小有128M,属于较小的模型,是不是说预训练的硬件资源的最低需求可能并没有那么多呢?
谢谢

Sign up or log in to comment