#19 Scaling Law里面有当前科技无法理解的真意

入川为王大约 2 分钟

Scaling Law可能是21世纪最重要的定律。

只要不停的喂数据，模型就会诞生智能。（涌现）

我想到了量化策略。只要不停的喂数据，就能挖掘到真实有效的alpha策略。

海量，高质量的数据。分成训练组，验证组。

在训练组上有效（此处的有效，是年化收益率>预期，夏普>预期）。

在验证组上有效。在数据全集上有效。

在未来有效。（待未来发生发生后，即可验证其是否有效）

量化和大模型有某种层面的真意是相似的。

核心都是Scaling Law。跑的太少了不足以说明问题，总决策次数=周期数*每日持仓数。

假设验证集3年，那么就有750日的数据，假设每日持仓5只，那么总决策次数=3750次。

光凭借感觉，凭借拍脑袋，是做不到3750次里积累下高收益的。（如年化收益率始终>100%）（靠少数的交易获取收益，这种行为就相当于抛硬币。持续能交易获取收益的人一定是掌握了某种原则。要么就是亏损）如果一个人能在 3750 次猜硬币中，保持 55% 的胜率，那绝对不是运气。那是神迹（或者作弊）。

更别说，验证集合还有完全没看过的数据，数据全集里也有完全没有看过的数据。

没看过的数据里，也符合有效（假设7年数据，没看过的数据>4年）。这是什么，这就是Alpha。

Deepseek被量化公司所发明，因为大模型和量化背后有着最大的相似。

既有过拟合校验，参数敏感性验证。如果还能构建出这样一个低相关的舰队呢？岂不是无敌？

大模型公司用Scaling Law从文本里挖掘出智能，我们用Scaling Law从数据里挖掘出Alpha。

这是Scaling Law给你的财富。

对于筛选条件的增加也是，如果是那种平缓的增加，例如+3%+3%这种可能过拟合，因为是把某几次交易纳入进去了。但是对于+10%+20%这种一定是挖掘到了规律。

# #19 Scaling Law里面有当前科技无法理解的真意