#19 Scaling Law里面有当前科技无法理解的真意
...About 2 min
#19 Scaling Law里面有当前科技无法理解的真意
Scaling Law可能是21世纪最重要的定律。
只要不停的喂数据,模型就会诞生智能。(涌现)
我想到了量化策略。只要不停的喂数据,就能挖掘到真实有效的alpha策略。
海量,高质量的数据。分成训练组,验证组。
在训练组上有效(此处的有效,是年化收益率>预期,夏普>预期)。
在验证组上有效。在数据全集上有效。
在未来有效。(待未来发生发生后,即可验证其是否有效)
量化和大模型有某种层面的真意是相似的。
核心都是Scaling Law。跑的太少了不足以说明问题,总决策次数=周期数*每日持仓数。
假设验证集3年,那么就有750日的数据,假设每日持仓5只,那么总决策次数=3750次。
光凭借感觉,凭借拍脑袋,是做不到3750次里积累下高收益的。(如年化收益率始终>100%)(靠少数的交易获取收益,这种行为就相当于抛硬币。持续能交易获取收益的人一定是掌握了某种原则。要么就是亏损)如果一个人能在 3750 次猜硬币中,保持 55% 的胜率,那绝对不是运气。那是神迹(或者作弊)。
更别说,验证集合还有完全没看过的数据,数据全集里也有完全没有看过的数据。
没看过的数据里,也符合有效(假设7年数据,没看过的数据>4年)。这是什么,这就是Alpha。
Deepseek被量化公司所发明,因为大模型和量化背后有着最大的相似。
既有过拟合校验,参数敏感性验证。如果还能构建出这样一个低相关的舰队呢?岂不是无敌?
大模型公司用Scaling Law从文本里挖掘出智能,我们用Scaling Law从数据里挖掘出Alpha。
这是Scaling Law给你的财富。
对于筛选条件的增加也是,如果是那种平缓的增加,例如+3%+3%这种可能过拟合,因为是把某几次交易纳入进去了。但是对于+10%+20%这种一定是挖掘到了规律。
Powered by Waline v2.15.8