查看原文
其他

利用chatGPT选了3支股票,验证未来收益率能否狂飙?

量化君 量化君也 2023-11-12


chatGPT在去年11年30日发布,最近火遍全球,短短2个月就坐拥1亿越活用户,这是很多人始料未及的。


刚发布不久,闲暇的时候,就爬梯子去调戏一下,有时就会把chatGPT有趣的回答po到群里或发朋友圈,那时的最大感受就是,这种问答类AI终于人工智能,不再是人工智障了。



最近老听说chatGPT能顶替一大堆职业工作,作为一名宽客(Quant),就也想看看是不是也把量化投资从业者的工作来顶替了,周末闲暇心血来潮胡思乱想,就先测试一下这家伙的选股能力这么样。


因为chatGPT的算法模型非常烧钱,训练一次的综合成本就要几百上千万美元,所以训练数据集就不会是每天增量迭代更新的,简单来说,chatGPT是一个“离线版本”,不是“实时版本”,在模型训练完成后的事情肯定是不知道的,咱就让它预测之后发生的事情,就知道它的预测的能力怎么样了。


经过多次询问,chatGPT的训练集数据截止到2021年,确切是哪个日期就死活不肯说了,那咱就只好“想当然”认为是2021年12月31日了。



这家伙不会说谎吧?慎重一点,巧妙试探一下,问一下它“是否知道俄罗斯和乌克兰爆发战争了”,虽然给了肯定的回复,但它知道的最近一场战争是发生在2014年,这说明它肯定不知道2022年的事情,这就放心了。



那就让它给咱选股票,开上帝视角来验证一下它的选股能力,WTF,神奇的事情发生了,它死活不肯选股,在它眼前挂萝卜都没用。



经过查阅资料得知,chatGPT是美国人工智能研究实验室OpenAI基于GPT-3.5( Generative Pre-Training,生成式预训练模型)生成的,较上一代版本有一个明显的改进就是,OpenAI提高了它的“安全性”,特别是禁止恐怖主义、暴力毒品、种族仇恨等言论相关的回应,看来投资这一块儿也被波及了,不让直接回应,开始慢慢吞吞说片汤话了。


那只好往前倒了,看来要找到安全性低、警惕性不高的chatGPT才行了,这时就想到了OpenAI提供的GPT-3的API接口,简单来说,chatGPT=GPT-3改进优化+chat场景属性,如果说chatGPT是pro max版本的话,那GPT-3就是se mini版了,用人话不严谨来说就是,GPT-3是低配丐版chatGPT。


来源:国泰君安《ChatGPT 研究框架(2023)》


国内的chatGPT镜像站刚好用的就是这个GPT-3接口(OpenAI还没有公开chatGPT的API接口),因为chatGPT在国内还不提供服务,要使用的话需要爬梯子和国外手机号接收注册验证码,非常滴麻烦,为方便国人使用,有些服务商就建立了chatGPT相关公众号/小程序给国人使用,接收用户的提问,然后调用这个接口,再把结果返回给用户,由于这0.5代之差,造成了很多人觉得国内的镜像站比官方chatGPT要笨一些。


笨一些就笨一些,总比新版不能用强啊,于是找了一个能用这个接口的chatGPT镜像站(下文统称为“chatGPT(镜像)”),先来确认一下训练数据集的截止日期,是2020年12月31日,连2021年的数据都没用上,没事儿,不妨碍做选股能力验证。



顺道儿核实一下有木有撒谎~



于是我就问它:从2020年12月31日到2023年2月10日,中国A股未来涨幅最大的3支股票是什么?


果真还是年轻同志实诚,一点都不来弯弯绕,一点都不扭捏,直接就给出了回复,这3支股票分别是中国平安、万科A和招商银行。



到底选的股票咋样,把这3支股票和基准沪深300指数的收益曲线画出来对比一下,这里面只有招商银行跑赢了基准,其余两个都跑输了,如果期初等权买入并持有,最终收益率是-26.89%,沪深300指数期间收益率是-21.20%,连同期基准都没有跑赢。



结果看上去令人失望啊,扩大到10支股票看看,它给咱选出了:中国平安、万科A、招商银行、中国石油、中国移动、浦发银行、建设银行、中国银行、中国建筑和中国人寿。



统计一下期间的每支股票的收益率,看上去还行,除了top1和top2拉胯之外,后面的3~10名都跑赢了基准,相当于选股胜率是80%,如果当初等权买入并持有,最终收益率是1.46%,想对基准大概有20%出头的收益。



细心的小伙伴可能发现了,在回复当中出现了股票名称和股票代码不对应的情况,中国石油括号中的代码是600028,而600028是中国石化的代码,中国石油的代码是601857,同样地,中国移动括号里的代码是00941,而00941是港股的代码,在A股的代码应该是600941(在提问当中已经强调了是“中国A股”)。


中国移动是在2022年1月5日在A股上市的,如果要剔除新股的影响,剩余9支股票的最终收益率是-2.96%,也是大幅跑赢基准。


看到股票名称和股票代码不对应的情况,这让我想到chatGPT是美国公司开发的模型,是一个老外模型,大部分数据应该都是英文语料,虽说是中国通吧,但应该更熟悉美股。


于是,针对美股进行提问,选3支未来涨幅最大的股票,于是它回复了苹果、微软和谷歌这3支股票。



忽然一想,不对哦,提问美股,应该是要用英文提问,于是将中文转为英文。



还好,选出来的还是这3支美股,将它们和基准标普500指数的走势画出来,除了谷歌小幅跑输标普500外,其余2支股票都跑赢了基准,如果期初等权买入并持有,最终收益率是14.80%,标普500指数期间收益率是8.90%,大概跑赢6%。



照例扩展到10支美股,它给咱选出了:苹果、微软、谷歌、亚马逊、特斯拉、英特尔、英伟达、美国银行、IBM和高盛。



统计一下期间的每个美股的收益率,10支股票里有6支股票跑赢了基准,相当于选股胜率是60%,如果当初等权买入并持有,最终收益率是10.23%,只是略微跑赢了基准,都不到2%的超额收益。



综合选股胜率和超额收益率,如果选3支股票,chatGPT(镜像)选股能力是美股好于A股,如果选10支股票,则是A股好于美股。


其实无论是A股还是美股,chatGPT(镜像)在这次试验中的选股能力表现,并没有大家想象的那么厉害,其中股票收益率最高能达到60%,但是也有大跌40%的股票,收益率最终都没能狂飙起来,可惜了~


最根本的原因,是因为GPT/chatGPT只是一个自然语言处理模型,一般只处理文本数据,例如文章、新闻、问答等,一般知名度、热度、讨论度越高的公司,模型可能就认为是越好,简单来说,GPT/chatGPT选股只参考了舆情层面,没有考虑到基本面和量价层面,因此会有偏颇,就如同炒股不能只看消息面。


而且,一般越大涨的股票,讨论度和热度就越高,模型就可能认为是越好,越容易被选出来,追高挂旗杆的风险往往更大。


因此,就目前来看,chatGPT的直接选股能力是缺陷比较大的,chatGPT官方选不了,chatGPT镜像站选不好,估计一时半会儿还替代不了量化从业者的工作,不过用来辅助宽客编程还是挺不错的。


等到人工智能AI除了舆情之外,还可以驾驭基本面和量价层面的时候,量化从业者就面临失业的风险了,希望到时候咱能学会如何掌控AI的威力。


重要提示:本文当中出现的具体个股,由chatGPT模型分析产生,仅用来验证模型选股能力,不作为任何投资建议。


往期回顾



------量化社群------

量化藏经阁Max

量化藏经阁2023

------量化策略------

聪明钱 TrendModelSys  张坤策略

RSRS 北向资金 F-Score 鱼身策略

TrendPattern 波动率收敛 RSJ策略

期货Alpha  跨品种套利 GARP策略

MACD形态  导数策略  Trendflex

绩优小市值  漂亮50  操盘手  Rumi

AI择时  K线面积法  零编程策略 

贴水策略 概率密度策略  量化兵器库

------心得杂谈------

年化577倍  抄底&摸顶  策略开发

量化入门  量化神作  量化书单  

个人量化  量化误解  高收入背后

未来函数 回测&过拟合 回测&实盘

Alpha&风险因子  MACD参数

资金流 吃贴水 回测提速 量价背离

自学路径  文章合辑  151个策略


Tip:点击关键字可以直接查看对应文章。


END

如果对本文有疑惑,或是想聊聊

亦或是围观朋友圈当点赞之交

点我,让我们一路同行

吃瓜吐槽写代码

(微信号:iquantman)

添加好友后,私信『666』

送你一些量化小福利

人工回复慢请见谅~


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存