利用chatGPT选了3支股票，验证未来收益率能否狂飙？

Original 量化君量化君也 2023-11-12

收录于合集 #量化交易 36个

chatGPT在去年11年30日发布，最近火遍全球，短短2个月就坐拥1亿越活用户，这是很多人始料未及的。

刚发布不久，闲暇的时候，就爬梯子去调戏一下，有时就会把chatGPT有趣的回答po到群里或发朋友圈，那时的最大感受就是，这种问答类AI终于人工智能，不再是人工智障了。

最近老听说chatGPT能顶替一大堆职业工作，作为一名宽客（Quant），就也想看看是不是也把量化投资从业者的工作来顶替了，周末闲暇心血来潮胡思乱想，就先测试一下这家伙的选股能力这么样。

因为chatGPT的算法模型非常烧钱，训练一次的综合成本就要几百上千万美元，所以训练数据集就不会是每天增量迭代更新的，简单来说，chatGPT是一个“离线版本”，不是“实时版本”，在模型训练完成后的事情肯定是不知道的，咱就让它预测之后发生的事情，就知道它的预测的能力怎么样了。

经过多次询问，chatGPT的训练集数据截止到2021年，确切是哪个日期就死活不肯说了，那咱就只好“想当然”认为是2021年12月31日了。

这家伙不会说谎吧？慎重一点，巧妙试探一下，问一下它“是否知道俄罗斯和乌克兰爆发战争了”，虽然给了肯定的回复，但它知道的最近一场战争是发生在2014年，这说明它肯定不知道2022年的事情，这就放心了。

那就让它给咱选股票，开上帝视角来验证一下它的选股能力，WTF，神奇的事情发生了，它死活不肯选股，在它眼前挂萝卜都没用。

经过查阅资料得知，chatGPT是美国人工智能研究实验室OpenAI基于GPT-3.5（ Generative Pre-Training，生成式预训练模型）生成的，较上一代版本有一个明显的改进就是，OpenAI提高了它的“安全性”，特别是禁止恐怖主义、暴力毒品、种族仇恨等言论相关的回应，看来投资这一块儿也被波及了，不让直接回应，开始慢慢吞吞说片汤话了。

那只好往前倒了，看来要找到安全性低、警惕性不高的chatGPT才行了，这时就想到了OpenAI提供的GPT-3的API接口，简单来说，chatGPT=GPT-3改进优化+chat场景属性，如果说chatGPT是pro max版本的话，那GPT-3就是se mini版了，用人话不严谨来说就是，GPT-3是低配丐版chatGPT。

来源：国泰君安《ChatGPT 研究框架（2023）》

国内的chatGPT镜像站刚好用的就是这个GPT-3接口（OpenAI还没有公开chatGPT的API接口），因为chatGPT在国内还不提供服务，要使用的话需要爬梯子和国外手机号接收注册验证码，非常滴麻烦，为方便国人使用，有些服务商就建立了chatGPT相关公众号/小程序给国人使用，接收用户的提问，然后调用这个接口，再把结果返回给用户，由于这0.5代之差，造成了很多人觉得国内的镜像站比官方chatGPT要笨一些。

笨一些就笨一些，总比新版不能用强啊，于是找了一个能用这个接口的chatGPT镜像站（下文统称为“chatGPT(镜像)”），先来确认一下训练数据集的截止日期，是2020年12月31日，连2021年的数据都没用上，没事儿，不妨碍做选股能力验证。

顺道儿核实一下有木有撒谎~

于是我就问它：从2020年12月31日到2023年2月10日，中国A股未来涨幅最大的3支股票是什么？

果真还是年轻同志实诚，一点都不来弯弯绕，一点都不扭捏，直接就给出了回复，这3支股票分别是中国平安、万科A和招商银行。

到底选的股票咋样，把这3支股票和基准沪深300指数的收益曲线画出来对比一下，这里面只有招商银行跑赢了基准，其余两个都跑输了，如果期初等权买入并持有，最终收益率是-26.89%，沪深300指数期间收益率是-21.20%，连同期基准都没有跑赢。

结果看上去令人失望啊，扩大到10支股票看看，它给咱选出了：中国平安、万科A、招商银行、中国石油、中国移动、浦发银行、建设银行、中国银行、中国建筑和中国人寿。

统计一下期间的每支股票的收益率，看上去还行，除了top1和top2拉胯之外，后面的3~10名都跑赢了基准，相当于选股胜率是80%，如果当初等权买入并持有，最终收益率是1.46%，想对基准大概有20%出头的收益。

细心的小伙伴可能发现了，在回复当中出现了股票名称和股票代码不对应的情况，中国石油括号中的代码是600028，而600028是中国石化的代码，中国石油的代码是601857，同样地，中国移动括号里的代码是00941，而00941是港股的代码，在A股的代码应该是600941（在提问当中已经强调了是“中国A股”）。

中国移动是在2022年1月5日在A股上市的，如果要剔除新股的影响，剩余9支股票的最终收益率是-2.96%，也是大幅跑赢基准。

看到股票名称和股票代码不对应的情况，这让我想到chatGPT是美国公司开发的模型，是一个老外模型，大部分数据应该都是英文语料，虽说是中国通吧，但应该更熟悉美股。

于是，针对美股进行提问，选3支未来涨幅最大的股票，于是它回复了苹果、微软和谷歌这3支股票。

忽然一想，不对哦，提问美股，应该是要用英文提问，于是将中文转为英文。

还好，选出来的还是这3支美股，将它们和基准标普500指数的走势画出来，除了谷歌小幅跑输标普500外，其余2支股票都跑赢了基准，如果期初等权买入并持有，最终收益率是14.80%，标普500指数期间收益率是8.90%，大概跑赢6%。

照例扩展到10支美股，它给咱选出了：苹果、微软、谷歌、亚马逊、特斯拉、英特尔、英伟达、美国银行、IBM和高盛。

统计一下期间的每个美股的收益率，10支股票里有6支股票跑赢了基准，相当于选股胜率是60%，如果当初等权买入并持有，最终收益率是10.23%，只是略微跑赢了基准，都不到2%的超额收益。

综合选股胜率和超额收益率，如果选3支股票，chatGPT(镜像)选股能力是美股好于A股，如果选10支股票，则是A股好于美股。

其实无论是A股还是美股，chatGPT(镜像)在这次试验中的选股能力表现，并没有大家想象的那么厉害，其中股票收益率最高能达到60%，但是也有大跌40%的股票，收益率最终都没能狂飙起来，可惜了~

最根本的原因，是因为GPT/chatGPT只是一个自然语言处理模型，一般只处理文本数据，例如文章、新闻、问答等，一般知名度、热度、讨论度越高的公司，模型可能就认为是越好，简单来说，GPT/chatGPT选股只参考了舆情层面，没有考虑到基本面和量价层面，因此会有偏颇，就如同炒股不能只看消息面。

而且，一般越大涨的股票，讨论度和热度就越高，模型就可能认为是越好，越容易被选出来，追高挂旗杆的风险往往更大。

因此，就目前来看，chatGPT的直接选股能力是缺陷比较大的，chatGPT官方选不了，chatGPT镜像站选不好，估计一时半会儿还替代不了量化从业者的工作，不过用来辅助宽客编程还是挺不错的。