查看原文
其他

如何打造一个拖垮公司的大模型?

以下文章来源于特大号 ,作者小黑羊

今年大模型实在太火
如何打造一个拖垮公司的大模型?
不多不少,一共分10步


做大模型,要有大格局

舍不得孩子套不着狼



什么X100、Y100…
专挑算力强的买


正规渠道没货了?
不能怂!加价也要整起来







必须是业界扛把子级别的大牛
就职于顶流AI公司比如“CloseAI”
经常在各种会议上高光出镜的那种




能把整个团队都带过来最好
成建制、好管理、出活儿快







模型参数至少要万亿级别
当不成卷王,就只能被卷死




再来个「智算中心」
算力至少达要1000PFLOPS
自己训练完大模型
还能把算力开放出来给同行






数据不够怎么整?
公开一部分,自有一部分,交易一部分





拿到数据后,得清洗处理
全体动员做标注
老板亲自下场,主打一个陪伴






服务器挂了,存储速度跟不上了
跨卡性能不行、梯度消失、梯度爆炸....



什吗?!Checkpoints没保存?
反复回退,反复调参,反复排雷






问题一多,团队就乱了
人都变得很浮躁



公司原有的主营业务
停滞不前,业绩下滑







我们来了
广告要全渠道、全媒体覆盖



必须要业界感知到
我们来势汹汹的霸气







先结盟5000家合作伙伴
达成意向合作



第二天
大家联合发发新闻稿
必须让吃瓜群众充满期待






练是练出来了
看上去有点不对劲
莫不是个“大傻子”吧




落地实施,那叫一个难
不知道给谁用,不知道往哪儿用









然后开始复盘
多么痛的领悟


大牛来了又走了
算力卡买了又卖了
智算中心建了又拆了
大模型炼了又废了







短视频版








    模型、算法、模型结构、数据模型、训练到底是不是一回事?看这里就对了!2942

    图解 72 个机器学习基础知识点

    对话即数据分析,网易数帆ChatBI做到了

    中国最容易和最难被GPT所代替的TOP25职业!

    ChatGPT最强插件Code interpreter,让没技术背景的业务人员都能轻松分析数据!

    GPT时代的程序员生存之道

    查看全部文章


    点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶


继续滑动看下一个
与数据同行
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存