查看原文
其他

如何打造一个拖垮公司的大模型?

小黑羊 特大号 2023-09-21
今年大模型实在太火
如何打造一个拖垮公司的大模型?
不多不少,一共分10步


做大模型,要有大格局

舍不得孩子套不着狼



什么X100、Y100…
专挑算力强的买


正规渠道没货了?
不能怂!加价也要整起来







必须是业界扛把子级别的大牛
就职于顶流AI公司比如“CloseAI”
经常在各种会议上高光出镜的那种




能把整个团队都带过来最好
成建制、好管理、出活儿快







模型参数至少要万亿级别
当不成卷王,就只能被卷死




再来个「智算中心」
算力至少达要1000PFLOPS
自己训练完大模型
还能把算力开放出来给同行






数据不够怎么整?
公开一部分,自有一部分,交易一部分





拿到数据后,得清洗处理
全体动员做标注
老板亲自下场,主打一个陪伴






服务器挂了,存储速度跟不上了
跨卡性能不行、梯度消失、梯度爆炸....



什吗?!Checkpoints没保存?
反复回退,反复调参,反复排雷






问题一多,团队就乱了
人都变得很浮躁



公司原有的主营业务
停滞不前,业绩下滑







我们来了
广告要全渠道、全媒体覆盖



必须要业界感知到
我们来势汹汹的霸气







先结盟5000家合作伙伴
达成意向合作



第二天
大家联合发发新闻稿
必须让吃瓜群众充满期待






练是练出来了
看上去有点不对劲
莫不是个“大傻子”吧




落地实施,那叫一个难
不知道给谁用,不知道往哪儿用









然后开始复盘
多么痛的领悟


大牛来了又走了
算力卡买了又卖了
智算中心建了又拆了
大模型炼了又废了







短视频版












您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存