首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
上海
2
习近平
3
新疆
4
鄂州父女瓜
5
乌鲁木齐
6
疫情
7
H工口小学生赛高
8
习明泽
9
芊川一笑图包
10
印尼排华
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
刑讯逼供、管辖异议,唐山杨立国涉黑案争议
大瓜!找工作太难了:私募大佬白嫖95后小姐姐事件刷屏!
深度 |台积电断供大陆芯片,任正非罕见感谢特朗普,美霸权摇摇欲坠
福建一地公示!1989年出生的她,拟提任正处
马斯克:不新生毋宁死!
筛选:
全部
仅被删
排序:
热门
实时
被用户删除
其他
PiSSA方法 | 仅修改Lora初始化方式显著提高模型微调效果
该内容被自由微信恢复
4月7日 上午 10:00
其他
InternLM2技术报告
4月2日 上午 12:00
其他
Qwen1.5-MoE模型:2.7B的激活参数量达到7B模型的性能
3月29日 上午 3:17
其他
RAG与Long-Context之争—没必要争
3月25日 下午 9:21
其他
"NLP工作站"成立技术交流3群
3月15日 下午 6:18
其他
角色扮演大模型的碎碎念
3月13日 下午 11:30
其他
自我蒸馏方法-减轻大模型微调过程中的灾难性遗忘
3月12日 上午 12:01
其他
Yi技术报告细节分享
3月8日 下午 10:30
其他
大模型增量预训练新技巧-解决灾难性遗忘
1月24日 上午 12:00
其他
如何提高LLMs的文本表征(Text Embedding)能力?
1月8日 上午 9:09
其他
DEITA-大模型指令微调的数据高效筛选方法
1月4日 上午 8:08
其他
1-2B参数规模大模型使用心得及模型汇总
2023年12月21日
其他
大模型微调技巧 | 高质量指令数据筛选方法-MoDS
2023年12月8日
自由知乎
自由微博
其他
辟谣!微软撤回声称ChatGPT为20B参数的论文,并给出解释。
2023年11月2日
其他
如何看待微软最新论文揭秘ChatGPT参数量只有20B?
2023年10月31日
其他
大模型下载使我痛苦
2023年10月23日
其他
大模型微调技巧-在Embeeding上加入噪音提高指令微调效果
2023年10月18日
其他
通义千问-Qwen技术报告细节分享
2023年9月26日
其他
如何从数据集中自动识别高质量的指令数据-IFD指标的使用
2023年9月24日
其他
BaiChuan2技术报告细节分享&个人想法
2023年9月16日
其他
如何更好地继续预训练(Continue PreTraining)
2023年9月9日
其他
妙鸭相机的爆火带给想做产品的技术人员的一些启示
2023年8月9日
其他
领域大模型-训练Trick&落地思考
2023年8月8日
其他
大模型LLM微调经验总结&项目更新
2023年8月6日
其他
“NLP工作站”成立技术交流2群
2023年8月2日
其他
浅谈LLM的长度外推
2023年7月26日
其他
打造LLM界的Web UI:24GB显卡训练百亿大模型
2023年7月25日
其他
是我们在训练大模型,还是大模型在训练我们?
2023年7月22日
其他
“NLP工作站”成立技术交流群
2023年7月22日
其他
Llama2技术细节&开源影响
2023年7月20日
其他
大模型时代-行业落地的再思考
2023年7月17日
其他
大模型幻觉问题调研-LLM Hallucination Survey
2023年7月11日
其他
垂直领域大模型的一些思考及开源模型汇总
2023年7月10日
其他
LLMs评估综述-A Survey on Evaluation of Large Language Models
2023年7月7日
其他
阿里「通义千问」大模型-内测分享
2023年4月8日
其他
CORGI-PM:首个中文性别偏见探索和缓解数据集
2023年2月6日
其他
AAAI2023 | 基于统一语义匹配的通用信息抽取框架-USM
2023年1月13日
其他
清华开源了1300亿开源的双语预训练模型-GLM-130B
2022年8月5日
其他
IJCAI2022 | DictBert:采用对比学习的字典描述知识增强的预训练语言模型
2022年8月4日
其他
中文NER据集整理
2022年6月16日
其他
ACL2022 | NoisyTune:微调前加入少量噪音可能会有意想不到的效果
2022年6月3日
其他
ACL2022论文分类汇总-Prompt、句子表征、检索排序&摘要
2022年5月25日
其他
总结|Prompt在NER场景的应用
2022年5月22日
其他
NAACL2022-Prompt相关论文&对Prompt的看法
2022年5月10日
其他
PolyLoss:一种将分类损失函数加入泰勒展开式的损失函数
2022年5月7日
其他
PERT:一种基于乱序语言模型的预训练模型
2022年5月5日
其他
DiffCSE:结合句子间差异的无监督句子嵌入对比学习方法
2022年4月29日
其他
OpenAI:基于对比学习的预训练文本&代码表征技术
2022年2月19日
其他
PairSCL:句子对级别的有监督对比学习方法
2022年2月4日
其他
COLD:中文冒犯性语言检测数据集
2022年2月1日
{{{deleted_alert}}}
{{classification}}
{{{title}}}
{{{preview}}}
{{nickname}}
{{ct}}
更多