首页
PATREON
提交文章
关于我们
🔥 热搜 🔥
1
潘石屹
2
我的反思
3
记忆承载
4
百度
5
今日热点
6
微信公众平台
7
贴吧
8
opgg
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
潘石屹
2
我的反思
3
记忆承载
4
百度
5
今日热点
6
微信公众平台
7
贴吧
8
opgg
分类
社会
娱乐
国际
人权
科技
经济
其它
这小姐到底啥背景,大圣你何必问那么细?
台湾学生自制“解放军部署地图”,曝光2000个中国大陆军事设施
国家安全局副局长8年内杀4人,3人被碎尸,被执行死刑!
四个恶魔折磨新婚夫妇长达八小时,费县“5·15”惨案告破!
喇嘛教用宋朝理宗皇帝的头骨作法器——被诅咒的帝国
筛选:
全部
仅被删
排序:
热门
实时
其他
s1推理模型=数据筛选+推理预算强制,也提醒大家不要进入思维误区
2025年2月7日
其他
Qwen2.5-VL系列模型正式开源,千问永远不会让你失望 | 附实测结果
2025年1月28日
其他
推荐 | LLMs-from-scratch中文项目 - 从零构建大模型
2025年1月26日
其他
看DeepSeek R1的论文时,我突然想起了AlphaGo
2025年1月25日
其他
学以致用 | 被早餐店老板坑了1块钱后,用大模型做了个早餐防骗算价器
2025年1月24日
其他
Deepseek-R1 & Kimi-1.5读后有感 | 大道至简的o1
2025年1月23日
其他
回顾 LLM 领域的一些热词,哪些你不知道?
2025年1月22日
其他
Kimi发布最新模型k1.5,技术报告也干货满满
2025年1月21日
其他
Agent的亲身经历,从开始到放弃
2025年1月20日
其他
开源多模态大模型是红绿色盲吗?
2025年1月16日
其他
实测书生系列开源的最新模型-InternLM3-8B
2025年1月15日
其他
千问又开源啦,开源过程奖励模型-Qwen2.5-Math-PRM
2025年1月14日
其他
RLHF 常见的思维误区
2025年1月13日
自由知乎
自由微博
其他
Search-o1:赋予推理模型主动搜索的能力
2025年1月10日
其他
从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码
2025年1月9日
其他
LLM实战系列 | 大模型的多Lora部署,将显存节省到极致
2025年1月8日
其他
如何让 RLHF 训练更稳定?
2025年1月7日
其他
长文 | 大模型Post-Training总结
2025年1月2日
其他
微软论文爆出GPT-4o参数为200B,而GPT-4o-mini 只有8B参数
2025年1月1日
其他
LLM 预训练到头了吗?
2025年1月1日
其他
回顾2024:与LLM又相伴一年的经历与思考
2024年12月31日
其他
多模态大模型在表格解析任务上效果如何?亲身经历全是泪!
2024年12月26日
其他
QVQ-72B,如期而至!继QWQ后,通义千问又开源视觉推理大模型!
2024年12月25日
其他
LLM 又过了一年!!!
2024年12月24日
其他
技术人该积累什么,才能避免被AI淘汰?
2024年12月23日
其他
对OpenAI o3模型的看法、思考与反思
2024年12月22日
其他
实测!最新端侧全模态大模型Megrez-3B-Omni
2024年12月16日
其他
聊聊对强化微调(RFT)的理解及看法
2024年12月13日
其他
一道涉及数学、生物、伦理的AI测试题,来测测各家大模型的推理能力
2024年12月6日
其他
长文 | RAG的实战指南及探索之路
2024年12月3日
其他
瞎聊: SFT模型为何不如Pretrain模型
2024年11月29日
其他
该来的还是会来,Qwen团队开源推理大模型-QwQ!!!
2024年11月28日
其他
测测Kimi新开的k0-math,你是数学模型,但我就测文本
2024年11月26日
其他
凑个热闹,测试一波DeepSeek新上的o1推理模型
2024年11月21日
其他
聊一聊做角色扮演大模型的经验
2024年11月20日
其他
LLM实践系列-详聊OpenRLHF中的各种Loss
2024年11月19日
其他
LLM实践系列-聊聊大模型SFT的数据清洗过程有多繁琐?
2024年11月18日
其他
LLM实践系列—大模型的拒绝采样2
2024年11月8日
其他
实测腾讯开源的Hunyuan-Large大模型,感觉。。。
2024年11月5日
其他
面向中文有害表情包(meme)的综合性检测
2024年10月30日
其他
OpenAI-O1之下,我们技术该何去何从
2024年10月28日
其他
CartesianMoE:通过笛卡尔积路由提升专家间的知识共享
2024年10月25日
其他
LLM实践系列-拯救Continue Pretrain的数据
2024年10月18日
其他
LLM实践系列-详谈Tokenizer训练细节
2024年10月15日
其他
LLM实践系列-数据去重之Simhash&Minhash分析与实现
2024年10月14日
其他
CodePMP:提升LLM推理能力的可扩展偏好模型预训练
2024年10月12日
其他
全是细节 | 聊一聊做SFT的经验
2024年10月8日
其他
Llama3.2开源:Meta发布1B和3B端侧模型、11B和90B多模态模型
2024年9月26日
其他
全是细节 | 聊一聊做Pretrain的经验
2024年9月24日
其他
Quest:一种以查询为中心的长文本数据合成方法
2024年9月23日
{{{deleted_alert}}}
{{classification}}
{{{title}}}
{{{preview}}}
{{nickname}}
{{ct}}
更多