自由微信 | FreeWeChat

这小姐到底啥背景，大圣你何必问那么细？

台湾学生自制“解放军部署地图”，曝光2000个中国大陆军事设施

国家安全局副局长8年内杀4人，3人被碎尸，被执行死刑！

四个恶魔折磨新婚夫妇长达八小时，费县“5·15”惨案告破!

喇嘛教用宋朝理宗皇帝的头骨作法器——被诅咒的帝国

s1推理模型=数据筛选+推理预算强制，也提醒大家不要进入思维误区

2025年2月7日

Qwen2.5-VL系列模型正式开源，千问永远不会让你失望 | 附实测结果

2025年1月28日

推荐 | LLMs-from-scratch中文项目 - 从零构建大模型

2025年1月26日

看DeepSeek R1的论文时，我突然想起了AlphaGo

2025年1月25日

学以致用 | 被早餐店老板坑了1块钱后，用大模型做了个早餐防骗算价器

2025年1月24日

Deepseek-R1 & Kimi-1.5读后有感 | 大道至简的o1

2025年1月23日

回顾 LLM 领域的一些热词，哪些你不知道？

2025年1月22日

Kimi发布最新模型k1.5，技术报告也干货满满

2025年1月21日

Agent的亲身经历，从开始到放弃

2025年1月20日

开源多模态大模型是红绿色盲吗？

2025年1月16日

实测书生系列开源的最新模型-InternLM3-8B

2025年1月15日

千问又开源啦，开源过程奖励模型-Qwen2.5-Math-PRM

2025年1月14日

RLHF 常见的思维误区

2025年1月13日

Search-o1：赋予推理模型主动搜索的能力

2025年1月10日

从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码

2025年1月9日

LLM实战系列 | 大模型的多Lora部署，将显存节省到极致

2025年1月8日

如何让 RLHF 训练更稳定？

2025年1月7日

长文 | 大模型Post-Training总结

2025年1月2日

微软论文爆出GPT-4o参数为200B，而GPT-4o-mini 只有8B参数

2025年1月1日

LLM 预训练到头了吗？

2025年1月1日

回顾2024：与LLM又相伴一年的经历与思考

2024年12月31日

多模态大模型在表格解析任务上效果如何？亲身经历全是泪！

2024年12月26日

QVQ-72B，如期而至！继QWQ后，通义千问又开源视觉推理大模型！

2024年12月25日

LLM 又过了一年！！！

2024年12月24日

技术人该积累什么，才能避免被AI淘汰？

2024年12月23日

对OpenAI o3模型的看法、思考与反思

2024年12月22日

实测！最新端侧全模态大模型Megrez-3B-Omni

2024年12月16日

聊聊对强化微调（RFT）的理解及看法

2024年12月13日

一道涉及数学、生物、伦理的AI测试题，来测测各家大模型的推理能力

2024年12月6日

长文 | RAG的实战指南及探索之路

2024年12月3日

瞎聊: SFT模型为何不如Pretrain模型

2024年11月29日

该来的还是会来，Qwen团队开源推理大模型-QwQ！！！

2024年11月28日

测测Kimi新开的k0-math，你是数学模型，但我就测文本

2024年11月26日

凑个热闹，测试一波DeepSeek新上的o1推理模型

2024年11月21日

聊一聊做角色扮演大模型的经验

2024年11月20日

LLM实践系列-详聊OpenRLHF中的各种Loss

2024年11月19日

LLM实践系列-聊聊大模型SFT的数据清洗过程有多繁琐？

2024年11月18日

LLM实践系列—大模型的拒绝采样2

2024年11月8日

实测腾讯开源的Hunyuan-Large大模型，感觉。。。

2024年11月5日

面向中文有害表情包（meme）的综合性检测

2024年10月30日

OpenAI-O1之下，我们技术该何去何从

2024年10月28日

CartesianMoE：通过笛卡尔积路由提升专家间的知识共享

2024年10月25日

LLM实践系列-拯救Continue Pretrain的数据

2024年10月18日

LLM实践系列-详谈Tokenizer训练细节

2024年10月15日

LLM实践系列-数据去重之Simhash&Minhash分析与实现

2024年10月14日

CodePMP：提升LLM推理能力的可扩展偏好模型预训练

2024年10月12日

全是细节 | 聊一聊做SFT的经验

2024年10月8日

Llama3.2开源：Meta发布1B和3B端侧模型、11B和90B多模态模型

2024年9月26日

全是细节 | 聊一聊做Pretrain的经验

2024年9月24日

Quest：一种以查询为中心的长文本数据合成方法

2024年9月23日