DataFunTalk

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

年监禁或百万美元罚款！OpenAI发布新Agent，用于深度研究，实测成色如何？数据智能体的构建与优化滚烫Deepseek一夜刀掉英伟达4万亿，除夕开源多模态新模型：7B超越DALL-E

2025年2月9日

阿里数据治理进化论：基于瓴羊Dataphin的多引擎兼容与统一资产消费实践

作者：江岚阿里云瓴羊智能科技高级技术专家随着十四五“数字中国”规划的不断深入，我国企业对数据治理和数据资产建设的广阔需求依然亟待激活。不过，由于数据分析领域长期处于高速发展阶段，加上国内参差不齐的供给现状，“看不懂”、“跟不上”、“学不会”、“用不起”仍是大多数企业的真实感受。从ELT、Data

2025年1月15日

其他

谷歌CEO : 大模型的低垂果实已经被摘完了，如何挖掘大模型的剩余价值？

的招聘策略？你们是否因此调整了未来的招聘计划？Sundar：首先，我需要澄清一点：人类仍然在编写代码，AI系统主要是提供代码建议。在提交的代码中，大约

2024年12月24日

其他

面向未来的数据智能平台，腾讯云TCHouse-X正式发布

“有数据的地方不一定有模型，但是在有模型的地方一定数据”，在大模型时代，大数据技术的发展迎来了全新的构建范式。12月12日，腾讯云宣布发布全新一代数据智能平台TCHouse-X，随着企业IT架构向以数据为核心的转变，大数据和大模型的融合成为形成新质IT生产力的关键。腾讯云副总裁黄世飞表示：“腾讯云推出全新一代的数据智能平台，致力于为企业提供灵活易用的数据处理体验，帮助企业打造面向未来技术发展的数据基础设施。”TCHouse-X：简化复杂架构，提升数据处理能力腾讯云大数据基础产品中心总经理程彬介绍，TCHouse-X采用一体化、智能化、高性能、云原生等理念打造，大幅简化了传统数据平台的复杂架构，并引入了智能化系统交互、资源管理与运维管理能力。这一平台能够为大模型时代的应用创新提供一站式数据处理能力，助力企业高效释放数据价值。架构设计的突破在架构设计层面，TCHouse-X通过一体化的架构设计，实现了云原生多集群共享数据及元数据管理，打破了传统数据平台在离线计算、在线计算和AI开发之间的壁垒。用户可以基于同一份数据运行在线分析、离线处理、数据湖探索和机器学习等多种业务负载，无需在不同的系统间切换和数据的拷贝搬迁，实现AI、BI和Data在一个平台上开发和共建。性能与效率的双重优化在性能层面，TCHouse-X基于腾讯云自研核心引擎技术，在计算、存储、网络等多维度优化，能够为用户提供全链路极致性能。在效率层面，TCHouse-X能够支持实时加工处理源头数据，配合毫秒级的在线分析，能够助力企业抢占市场先机。智能化的系统交互与资源管理在智能化层面，TCHouse-X能够通过智能化的系统交互、资源管理与运维管理功能，显著提升易用性与运维效率。以资源管理为例，TCHouse-X还具备AI智能调度系统，能够实时感知负载并智能规划资源，从而提高计算资源的利用率。弹性策略与成本效益同时，TCHouse-X支持多种弹性策略，无论是应对突发流量高峰还是处理大规模查询，都能有效帮助企业实现资源的灵活配置，降低成本并提高效率。根据测算，TCHouse-X的在线查询性能优于市场同类产品50%，而离线批处理的综合性价比则提升了10倍之多。在计算资源层面，采用TCHouse-X，企业计算资源成本最高也能降低50%。实际应用与市场表现目前，TCHouse-X已在大模型AIGC应用、车联网数据平台等业务的在线分析、离线数据处理、日志分析、数据科学与机器学习等场景提供了高效、稳定的数据分析支持。以腾讯会议为例，采用TCHouse-X后，其典型事件漏斗分析耗时从近百秒降低至几秒，性能最高提升近10倍。TCHouse-X的发布，不仅是腾讯云在大数据领域的一次技术飞跃，更是企业数据基础设施建设的一个重要里程碑。它将帮助企业构建面向未来的技术发展，以数据为核心，实现大数据和大模型的深度融合，释放数据的无限潜力。随着技术的不断成熟和市场的不断拓展，TCHouse-X将成为企业拥抱AI时代、提升核心竞争力的重要平台。未来，随着更多的行业案例和应用场景的落地，TCHouse-X将展现出更加强大的潜力，帮助企业更加灵活地应对市场变化，以数据驱动决策，加速创新，赢得竞争优势。为了更好的对腾讯云大数据产品做深入了解，

2024年12月16日

其他

腾讯基于 RAG 和 Agent 技术的混元大模型业务落地实践

在本篇文章中，我们将深入探讨腾讯大语言模型在多个业务场景中的应用，特别是如何通过前沿技术提升模型的智能化与用户体验。首先介绍腾讯大模型的广泛应用场景，如内容生成、智能客服和角色扮演等，并详细解析

2024年12月10日

其他

Blaze：快手自研 Spark 向量化引擎从生产实践到社区开源

向量化引擎的研发和维护，曾任职于百度、滴滴、蚂蚁集团等一线互联网公司，对大数据技术体系有较丰富的经验。往期推荐数势科技结构化与非结构化数据高效融合技术实践重磅！北大联合字节VAR模型获NeurIPS

2024年12月6日

其他

数势科技结构化与非结构化数据高效融合技术实践

数势科技结构化与非结构化数据高效融合技术实践B站大数据任务基于Volcano的云原生调度实践唯品会异构资源池任务编排实践知乎云原生调度系统实践探秘

2024年12月5日

其他

重磅！北大联合字节VAR模型获NeurIPS 2024最佳论文：改写图像生成的未来范式

世界“任意门”平安人寿ChatBI：大模型智能化报表的深度实践京东零售推荐系统可解释能力详解强化学习之父Sutton最新万字采访：炮轰深度学习只是瞬时学习，持续学习才是智能突破的关键豆包

2024年12月5日

其他

阿里巴巴数据消费场景AI Agent实践

的方式最为高效和准确，因为它能直接从用户的自然语言映射到最终的操作指令。（2）瓴羊产品的发展历程并非从零开始，它需要兼容内部已有的多种历史产品和技术体系，同时也要适应外部客户多样性的需求，因此开发了

2024年12月4日

其他

李飞飞「世界实验室」重磅推出 AI“造物主”：一张图片生成 3D 世界“任意门”

AI归因产品探索实践平安人寿ChatBI：大模型智能化报表的深度实践京东零售推荐系统可解释能力详解强化学习之父Sutton最新万字采访：炮轰深度学习只是瞬时学习，持续学习才是智能突破的关键豆包

2024年12月3日

其他

1688 AI归因产品探索实践

深度强化学习在游戏AI中的应用与挑战社交媒体数据在智能营销中的应用实践强化学习在自动驾驶技术中的最新进展AIGA决策大模型的架构设计与优化AIGA决策大模型在金融风险管理中的实践观远数据ChatBI智能分析实践跨领域知识融合在AIGA决策中的应用DataFun

2024年12月2日

其他

平安人寿ChatBI：大模型智能化报表的深度实践

技术用于提高准确率，大模型在进行语义解析后会调用知识库进行检索，然后用这些知识进行文本和数据的语义分析和生成，从而大幅提高准确率。知识库分为常见知识库和进阶知识库，常见知识库包含常见名词、知识和

2024年12月2日

其他

京东零售推荐系统可解释能力详解

本文导读本文将介绍可解释能力在京东零售推荐系统中的应用实践。主要内容包括以下几大部分：推荐系统可解释定义、系统架构、排序可解释、模型可解释、流量可解释。01

2024年12月1日

其他

黑灰产攻防战技术难点和应对方案

跨模态通用视觉内容安全审核技术揭秘图像领域的黑灰产攻防战中小微企业B2B跨境贸易风控实践大模型技术在海量业务场景的低成本落地实战DataFun

2024年11月30日

其他

强化学习之父Sutton最新万字采访：炮轰深度学习只是瞬时学习，持续学习才是智能突破的关键

年人工智能发展报告总结滴滴ChatBI技术实践：智能数据分析的前沿探索与应用谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》建议每个人都要读一遍火山引擎基于大模型

2024年11月30日

其他

观远数据ChatBI：加速数据驱动的敏捷决策实践

深度强化学习在游戏AI中的应用与挑战社交媒体数据在智能营销中的应用实践强化学习在自动驾驶技术中的最新进展AIGA决策大模型的架构设计与优化AIGA决策大模型在金融风险管理中的实践观远数据ChatBI智能分析实践跨领域知识融合在AIGA决策中的应用DataFun

2024年11月29日

其他

豆包 MarsCode 落地编程助手场景的探索实践

年人工智能发展报告总结滴滴ChatBI技术实践：智能数据分析的前沿探索与应用谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》建议每个人都要读一遍火山引擎基于大模型

2024年11月29日

其他

从 ETL 到 NoETL 的数据架构演进——Denodo 的创新解决方案

概念的产生源于实际需求。从数据使用困境来看，传统的数仓和数据复制搬移集成方式在面对企业数字化转型过程中的新需求时显得力不从心。例如，业务部门提出的一次性问题或基于外部趋势的临时性分析需求，通过传统

2024年11月28日

其他

B站大数据任务基于Volcano的云原生调度实践

B站大数据任务基于Volcano的云原生调度实践唯品会异构资源池任务编排实践知乎云原生调度系统实践探秘

2024年11月27日

其他

蔚来汽车RAG在智能化领域的创新应用

数据分析和AI能力在汽车制造领域的创新和应用蔚来知识平台智能化实践大模型和知识图谱双轮驱动的汽车制造业知识服务车企ChatBI如何高效落地人工智能在汽车制造上的落地应用探讨DataFun

2024年11月26日

其他

Flink 2.0：史上最大更新解读

1.0发布以来，这将是该框架经历的最大规模更新之一。他们将深入解析这一里程碑式版本所带来的技术创新点，以及这些变化对当前大数据处理乃至人工智能领域可能产生的长远影响。《Paimon

2024年11月26日

其他

蚂蚁大模型推理之显存优化探索实践

探索更快速的GPU训练的分布式缓存技术飞桨新一代框架技术创新与实践AI大模型的挑战与系统优化实践MNN在端侧大模型部署上的探索实践华为翻译的推理实践NVIDIA

2024年11月25日

其他

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

模型是否会用尽数据AI模型的发展依赖于大量数据，但有担忧表示，计算机科学家可能很快就会用尽高质量数据。尽管合成数据可以缓解这一问题，但使用合成数据训练的模型可能会出现性能下降。2.4

2024年11月25日

其他

滴滴ChatBI技术实践：智能数据分析的前沿探索与应用

的架构中，我们依然保留了这一层，因为它确实为我们提供了一些必要的帮助和支持。以上就是本次分享的内容，谢谢大家。分享嘉宾INTRODUCTION王涛滴滴产研负责人王涛，滴滴数据平台产研负责人，2018

2024年11月24日

其他

谷歌科学家万字长文：《改变你职业生涯的一篇文章，我如何运用人工智能完成工作》建议每个人都要读一遍

{尽管这对我几乎是自然的，但到目前为止，我已经花了超过一半的生活时间在Emacs上变得足够熟练，以至于这成为了自然反应。但你知道现在我连接了LLM到我的编辑器，我会怎么做吗？C-h

2024年11月23日

其他

MNN在端侧大模型部署上的探索实践｜知识图谱实体版免费领取

基础软件架构的最新趋势与挑战。感兴趣的小伙伴欢迎识别二维码免费报名，现在起邀请好友一同观看，即可免费领取《知识图谱知识地图》实体书，数量有限，先到先得！五步教您如何邀请1.

2024年11月22日

其他

火山引擎基于大模型 ChatBI 的演进与实践

与大模型的结合展现出了全新的发展方向。在数据准备阶段，该工具充分利用大模型的能力，实现了指标维度的智能识别、描述备注的自动填充以及字段表达式的智能生成。此外，针对研发视角的数据准备工作，火山引擎

2024年11月22日

其他

AI改变工作：一天内打造专属于你自己的RAG

Generation）技术正在重塑我们的工作方式。本文将带您深入了解四个关键的AI工具和平台，它们可以帮助您在一天之内构建起专属的RAG系统，从而提升工作效率和智能决策能力。全文目录：1.

2024年11月21日

其他

多智能体系统（OpenAI Swarm）的可观测性研究实践

探索更快速的GPU训练的分布式缓存技术飞桨新一代框架技术创新与实践AI大模型的挑战与系统优化实践MNN在端侧大模型部署上的探索实践华为翻译的推理实践NVIDIA

2024年11月20日

其他

京东数据架构解析：供应链效率提升与决策优化策略

要求低的，其可以配置不同的数据加速策略以使用不同的成本满足不同的业务诉求）；我理解上述问题主要涉及到的是第三部分，先回答数据加速结果不是存储到缓存中（这里的缓存主要指的是数据服务链路使用的缓存，比如

2024年11月20日

其他

大模型推理之显存优化探索实践

探索更快速的GPU训练的分布式缓存技术飞桨新一代框架技术创新与实践AI大模型的挑战与系统优化实践MNN在端侧大模型部署上的探索实践华为翻译的推理实践NVIDIA

2024年11月19日

其他

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

Ng是AI民主化和普惠性的坚定主义者，一直从事让AI教育平民化工作，对AI发展趋势的判断具有很强的前瞻性。一起看看他对未来LLM发展方向的思考和判断吧。他的核心观点是，认为

2024年11月19日

其他

蚂蚁集团、网商银行统一动态纠偏框架，非随机缺失问题优化新视角

L_Est，大量的方法追求无偏估计或者追求估计方差的减少，再或者通过手动设计估计器来实现偏差和方差的简单折衷。本工作我们发现一般形式的估计器存在如下的局限性：对于一般形式的估计器

2024年11月18日

其他

打破数据访问壁垒：Alluxio在AI/ML场景中的应用与实践

在当今这个人工智能飞速发展的时代，诸多企业正站在一个充满挑战与机遇的路口。随着AI模型训练的热潮不断升温，企业在追求更高性能计算的同时，也不得不面对GPU资源紧张、模型部署缓慢以及存储成本失控等问题。这些问题不仅加剧了技术团队的工作压力，也对企业的业务发展和市场竞争力构成了严峻考验。为了应对企业面临的挑战，助力各个大模型在“百模大战”中“顽强存活”并获得竞争优势，Alluxio整合5大AI应用企业实战经验，推出《Alluxio助力AI模型训练加速宝典

2024年11月17日

其他

大模型时代下的私有数据安全与利用

splitNN，的架构下，模型的中间计算结果或某一方的模型中间输出则作为被传递的知识。最新的研究还包括仅传输每个分类类别的原型，即表征的平均值，作为应对多类抑制数据联合训练的共享知识。在模型仅提供

2024年11月17日

其他

国内数据编织需求调查报告！

国内主要用哪些类型的数据源？国内数据管理面临的挑战和需求有哪些？国内主要使用了哪些系统软件？国内主要应用了哪些大模型进行落地？国内哪些低代码平台最受欢迎？近期，数据管理领导者

2024年11月15日

其他

通过LLMOps实现生成式AI应用运营化实践

编译器与AI芯片的协同设计编译器在MLOps中的作用和集成新一代AI框架的设计和实现异构计算资源下的AI框架优化大模型训练的分布式策略和性能优化大模型在不同行业的应用案例分析DataFun

2024年11月15日

其他

独家专访李飞飞爱徒，斯坦福AI博士，a16z投资千万美元，AI视频月收入飞涨200%

的起点是建立新一代视频创意工作室。未来，我们希望加快模型速度，实现实时互动，使视频不再是一次性创作，而是可以互动、来回交流的内容。我们的愿景是从创作开始，但也提供独特的分发体验，比如在视频结束后实时

2024年11月15日

其他

对话Nvidia黄仁勋：机器学习不仅是关于软件，而是涉及整个数据管道；机器学习的飞轮效应是最重要的

是全球最好的奖励系统模型，它是最好的批评者。所以这是一个非常棒的模型，用来提升其他所有的模型。无论其他模型有多么强大，我都会建议使用

2024年11月14日

其他

ES原厂首席架构师：解读AI搜索技术与应用案例

X区3F（X7-301龙门书院）希望本次活动，您能来与更多行业同行者面对面交流，共享真知灼见，创造新的机会和发展的可能性。

2024年11月14日

其他

李彦宏：大模型幻觉基本消除，这是只靠想法就能赚钱时代

——法行宝。每个人工作生活中，都会遇到各类法律相关的问题，但不是每个人都能第一时间找到专业的律师来帮自己支招。这时，法行宝就很有用了。它是很受用户欢迎的智能体，在百度的平台上，已经回答了超过

2024年11月13日

其他

百度沧海·存储统一技术底座架构演进

的实现，会导致元数据的语义与元数据的存储层彻底分离。这种分层解耦的架构虽然在软件工程角度有低耦合、高内聚的优点，但也带来了额外的开销。为了降低这些开销，我们需要将元数据的语义下沉到底层的事务

2024年11月12日

其他

翁荔B站分享原文：AI安全与“培养”之道

的成长。我们每个人都应该成为AI的大家长。AI

2024年11月11日

其他

抖音集团数据血缘深度应用：架构、指标与优化实践

相关的优化规则。解析是血缘领域非常核心的组件，需要关注支持多种方言，因为生产任务是多样化的，有实时、离线、OLAP、非结构化数据以及更复杂的任务脚本。这里我们提出的比较理想解析方案是：基于

2024年11月10日

其他

OpenAI华人VP翁荔离职：北大校友，掌管安全，最近B站分享被热议

。爱你们的，Lilian02铁打的OpenAI，流水的安全主管自OpenAI成立以来，安全主管这个关键职位历经多次更替。最早在2016年，OpenAI的安全主管由达里奥·阿莫代伊（Dario

2024年11月9日

其他

「深度」学习计算广告，我为什么从推荐系统转向计算广告？

heart，最好能找到属于自己的passion。我是一个非常喜欢研究“赚钱”策略的人。这是我加入搜广推的初衷，我喜欢看到自己的工作直接为公司赚了多少钱，越直接越好，看到一个AB

2024年11月9日

其他

腾讯语音合成技术：模型优化与推理加速实践

S4），并且每个句子在达到结束标记（END）之前都会被单独处理。连续性批处理：试图在同一时间步内同时处理多个句子，以实现更高的并行性和效率。例如，在第一个时间步（T1），四个句子（S1

2024年11月8日

其他

策略产品AI转型指南：能力模型与实战策略

细节，包括宏观上的定义和微观上的设计；第三是要拉到关键决策人推动项目。设定评估体系：一级指标、二级指标是什么。全面评估项目收益：评估方式包括主观评估体验测量和数据测量。全局最优解：可以理解为

2024年11月7日

其他

腾讯大数据实时湖仓智能优化实践

高级工程师编辑整理｜李笑宇内容校对｜李瑶出品社区｜DataFun01湖仓架构腾讯大数据的湖仓架构如下图所示：这里分为三个部分，分别是数据湖计算、数据湖管理和数据湖存储。数据湖计算部分，Spark

2024年9月9日

其他

大模型数据建设探索与实践

工程化实践中的数据配比调整在工程化实践中，数据配比的调整是一个主动触发的过程，主要思路如下：主动触发配比调整：在模型训练初期和中期，根据评测指标主动触发配比调整。先导模型辅助：使用先导模型（如

2024年9月8日

这小姐到底啥背景，大圣你何必问那么细？

台湾学生自制“解放军部署地图”，曝光2000个中国大陆军事设施

国家安全局副局长8年内杀4人，3人被碎尸，被执行死刑！

四个恶魔折磨新婚夫妇长达八小时，费县“5·15”惨案告破!

喇嘛教用宋朝理宗皇帝的头骨作法器——被诅咒的帝国