查看原文
其他

大模型时代,谁会成为闭源的 Windows 和开源的 Linux?

新程序员编辑部 CSDN 2024-02-01

整理 | 屠敏、郑丽媛
出品 | CSDN(ID:CSDNnews)
  • PC 历史上有 Windows 和 Linux,移动互联网历史上有 Android 和 iOS,这两年大模型如火如荼的发展中也形成了开源和闭源两条路线。

  • 以前我们或许认为“低代码”是个虚构的命题,认为只是把代码变成了框框而已。但是现在,AI 实际上可以按需生成代码了!

  • 目前算力成本仍是一大挑战,会对一些企业和机构推进大模型研究造成约束,但从未来角度来看,这些困难和问题都有攻破和解决的机会。

  • 为了使开源持续发展,我们需要确保商业闭环的形成,只有这样,开源才能持续演进。

  • 在一个垂直行业中提供完善的解决方案,最好的实现方式就是在最新的技术上解决那些在历史上被认为不可能解决的问题。

  • 大模型不光是现在的技术潮流,更可能在未来百年之内给人类带来剧变。

在 1 月 27 日中关村开源生态论坛暨大模型智能应用技术大会现场,我们邀请到了来自国内大模型生态的一线企业代表即中科曙光智能计算产品部总经理杜夏威,腾讯云副总裁、北区总经理王前,商汤科技大模型应用技术负责人张涛, 鹰瞳科技 Airdoc 创始人张大磊,硅基流动联合创始人、一流科技创始人、光年之外联合创始人袁进辉齐聚一堂,在 CSDN 高级副总裁、 全球机器学习技术大会主席李建忠的主持下,以“通往 AGI 之路,大模型技术生态与开源”为主题,从各自的角度出发,共同探讨大模型生态的现状与发展方向。

以下为圆桌对话正文:

大模型生态位的机会与挑战


李建忠:大模型的发展是整个生态系统的发展,包括基础设施层、云服务、模型层以及应用层等多个方面。各位嘉宾所在的企业也是这个生态系统中非常有代表性的企业。请大家分享一下各自企业的产品和服务在大模型中所处的生态位,以及该生态位当下所面临的机遇和挑战?

杜夏威:随着大模型的推广普及,市场对算力的需求呈现发式增长。这种增长对于力层面的供给提出了新的要求,同时伴随着国家政策快速发展,在低碳环保和节能层面也提出了新的挑战。在这种背景下,中科曙光一直致力于建设算基础设施,不断发展以解决这些问题。我们努力为大模型提供高效解耦合技术服务的同时,也关注着在低碳环保和节能方面的创新发展。

王前:腾讯对 AI 这个赛道非常看重,同时也是这个赛道的重要参与者,在 2023 年 9 月 7 日发布了混元大模型。我们认为大模型不光是现在的技术潮流,更可能在未来百年之内给人类带来剧变,所以不仅自己在做,也正拉通生态在做。

王前 腾讯云副总裁、北区总经理

张大磊:作为大模型领域的医疗应用公司,我们专注于把硬件、软件、光学、算法全部集成起来,造出了一个由 AI 驱动、真正在医疗上能用的产品。因此,我们更注重如何在不同领域充分利用大模型的能力,例如在算法诊断端和硬件设备的降本方面。尤其在中国,许多基层医疗机构负担能力相对较小,技术水平相对滞后。我们一直致力于通过大模型将硬件做得越来越便宜、普惠,最终实现在千家万户中的广泛应用。

张涛:我们以 AI 技术作为核心竞争力,在早期阶段就着眼于基础设施的前瞻性布局,建立了自己的 AIDC 智算中心,使整个大模型研发过程的效能达到最优水平。商汤利用大模型不仅为自身和开发者更快地迭代出优秀的模型,形成了更好的实践,也为大家提供了更为优越的基础设施。同时,我们希望通过 AIDC 智算中心这些新的能力,在各种应用场景中更好地赋能大家,提高工作效率和整个产业与社会的运行效率。

袁进辉:大模型和 AGI 产业大致分为两类,即应用和底座。其中底座的关键要素包括芯片(以英伟达为代表)、模型(以 OpenAI 为代表)和软件系统,而软件系统在模型在何种芯片上运行、如何更高效、更经济地运行上发挥着至关重要的作用。

我们深信,如果 AI 和大模型未来无处不在,其中成本将是关键的瓶颈。因此硅基流动成立的目标,主要是解决两个重要的成本问题。首先,我们希望基于大模型开发应用的公司能降低研发成本,避免重复性的研发工作;其次,我们致力于降低大规模使用大模型的成本,让人们在使用这些技术能力时不再感到负担。

袁进辉 硅基流动联合创始人、一流科技创始人、光年之外联合创始人


“万物智能摩尔定律”

李建忠:在大模型的迅猛发展中,业界普遍面临成本、效能和能源等多方面的挑战。有一部分人持悲观观点,认为这些挑战可能成为行业发展的制约因素;另一方面,乐观派则相信智能发展将遵循一种“万物摩尔定律”,每 18 个月智能体数量翻一番,成本价格降一倍。对于这两种观点,各位嘉宾是如何看待的?以及在成本效能方面,大家又采取了哪些创新的方法?

杜夏威:在当前大模型迅猛发展的背景下,成本问题显得尤为重要。我们从算力最底层出发,致力于降低算力成本,为上层的云服务、模型、应用提供高效的生产力支持。目前算力成本仍是一大挑战,会对一些企业和机构推进大模型研究造成约束,但从未来角度来看,这些困难和问题都有攻破和解决的机会。

为此,我们通过算力互联提高算力服务效率,并推动算力生态系统的发展;同时关注供需平衡,努力调整以保障算力的高效输出,使更多用户能享受到优质的算力服务;此外,我们还努力在绿色算力方面做出贡献。通过液冷等方式,以及构建包括算力、存储、网络、制冷在内的各个环节的优化,在降低能耗的同时尽可能提升算力效率。

尽管目前面临着算力成本的壁垒,但从我个人角度来看,未来有望以更为先进的技术和方式,为社会提供更为节能且高性价比的算力服务。

杜夏威 中科曙光智能计算产品部总经理

王前:我们深耕产业互联网多年,借助用户、场景、技术等方面的积累,对人工智能领域有着深刻思考。可以发现,人工智能一定是个“百年赛道”。

在这个背景下,腾讯云致力于在整个体系内帮助企业和生态系统实现“成本更低、效率更高”,同时造福更多人和企业:

  • 首先,从技术底层架构出发,我们提供多种选择。去年 6 月,腾讯云发布了行业大模型战略,相当于建立了模型的“精选商场”,用户可以选择不同模型进行训练和精调,以满足不同业务需求。

  • 其次,我们在平台方面也做了深入思考。为了降低精调成本,我们推出了 TI-ONE 平台,可一键式实现根据业务场景和数据快速训练。通过这种方式,我们希望让大模型更具吸引力,向更多企业和社会人士提供服务,从而推动大模型产业的整体发展。

李建忠:大模型在过去一年中迅速引起产业的关注,不仅在产业界获得“重构千行百业”的共识,也吊足了大众的胃口 。想请问各位嘉宾,大模型在进入终端应用场景时,如何能够快速让用户体验到大模型带来的好处?

张大磊:作为大模型应用企业,我们的感受是普通 C 端用户并不关心是否采用大模型,而更关注解决其具体需求的问题。例如在医疗领域,医生关心的是安全有效准确,而不在乎算法背后是大模型、小模型、人工识别还是机器学习。对于医生而言,为患者负责的确切诊断结果才是关键。

所以我们思考的问题是:在什么情况下才应该使用大模型?目前,我们现在采取的做法是:

  • 如果对于当前状态需要极其精准的诊断,则不用大模型,而是用传统的强监督学习和医生交叉标注的方式,训练出一个非常精准的算法,并将其作为法定诊断依据。

  • 如果是对于接下来疾病发展的预测,例如预测患者是否会心梗、何时发生心梗、是否中风等,我们才会使用大模型,在大规模数据中进行持续跟踪,建立精准的预测模型。此外,医疗领域的大模型我们鹰瞳 Airdoc 上线前还会进行 RCT 双盲随机对比验证。

总体而言,我们对大模型的理解是它应该在特定场景中解决特定问题。在医疗领域,我们坚持通过传统方法获得高精准度的诊断结果,并谨慎使用大模型来应对特定的挑战。

张涛:我赞同刚才大磊提到的观点,技术最重要的目标是为用户解决问题。用户通常没有所谓的最佳解决方案,而只有最合适的解决方案。为什么现在有些应用要重新思考?

在没有 AIGC 能力之前,很多我们想尝试的想法可能因为没有这样的计算能力而不可行或者没有明确的路径。现在我们有了更广阔的视角和路径,可以重新审视之前不太容易实现的应用。

以前我们或许认为“低代码”是个虚构的命题,认为只是把代码变成了框框而已。但是现在,实际上可以按需生成代码了!

实际上用户并不太关心模型的工作逻辑。商汤在去年已经推出了一款用来帮助用户编写代码、辅助开发的 AI Copilot 产品 —— 代码小浣熊 Raccoon,当用户在使用它时,会知道“AI 帮我写了某段代码、帮我实现了某个功能”。但是在处理复杂数据或报表信息时,这些不是依靠 GC 能力让它主动去理解的,而是应该给它提供一个精确的 Prompt,如一个操作逻辑,你可以认为它就是个代码,执行这个代码来获取最终结果。

在这个时候,用户关心的是解决问题的能力,而不太在意产品背后的 AIGC 能力。因此,现在我们的产品可以为更多应用提供能力,创造出更多新的应用。随着行业的蓬勃发展,我们的成本也有望进一步降低,因为行业终端的支持会反过来帮助我们在这上面做更大投入。

张涛 商汤科技大模型应用技术负责人


开源 vs 闭源,大模型的技术走向

李建忠:IT 产业不同时期的技术都有开源和闭源两条路线之争。PC 历史上有 Windows 和 Linux,移动互联网历史上有 Android 和 iOS,这两年大模型如火如荼的发展中也形成了开源和闭源两条路线。各位嘉宾如何看待开源和闭源这两条路线的博弈?它们会给大模型的发展带来什么样的影响?

李建忠 CSDN 高级副总裁、 全球机器学习技术大会主席

袁进辉:过去我一直致力于开源项目,现在我进行的新项目也因开源而受益匪浅。我认为可以从两个维度看待这个问题:

  • 首先,当前开源社区中存在许多水平很高的大模型。对于做应用的人而言,不必从零开始训练大模型,直接可以尝试各种各样的应用,这极大地促进了技术的普及和渗透。随着应用领域的繁荣,底层的基础设施、模型供应、芯片供应以及云服务等都迎来了巨大的市场。

  • 其次,在整个产业链中,开源促进了各个环节的良性竞争和发展。这个链条涵盖了各种各样的角色,包括芯片制造、模型开发、软件系统构建以及应用开发。当大模型领域处于第二三名的企业开源他们的模型时,会有效促进产业链的其他环节发展。譬如,模型的开源使得芯片制造商可以专注于打磨高水平的产品而不必亲自进行模型的开发。同样,做软件系统的人,即使不在大型模型公司工作,也能接触到高水平的各种模型,以此来完善自己的产品和系统。

总体来说,不论从哪个角度看,开源都对整个行业产生了巨大的推动作用。然而,为了使开源持续发展,我们需要确保商业闭环的形成,只有这样,开源才能持续演进。

王前:腾讯在这方面也进行了深入思考。我们内部达成了一个共识,即大模型或人工智能无法完全替代实体产业,但拥有人工智能的产业却有可能替代或淘汰没有人工智能的产业。

因此,我们更多地从用户的角度出发。如果用户需要开源,我们提供开源的选择;如果用户能够接受闭源,譬如一些大数据公司、政府企业或国营企业,他们可能期望我们将模型抽象出来,并部署到他们的机房中,通过精细调整将他们的数据整合进去,这也是我们考虑的业务场景之一。

我们一直关注垂直和开放性业务场景,因为这些应用场景决定了部署方式。我们始终将用户角度、用户体验以及解决用户问题作为我们路径选择的主要考虑因素。

李建忠:正如王总所述,大模型在行业发展过程中有两条路径,一条是通用模型,一条是垂直模型。那么在行业应用上,在这两条路径上如何选择?

张涛:我认为,这两类模型将会共存,而非只存在一种。

现在大家看到的模型智能能力都是超大规模的参数涌现出来的,之所以将其称之为涌现,是因为大家不知道它具体是怎么出现的。不过,可以确认的是,这些智能是在训练阶段使用了大量数据之后生成的。

目前还没有人能够确切说出如何将生成的智能与这些数据进行分离或者割裂,往往一个小规模的参数量保证它的智能程度和大规模的模型程度是一样的。因此,在考虑模型能力与应用场景匹配和平衡时,如果存在一个小规模模型,它在特定领域表现会更佳且成本更优,那么它必定会长期存在,并且是行业乐于见到的趋势。

张大磊:我非常认同商汤张总的观点,也深信不同场景有不同的需求。

我觉得像我们这样专注于医疗行业的公司,自己去开发跨行业通用模型是不经济的。与 OpenAI 等公司做大模型相比,我也坦言看到了中间存在的差距,只有正视、理解这个差距,我们才能够走得更远,也在更长的时间中能追上并且超过。

然而,如何迎头赶上呢?我认为很难通过模仿他人的方式来取得胜利,而应该采用不同的战略。

作为医疗健康领域的从业者,我们在一个垂直行业中真正需要解决的问题不仅仅是算法问题,更是体系结构的竞争。我们需要用最先进的技术来解决各种实际应用中看似朴素的问题,以此才能形成一个完整的解决方案。这个解决方案最好的实现方式就是在最新的技术上解决那些在历史上被认为不可能解决的问题。

张大磊 鹰瞳科技 Airdoc 创始人

AGI 距离我们还有多远?

李建忠:今天圆桌对话的主题是“通往 AGI 之路”。对于 AGI,业界观点不一,像美国未来学家雷·库兹韦尔曾在《奇点临近》一书中预测,到 2045 年,人工智能将接近或超越人类智能;OpenAI CEO Sam Altman 也预言道,在 2030 年前可能会实现 AGI。对此,在座的各位嘉宾如何看待 AGI,以及我们还需要多久的时间才能实现 AGI?

杜夏威:这个问题存在一定挑战,但我们也正在积极拥抱 AGI 时代的到来。这种积极态度既包括享受 AGI 时代带来生产力的变革,也包括依托自身产品技术服务于 AGI 时代,确保我们在这个时代保持竞争力。

从企业角度来看,我认为 AGI 时代必将到来,只不过当前火热的 AIGC 只能算是 AGI 时代的一个原始和雏形的状态。目前大多数企业主要侧重于利用现有生产力,通过大模型提升效率和进行变革。但我对 AGI 时代的想象是它将完全以 AI 和智能化为主体,为工作和生活提供相应的服务。

从个人角度出发,我认为 AGI 时代是否能够到来,其中一个关键因素是我们的 AI 何时能够真正地与现实世界产生交互。我相信这也是本次论坛中一个重要的议题,因为我看到有关 Agent 的相关深入探讨和分享。

如果要设定一个时间,我个人觉得在 10 年内 AI 将会带来翻天覆地的变化。我们非常期待在这个时间范围内见证 AGI 时代的来临,以及它为我们的生活带来的颠覆性变革。

王前:我们对于 AGI 时代的思考,将其视为一场“百年赛道”。我们关注的不仅仅是它何时到来,更要思考一旦到来,将如何永久地改变我们的生活。就像内燃机改变了我们的交通一样,即使有新技术出现,内燃机依然存在。

因此,可以想象,它必定会到来!就像参加马拉松比赛一样,我们不需过多关注起跑瞬间,而是更专注于现在。因此,我们将目光聚焦在当下,最为重要的是做好眼前的事情。

张大磊:我持较为现实的观点:尽管通用人工智能可能会到来,但仍然离我们相对遥远,确切的时间难以预测。我所处环境的周围,许多比我更聪明的人都在从事 AGI 的研究。然而,目前我们面临的现实问题是,如果你认真研究当前的语言模型,你会发现按照AGI标准来看还有不小差距。往后看,大模型也面临许多推理和逻辑问题,还未完全解决。 

张涛:AGI 这个话题覆盖广泛,目前我们主要聚焦在 AIGC 上。时下的 AIGC 不仅面临着我们刚刚提到的成本问题,而且还有大家普遍关注的幻觉问题。

如果将 AIGC 定位为是一种辅助人类干活的工具,那么短期之内也可以将其视为 AGI 时代已经到来。然而,真正的人工智能,是指它能够自主判断何时需要辅助、主动寻求帮助,并探索新的工具使用,这需要更多时间和深入地探索。

袁进辉:我对 AGI 的前景充满信心,或许不久之后它就会成为现实。在追溯人类对智能本质的探索时,我们发现这一话题已经贯穿几千年的历史。尽管人类对浩瀚的广阔、微观世界有着深刻的理解,但是对于智能产生的机制的探索一直是一个谜。

科学家曾经将智能视为极为神秘的现象,但如今,像 ChatGPT 这样的大模型通过看似简单的原理,却能够产生如此强大的智能,且在很大程度上复现了智能的多个方面。也许智能并非我们想象中那么神秘和困难,也许只需几年时间,我们就能见证这一奇迹的发生! 

继续滑动看下一个

大模型时代,谁会成为闭源的 Windows 和开源的 Linux?

新程序员编辑部 CSDN
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存