查看原文
其他

今天,我们应该关注哪些人工智能初创公司?

凯瑞kerry SV Technology Review 2024-04-14

人工智能是今年的科技故事,该行业持续吸引着资本和人才的关注,全球一级市场每周公开融资事件高达10-30起,融资金额超过十亿美金。接下来的几个月和几年,人工智能将如何全面影响我们的生活,在全球范围内创造新的赢家和输家,是倍受投资人和创业者关注的问题。


为了帮助大家为即将到来的AI时代做好准备,并更清楚地看到未来。笔者借助AI翻译和编辑了The Generalist创始人Mario Gabriele 最新文章 “What to Watch in AI”(点击底部链接阅读原文)。文中由红杉资本、USV、凯鹏华盈等投资机构资深投资人和AI创业公司创始人,推选出五大方向,13家最有潜力的AI初创公司,供大家分析和思考。


  • 增进人类健康。初创公司正在使用人工智能来改善医疗保健结果并设计新的治疗方法。Alife 使用该技术来改善 IVF,为患者提供更好的受孕机会。该公司的方法可能会及时从根本上颠覆该行业的成本结构。NewLimit 是另一家利用人工智能的医疗保健初创公司,正在寻找更好的方法来治疗以前无法攻克的疾病。

  • 服务企业客户。随着人工智能的发展和逐步普及,普通互联网用户可以使用复杂的模型创建文本和图像。一些有有潜力的初创公司正在直接服务企业客户,构建符合企业要求的包含内部数据产品和工具。如 Glean、Dust 、Lamini和Labelbox 。

  • 聚焦底层技术。与当前轰轰烈烈的AI应用层创业不同,本次被推荐的企业大都聚集在底层的技术,包括多模态数据存储管理Lance、大模型和视频创意工具Runway、利用人工智能进行软件开发Poolside、自主编码的机器人Factory等。

  • 人工智能安全。人工智能革命可能会带来许多新机遇,但也会带来很多威胁。特别是生成式人工智能使得创建逼真的文字信息变得容易,增加了“钓鱼”诈骗的数量和复杂性,这些诈骗旨在从接收者那里获取个人信息。像Abnormal Security这样的公司已经出现,利用人工智能来检测恶意的人工智能信息,以保护用户免受此类攻击。


  • 全球创业市场。尽管美国拥有许多该行业的巨头,例如 OpenAI 和谷歌,在美国境外,有潜力的初创公司正在发展。Mistral 正在巴黎总部构建开源大型语言模型 - 预计它们将挑战 OpenAI 的影响力。德国企业 Sereact 开发了一款令人印象深刻的人工智能机器人产品,并与工业巨头签订了合同。



   增进人类健康   



Alife


人工智能+辅助生殖


推荐人:Rebecca Kaden, Union Square Ventures 合伙人



+




在任何生育程序中,都有重要的人类决策时刻。其中与体外受精最相关的两个是“卵巢刺激”和“胚胎选择”。


“卵巢刺激”是指确定患者接受的刺激卵巢卵泡生长的药物剂量,以及何时进行触发刺激卵子从卵泡中释放。触发扳机的时机至关重要——太早,可能会过早产卵;太晚了,可能会获得过成熟的卵子,或者不会获得尽可能多的卵子。


“胚胎选择”是指选择使用和植入哪个受精卵。目前,与大多数医学领域一样,临床医生和胚胎学家结合自己的经验和培训、形态分级系统以及反复试验来做出决定。如果一个周期的剂量或时间不对,他们会在下一个周期进行调整。许多医生在这方面非常出色,他们创造了一个技能广泛且对结果至关重要的系统。对于生育而言,这意味着供应严重不足的市场,价格飙升,特别是为了看到最好的医生,而且在这个领域的结果也存在很大的差异。


Alife 构建人工智能驱动的工具来改善体外受精 (IVF) 的效果。该公司为医生提供人工智能工具,利用大量的输入和结果数据集来增强他们的决策能力。现在,通过一个简单的界面,医生可以输入患者的特征,并根据之前数千个周期的结果,在生育过程的关键时刻获得准确的建议。这些数据集来自大量收集的现有患者数据,反过来,每个使用 Alife 产品的患者都会得到更好的结果。


这些工具将改变生育行业。Alife 的研究表明,他们的机器学习模型可以帮助医生优化 50% 过早或过晚触发的患者的触发射击,并平均帮助检索最多三个成熟卵子、两个受精卵和一个胚胎。Alife 的产品可以显着拓宽生育治疗的机会,通过降低所需的药物剂量来降低每位患者的成本,并提高每个昂贵的 IVF 周期的成功率。他们将使医生的竞争环境更加公平,使那些经验较少的人能够获取更广泛的知识和信息。


最终,你可以想象Alife的工具为过程中的判断时刻提供指导,并允许医生以外的从业者使用,从而显著改变该行业的成本结构和可用性。更重要的是,基于数据驱动的精准医学可以增强或最终取代个人的判断,提供个性化建议,这种情况并不仅限于试管婴儿。在医学领域,有成千上万个类似的时刻,并有机会利用数据来彻底改变结果和对关键程序和治疗的获取。


更多:AI+辅助生殖?Alife如何用AI降低诊所运营成本,提高试管婴儿成功率




NewLimit


延长人类寿命


推荐人:Simon Barnett,Dimension 研究总监



+




细胞是地球上最复杂的计算机系统。与计算机芯片一样,DNA 由基本单元组成,这些基本单元通过叠加作用产生复杂的功能。与基于位的代码不同,基于原子的代码是随机的和分层的。系统依赖于其他物理系统,每个系统都受到热、酸度和细胞微环境中分子的影响。


尽管存在这些相互依赖性,细胞机器代码 (DNA) 仍可以有效地运行不同的程序。尽管您的肝细胞和皮肤细胞含有相同的基因组,但这些细胞类型的外观、感觉和功能不同。为什么?他们正在执行不同的表观遗传程序,这些程序由哪些基因被调高、哪些基因调低以及调低到什么程度组成。


2006 年,高桥等人( Takahashi et al.)使用四种转录因子(TF)蛋白的组合将成熟细胞重编程回干细胞,为表观遗传重编程领域播下了种子。使用之前的类比,转录因子是一种蛋白质,可以向上或向下转动基因的旋钮,从本质上改变正在运行的“程序”。高桥和山中伸弥(Takahashi and Yamanaka)的发现导致了诱导多能干细胞(iPSC)的诞生,并获得了诺贝尔奖。从那时起,许多研究小组应用独特的转录因子组合来改变细胞状态,使受损细胞恢复活力,并恢复年轻的细胞表型。


虽然表观遗传重编程变得更加容易处理,但它肯定不是微不足道的。研究小组必须辨别哪种 TF 组合能够有效地将细胞从 A 状态驱动到所需的 B 状态。未来的 TF 鸡尾酒可能使我们能够将患病细胞转化为健康细胞,例如,开发出一类新的药物。由于对于许多应用来说确切的 TF 组合仍然未知,因此需要超大的重编程屏幕。拥有超过 1,500 个本地人类 TF,即使是五人鸡尾酒也会产生实验上不可行的 >6x10^13 组合 - 需要更有效的搜索方法。我们相信 NewLimit 正在设计这样的方法。


得益于单细胞测序和机器学习(ML)的进步,NewLimit正在将以前的手工艺学科转变为数据驱动的科学。公司在分子生物学家和计算生物学家之间有着良好的平衡,为构建一个日益高效的闭环平台奠定了必要的文化基础。结合专业知识和多模态读数(scRNA-Seq、scATAC-Seq等),NewLimit旨在发现治疗性重编程因子,以治疗以往难以治愈的疾病。


在每轮实验中,NewLimit 都采用机器学习技术:


  1. 将多个检测读数组合并压缩到一个低维优化空间中,其中包括细胞的当前状态 A 及其所需的状态 B。

  2. 枚举新的TF(转录因子)组合,有可能沿着优化空间将细胞推向其期望的状态。

  3. 建议哪些类型的数据有助于改进模型,以及何时/何地应用更昂贵、更低通量的实验方法。

  4. 提名应该对平台进行哪些改变,以最大化每美元产生的有用信息量。

除了其出色的团队、技术实力和雄心勃勃的愿景外,我们还欣赏NewLimit的务实态度。虽然该公司尚未公开分享其最初的商业策略细节,但我们相信这种方法是富有创意的、合理降低风险的,并且有可能对人类产生深远的影响。创始团队一致认识到,平台生物技术公司可能类似于没有近期资产产生的昂贵科研项目。为此,NewLimit是透明的,从创立之初就记录了其技术进展。


更多:Coinbase CEO联合创立了一家延长寿命的公司,拿了1.5亿美金



   服务企业客户   




Glean


企业搜索


推荐人:Josh Coyne,凯鹏华盈合伙人




+




当您需要时,可以快速轻松地找到工作中所需的准确信息。由于每个人用来完成工作的软件工具数量无穷无尽,以及由此产生的数据和文档数量巨大, “知识”的指数级增长和工作日益分散的性质增加了寻找现有知识所需的时间。换句话说,工作中“寻找合适的信息”已经变得相当困难。


为了帮助雇主解决这个问题,Arvind Jain 和他的团队构建了 Glean,一个由人工智能驱动的工作场所统一搜索平台。它为员工配备了直观的工作助手,帮助他们在需要时准确找到所需的内容,并主动发现他们应该知道的信息。


该公司的使命从一开始就很简单:帮助人们更快地找到工作场所问题的所有答案,减少挫败感和浪费时间。但此后所产生的结果远远超出了搜索范围。例如,Glean 不仅搜索每一个工作场所应用程序和知识库(Slack、Teams、Google Drive、Figma、Dropbox、Coda 等);它还理解自然语言和上下文,根据人们的角色和公司间/公司内部的关系个性化每个用户交互。它智能地展示您公司最受欢迎和验证的信息,帮助您发现团队所知,并以权限感知的方式保持一致。

随着组织变得更加分散,知识变得更加分散,像 Glean 这样直观的工作助手不再是可有可无的,而是提高员工生产力的关键工具。公司开发的产品将打破阻碍进展的篱笆,创造更积极、更富有成效的工作体验。


此外,Glean 的搜索技术使其能够将生成式人工智能引入工作场所,同时遵守企业严格的权限和数据治理要求。如今,阻碍企业将人工智能应用程序投入生产的主要障碍之一是他们无法实施适当的控制(例如,“我的应用程序是否理解最终用户可以看到和不可以看到的内容?”;“推理是在我的服务器上还是 OpenAI 的服务器上完成的?”;“哪些源数据导致了给定的模型输出以及谁拥有它?”)。通过介入具有实时数据权限的企业内部环境,Glean 已成为一种理想的解决方案,可帮助企业大规模解决治理问题,并可以利用公司其内部数据进行模型训练和推理,发挥企业级人工智能数据平台/向量存储的作用。


随着时间的推移,我们相信每家公司都会有自己的人工智能副驾驶,个性化以及了解企业及其员工的细微差别。我们相信 Glean 正在抓住这个机遇。


更多:Glean:大模型时代的企业内入口级产品,最了解员工的“AI同事”

AIGC+搜索市场竞争格局




Dust


企业数据平台


推荐人:Konstantine Buhler,红杉资本合伙人



+





显然,大型语言模型(LLM)将提高知识工作者的生产力。但目前还不清楚具体如何实现。Dust 的使命就是解决这个问题。由于大型语言模型如果无法访问内部数据,对企业不会有太大帮助,因此, Dust 构建了一个平台,可以对公司的实时内部数据(Notion、Slack、Drive、GitHub)进行索引、嵌入和保持更新,以将其公开给大模型支持的产品。


Dust的联合创始人Gabriel Hubert和Stanislas Polu将一家公司卖给了Stripe,并在那里工作了五年。他们亲眼目睹了快速增长的公司在规模上遇到的困难。他们看到了他们所称的“信息债务”的渗入,并且现在专注于应用LLMs来解决与此相关的一些主要痛点。他们目前正在探索以下应用程序,以完善他们的平台:


  1. 应答引擎。重点是事实性,因为这是广泛采用的关键。

  2. 创作助手。在内容创作时提供模板化的辅助。例如,根据内部数据生成你所缺少的段落。

  3. 自动更新文档。每当公司中出现一条需要更新其文档的信息时,文档所有者都会收到通知和预先制定的建议。

  4. 结构化事件提取。用户可以根据预定义的模板从非结构化数据(例如 Slack 线程)生成结构化事件。

  5. 内部数据监控。使用智能规则监控企业数据。例如,如果个人身份信息 (PII) 无意中出现在不该出现的地方,您就会收到警报。

Dust的创始人们相信这些流程最终将为一个统一的产品做出贡献。他们仍处于探索的早期阶段,并正在形成Dust最终的聚焦图景。根据他们的初步迭代,他们相信他们已经证实了他们的核心假设:知识工作者可以通过具有公司数据访问权限的LLM应用程序进行增强(而不是替代),并且可以为此构建一种新型的“团队操作系统”。


更多:体验明星团队Fixie和Dust的产品




Lamini


定制化LLM引擎


推荐人:James Wu,First Round Capital 合伙人



+





现在每个企业都在尝试将人工智能融入其业务中。世界上最大的公司认识到了人工智能的潜力,标准普尔 500 强企业中有 20% 的首席执行官在第一季度的财报电话会议中提到了人工智能。大型语言模型 (LLM) 可以通过加速客户支持、对外销售和编码等核心功能来显着提高业务效率。大模型还可以通过基于人工智能的助手来改善核心产品体验,以回答客户问题或创建令客户满意的全新生成式人工智能工作流程。


许多企业希望在内部构建自己的AI模型和解决方案。每个企业都拥有大量的专有客户数据,通常是其核心业务的壁垒。这些企业认为,将他们最宝贵的数据发送给基础模型API或不确定可靠性的新创企业存在风险。即使数据隐私不是问题,像GPT-4或Claude这样的公共预训练语言模型完全是基于开放数据进行训练的,因此它们缺乏对企业特定用例和客户群体的定制能力。


Shopify 和 Canva 等一些科技公司在内部组建了“AI 老虎团队”,利用现成的开源模型将 AI 构建到业务的每个适合的部分。然而,大多数公司没有资源或经验丰富的人工智能研究人员来根据自己的数据构建和部署私人大模型。他们认识到这场人工智能浪潮可能会成为他们业务未来的转型时刻,但直到现在,他们还无法利用或控制自己的人工智能发展。


这就是为什么我们对Sharon Zhou、Greg Diamos和他们的团队在Lamini上构建的东西感到非常兴奋。Lamini是一个LLM引擎,可以让开发者轻松地通过人工反馈快速训练、微调、部署和改进他们的LLM模型。它提供了愉悦的开发者体验,摒弃了使用人工智能模型时的复杂性,并且更重要的是,它允许企业在自有数据的基础上构建人工智能解决方案,而无需雇佣人工智能研究员或担心数据离开他们的私有云。我们最初在去年秋天与Sharon和Greg建立了合作伙伴关系。从那时起,我们有机会支持这个技术非常过硬且专注于顾客的创始团队,执行着一个雄心勃勃的愿景,即改变企业采用人工智能的方式。


具体来说,使用Lamini部署私有LLM相比使用公共解决方案有许多优势。让公司内部的工程团队处理构建过程可以保证数据隐私,并且在LLM选择、整体计算和数据架构方面具有更好的灵活性。使用Lamini还可以生产出具有较低虚构、较低延迟、可靠的运行时间和比现成API更低成本的模型。这些性能增强来自于Lamini团队基于数十年的AI模型和GPU优化研究以及行业经验所构建的核心技术见解。


知名初创公司和大型企业已经开始使用 Lamini 在内部和客户中部署LLM,他们对设置速度、性能和可靠性感到非常兴奋。未来,我们相信每个企业的业务和产品都会有人工智能,但只有少数企业有专门的人工智能团队。Lamini 是一家致力于打造公平竞争环境并帮助所有公司利用这一变革性技术的初创公司。由于最近与 Databricks 建立了合作伙伴关系,公司现在比以往任何时候都更容易通过直接在现有 Databricks 数据湖和计算集群之上设置 Lamini 来启动和运行其 AI 解决方案。


更多:几行代码,GPT-3变ChatGPT!吴恩达高徒、华人CEO震撼发布Lamini引擎




Labelbox


简化企业业务数据集


推荐人:Robert Kaplan,软银合伙人



+




“大数据的兴起”已经发生了 20 多年,尽管公司不断吸收比以往更多的数据,但许多公司仍然难以利用这些数据从人工智能模型中生成洞见。数据处理和注释仍然是人工智能过程中最繁琐和最昂贵的部分,但对于质量结果来说也是最重要的。即使预先训练的大型语言模型有所增加,企业也需要专注于使用其专有数据(跨多种模式)来创建人工智能产品,从而带来差异化的服务、洞察力和提高运营效率。


Labelbox 通过简化公司将数据集输入人工智能模型的方式来解决这一挑战。它可以帮助数据和机器学习团队找到正确的数据,对其进行处理和注释,将模型投入生产,并持续衡量和提高性能。


Labelbox 的新平台利用了生成式人工智能这一波浪潮。Model Foundry 允许团队快速试验市场上主流的封闭和开源提供商 AI 基础模型,使他们只需点击几下即可预先标记数据并快速进行试验。通过这样做,他们可以了解哪种模型在他们的数据上表现最好。Model Foundry 会自动为每次实验运行生成详细的性能指标,同时对结果进行版本控制和快照。


它的影响可能是深远的。传统上,人类需要几天的时间才能完成一项简单但耗时的任务,例如对具有多个文本段落的电子商务列表进行分类。然而,使用 GPT-4,该任务可以在数小时内完成。Model Foundry 允许企业自己提升效率。


这远非唯一的例子。早期结果表明,超过 88% 的标记任务可以通过一个或多个基础模型得到有意义的加速。Labelbox 无需编码和构建管道来将数据输入模型,而是让任何人只需点击几下即可预先标记数据。它旨在使团队能够协作工作并吸收跨职能的专业知识,以维持数据质量保证的人工监督。该功能允许机器学习专家和中小企业轻松评估模型、丰富数据集并协作构建智能应用程序,从而实现人工智能的普及。


事实证明,Labelbox 可以为许多全球最大的企业(包括沃尔玛、宝洁、Genentech 和 Adobe)显着降低成本并提高模型质量。


更多:传奇搭档M&B创业5年的经验教训:什么让合伙关系更加稳固?

机器学习数据标注平台市场竞争格局



   

聚焦底层技术

  




Lance


多模态数据的存储和管理


推荐人:Saar Gur,CRV 合伙人



+




我们都玩过 Midjourney,并且大多数人都看过 GPT-4 餐巾纸编码演示。Midjourney(文本到图像)和 GPT-4(图像到文本/代码)说明了模型成为多模态时的可能性,弥合了文本、图像和音频等不同形式媒体之间的差距。虽然当前大部分人工智能炒作都以基于文本的模型为中心,但多模态模型是构建我们所知道的世界的更准确表示的关键。


随着我们在机器人、医疗保健、制造、娱乐和广告等行业解锁下一波人工智能应用,越来越多的公司将建立在多模式模型之上。像 Runway 和 Flair.ai 这样的公司是各自领域新兴领导者,他们看到了用户对其产品的巨大需求,而像谷歌这样的老牌公司已经开始发布类似的多模态功能。


但使用多模式模型提出了一个挑战:如何存储和管理数据?Parquet 等传统存储格式并未针对非结构化数据进行优化,因此 ML 团队因数据加载、分析、评估和调试性能缓慢而苦苦挣扎。此外,缺乏单一事实来源使得机器学习工作流程更容易出错。Lance 是最近为应对这一挑战而出现的一家公司。Midjourney 和 WeRide 等公司正在将 PB 级数据集转换为 Lance 格式,与 Parquet 和 TFRecords 等传统格式相比,性能有了显着的改进,增量存储成本也降低了一个数量级。


Lance 并没有止步于存储——他们已经认识到需要重建整个数据管理堆栈,以更好地适应我们正在迈向的世界,在这个世界中,非结构化、多模式数据将成为组织最有价值的资产。他们的第一个平台产品 LanceDB(现已处于内测阶段)为想要在应用程序中构建多模式功能的开发人员提供无缝的嵌入式体验。


Lance 只是公司将开发人员带入多模式未来的一个例子 - 我非常兴奋地看到其他技术的出现来突破多模式应用的界限。随着人工智能的发展步伐,不久之后这个未来就会成为现实。


更多:矢量数据库对比和选择指南




Runway


视频创意工具


推荐人:Grace Isford,Lux Capital 合伙人



+




人工智能无处不在,越来越成为一种商品。在大多数情况下,公司已经将人工智能作为聊天机器人加入到现有应用中,以丰富用户体验。而很少有人工智能应用能够重新定义产品体验,利用这项技术从根本上改变我们与产品的互动方式,就像谷歌的搜索引擎改变了我们浏览互联网的方式,Instagram改变了我们通过手机分享照片的方式一样。这些人工智能应用需要对现有用户体验有深入的了解,具备有远见的产品思维和尖端的技术。


Runway 是这方面公司的一个典型例子——利用应用人工智能研究来重新构想创意体验并构建新的创意套件。更多AI周报008期 文生视频企业Runway融资过亿AI周报004期 Runway得到谷歌支持


  1. 对UX(用户体验)有深入的理解。创始人Cristobal Valenzuela、Anastasis Germanidis和Alejandro Matamala-Ortiz是纽约大学互动通信项目的研究员,拥有多年的设计经验。Runway的团队通过直接经验了解了创意工具生态系统以及民主化的障碍。例如,创意电影制作通常需要昂贵的设备、软件资源和高水平的培训。因此,它在历史上一直集中在主要的制片厂。Runway看到了扩大和改善所需创意工具的可访问性的机会。


  2. 有远见的产品思维。 Runway 很早就认识到人工智能的拐点可以极大地改善用户体验,超越增强现有的创意工具,从根本上改变这些工具的工作方式。例如,用户可以利用简单的文本提示从头开始创建全新的视频内容。重要的是,该视频是专业级的,可以从桌面或移动设备共享。无论技能水平、背景或资源如何,Runway 都可以节省数小时或数天的编辑工作。它是一款富有远见的产品,能够将简单的提示变成生动、动人的视频。


  3. 领先的人工智能技术专家。 Runway 不仅用富有远见的产品解决了问题,还重新构想了底层的研究和技术基础设施。Runway 的内部研究组织处于图像和视频合成深度神经网络进步的最前沿。该公司开发了 Gen-2,这是一种比当今市场上任何产品都更强大、功能更强大的多模式 AI 视频模型。这是第一个能够将文本转换为视频的公开模型。在此之前,Runway 发布了 Gen-1,该模型引领了视频生成工具的范式转变,可产生高质量的输出。Runway 的研究人员还首创了文本到图像模型“稳定扩散”(Stable Diffusion)。

自2022年10月以来,Runway已经开发了30多个横跨视频、图像、3D和文本的AI“魔法工具”,服务于从前期制作到后期制作的创意过程的各个方面。他们的客户群包括财富 500 强和全球 2000 强公司,例如 CBS 的《The Late Show with Stephen Colbert、New Balance、Harbor Picture Video、Publicis 和 Google。该平台还被用来剪辑奥斯卡提名的电影,例如好莱坞大片《Everything Everywhere All at Once》。


最令人兴奋的人工智能应用程序改变了现有的产品体验,重新思考用户与产品的交互方式。借助 Runway,用户可以在几秒钟内启动新的视频创作,无论他们是初次摄像师还是专业制作工作室。这是一个变革性的转变,也是人工智能如何重新构想不同行业的一个例子。


更多:文本生成视频领域的王者:Runway的崛起之路!




Poolside


人工智能+软件开发


推荐人:Matan Grinberg,Factory 联创兼CEO



+




虽然 OpenAI 一直专注于通用人工智能,而 DeepMind 一直专注于科学发现,但人工智能的第三个方向是理解和创建软件。


GPT-4正在渐渐融入有经验和新手开发者的工作流程中。但这种范式转变还处于初级阶段。根据最近几个月的推测,辅助人工智能编程将很快变得无处不在。将这一趋势进一步延伸到未来,自然语言将成为构建软件的抽象基础。


虽然其他公司已经发布了像StarCoder这样的大型仅代码模型,但迄今为止还没有一种方法能够达到GPT-4的性能水平。我怀疑这是因为仅仅在代码上训练模型无法产生出色的软件开发能力。这种观点是我如何了解poolside的原因。该公司由Jason Warner(GitHub的前首席技术官)和Eiso Kant(source{d}的前创始人)创立,source{d}是全球第一家专注于代码人工智能的公司。更多:AI周报003期 零代码、低代码领域创业企业结合人工智能技术持续获得融资,如Poolside


Poolside 的独特之处在于,他们采用 OpenAI 基础模型方法,但只关注一种功能:代码生成。他们的技术策略取决于代码可以执行的事实,允许在学习过程中立即自动反馈。这允许通过代码执行进行强化学习——这是通过人类反馈(RLHF)进行强化学习的一种引人注目的替代方案——Eiso 早在 2017 年就在探索这一点。


虽然通用人工智能(AGI)为人类带来巨大利益的潜力是不可否认的,但它的实现仍然遥远。但为什么要等待AGI呢?通过专注于推进人工智能的特定领域,例如软件开发,我们可以消除更多的创造障碍。我很高兴看到池畔团队实现构建专用软件基础模型的愿景。


更多:GitHub 前 CTO 再创业,起步便获 2600 万美元投资,唯一竞争对手只有 OpenAI!




Factory


自主编码机器人


推荐人:Markie Wagner,Delphi Labs创始人兼CEO



+




如果你今天想让计算机为你做某事,你必须将你的想法翻译成“计算机语言”——编译器可以理解的超文字代码。成为一名工程师就是扭曲你的大脑,使其像机器一样思考。但我们正在达到一个转折点,人工智能可以将人类语言翻译成代码。从人类工程师到数字工程师的转变很可能将成为我们一生中最重要的技术拐点之一。


我们仍处于这一过渡的初期。像BabyAGI和AutoGPT这样的人工智能代理引发了公众的想象。但是,虽然像Github Copilot这样的编码助手代表了一步向前的进展,它们仍然非常有限 - 主要是作为已经在代码中实现的思想的自动补全工具。


这家公司与众不同。它由前弦理论物理学家Matan Grinberg和机器学习工程师Eno Reyes于2023年创立。当我第一次遇到Matan时,立刻被他关于未来愿景所吸引:即工程师能够将繁琐的任务交给自主编码的“机器人”,从而将注意力集中在复杂的问题上,让构建事物变得有趣。为了实现这一目标,Matan和Eno创造了自主编码的“机器人”。


机器人是能够处理日常任务的AI工程师,如代码审查、调试和重构。与现有产品不同,Factory的机器人是无需干预的——它们可以独立地审查代码、解决错误并回答问题。您还可以像对待初级开发人员一样使用机器人,与它们一起进行头脑风暴和分担功能开发工作。机器人有强大的防护措施:它们将智能定向到用户需求,并且不太容易产生“产生幻觉”的错误答案。


代码生成将成为人工智能革命中最具变革性的领域之一。Factory 拥有成功所需的所有工具。


  1. 团队。 Factory 的首席执行官马坦 (Matan) 在普林斯顿大学担任弦理论学家,在那里他想象了黑洞的奇点。Eno 的职业生涯是在 Hugging Face 担任机器学习工程师,亲自处理繁琐的工程流程。这是一支独一无二的团队。

  2. 实用性。虽然机器人的表现还不如人类工程师,但它们非常适合从事工程师讨厌的任务。把你无聊、重复的工作交给他们。

  3. 速度。Factory在短短几个月内创造了一些了不起的东西。当其他人还在幻想人工智能工程师时,Matan和Eno已经开始着手开发它们。他们正在快速改进这已经是一个非常优秀的产品。

人类的故事是一个不断将重复性工作外包出去的过程,这使得我们能够转向更加复杂的任务。当人类发明了农业,我们释放出了精力来建造城市。工业革命之后,我们发射火箭登上了月球。下一代的任务节省将是数字化的——让人类摆脱线上单调乏味的工作,进一步推动技术的前沿。


当我们的想象力是唯一的限制时,我们下一步将建造什么?




 


人工智能安全



 



Abnormal Security


阻止人工智能带来的网络攻击浪潮


推荐人:Saam Motamedi,Greylock 合伙人



+




我对生成式人工智能持乐观态度,但并不是天真乐观的。例如,我对“社交工程”攻击的激增感到担忧,这类攻击通常利用电子邮件获取敏感信息。自从去年ChatGPT爆红以来,这类事件的发生频率大大增加。Abnormal Security 数据显示,过去一年每 1,000 人中遭受的攻击次数已从不到 500 起跃升至 2,500 起以上。而且攻击的复杂性正在急剧上升。正如任何学生都可以使用 ChatGPT 写出一篇完美的论文一样,它也可以用来炮制出语法完美且危险的个性化欺诈消息,而无需进行 Google 搜索。


据 FBI 称,自 2013 年以来,此类有针对性的“商业电子邮件泄露”攻击已造成超过 500 亿美元的损失。而且情况还会变得越来越糟。每天,无数的网络犯罪分子和其他不良行为者都会使用“WormGPT”(一种聊天机器人,旨在挖掘恶意软件数据,以制定最令人信服且可扩展的欺诈活动)等黑帽工具。


幸运的是,Abnormal 联合创始人 Evan Reiser 和 Sanjay Jeyakumar 正在努力利用人工智能来应对这一威胁。把它想象成用人工智能来防御人工智能。从历史上看,电子邮件安全系统会扫描已知不良行为的签名,例如特定的 IP 地址或尝试访问员工的个人身份信息 (PII)。


通过人工智能的力量,Abnormal颠覆了这一点。由于增强型人工智能攻击被设计成看似合法,Abnormal的方法是深入了解良好的行为,以至于即使微小的偏差也变得可见。该公司使用大型语言模型来构建其数字内部和外部工作的详细表示,例如人们通常互相交谈的方式以及他们可能围绕什么进行互动。如果我的合作伙伴Reid Hoffman给我发了一封邮件,说:“嗨,请给我发送Inflection.AI的最新演示文稿”,Abnormal的人工智能引擎会迅速注意到Reid很少以“嗨”开头,也很少发送一句话的便签 - 而且他从未要求我给他发送关于Inflection的文件。(作为该公司的联合创始人和董事会成员,他对演示文稿的访问权限比我更高!)


毫不奇怪,随着对生成式人工智能安全问题的担忧增加,Abnormal公司看到了企业客户需求的加速增长。我发现Abnormal公司的成功特别令人满意,因为它迅速利用人工智能来对抗人工智能加速的问题。在颠覆性技术变革时期,恶意行为者往往享有长期的先发优势。毕竟,他们可以利用创新而不必担心产品质量、安全或尚未制定新法律的监管机构。


更多:邮件安全公司Abnormal Security估值已达40亿美元




 


全球创业市场





   




Mistral


来自法国的 OpenAI 竞争对手


推荐人:Stanislas Polu,Dust 联创



+




最近,生成式人工智能领域的项目在巴黎如雨后春笋般涌现。你可能会问为什么是巴黎?我的假设是,巴黎是拥有世界一流生成式人工智能人才最大储备的地方,而这些人才目前还不在OpenAI的视野范围内。在这些项目中,最令人瞩目的莫过于Mistral。Guillaume Lample、Arthur Mensch和Timothe Lacroix创立的Mistral的使命是构建最优秀的开源语言模型,并旨在在其周围培育一个繁荣的生态系统。


我认识 Guillaume 有四年了,我们都深入参与了大型语言模型 (LLM) 在数学(尤其是形式数学)中的应用。我们在 OpenAI 和 Meta 工作期间形成了友好的竞争关系。Guillaume 是我有机会共事过的最有才华的研究人员之一,我很高兴见证他从在 Meta 进行研究到创立 Mistral 的历程。在此过程中,我还认识了亚瑟·门施(Arthur Mensch)。他的工作一直给我留下了深刻的印象,特别是 Chinchilla,它重新定义了有效训练大型语言模型的含义,以及 RETRO,一种检索增强语言模型的方法,如果你问我的话,它仍然处于严重探索之中。


现在,让我们深入了解Mistral的特点。这家初创公司的愿景是构建一个以一流的开源模型为基础的生态系统。这个生态系统将成为项目、团队和最终公司的发射台,加快创新和创造性地使用大语言模型(LLMs)的步伐。


以从人类反馈中进行强化学习(RLHF)为例。通常情况下,进行RLHF是耗时的,因此代价较高。它涉及手动“标记”人工智能所采取的行动,这可能需要相当大的工作量。只有当AI模型有足够的潜力值得进行这项努力时,才会是值得的。对于像OpenAI这样的大型企业,投资这个过程是有意义的 - 公司有足够的资源来使其奏效。但是,传统的开源社区通常需要一个“领导者”站出来担起这个责任。


Mistral有机会实现这一目标,投资于开展对开源模型的RLHF(有人类反馈的强化学习)研究。通过这样做,Mistral将为创新带来一次寒武纪式的爆发。开源开发者将能够使用标记良好的模型,并对其进行调整和定制,以适应不同的需求。最终的受益者将是更广泛的市场,相比只有闭门造车的公司,市场将获得更多具体而引人注目的应用场景。


“拥有最优秀的开源模型的团队将处于有利地位,吸引更多关注和价值。我个人认为Mistral是最有希望的,因为该团队一直在积极推进效率/性能的前沿。而且,就破解这一领域而言,该团队的人才在全球范围内也是最优秀的。”


更多:成立四周融资1.05亿欧元 欧洲大语言模型mistral.ai融资备忘录全文




Sereact


智能的工业机器人


推荐人:Nathan Benaich,Air Street Capital 合伙人



+





我们经常听到这样的预测:从长远来看,人工智能和机器人技术将增强或自动化手动任务。如今,这日益成为一项紧迫的商业需求。


到 2030 年,欧洲的劳动年龄人口预计将减少 1350 万,劳动力成本正以二十多年来最快的速度上升。随着电子商务的兴起,仓库面临的压力比以往任何时候都更大,企业保持竞争力变得越来越具有挑战性。


"仓库运营中55%的开支来自订单拣选,但对于希望转向自动化系统的公司来说情况并不乐观。我们所熟知的以人工智能为先的SaaS应用程序,以及在其他生态系统中看到的开源产品的大量涌现,尚未在机器人技术领域得到体现。"


相反,寻求自动化分拣和包装的企业面临着选择昂贵、不灵活的机器人解决方案。他们必须浏览大量专有接口,这需要大量的编程时间和专业知识。这些系统还难以应对不断变化的产品组合,需要定期人工干预,并且在极端情况下表现不佳。


Sereact 解决了这些挑战。其软件以强大的模拟环境为基础,可训练机器人手臂了解任何潜在现实世界环境的空间和物理细微差别。然后,系统在部署后通过从实际数据中不断学习来进行优化。这也意味着他们可以应对抓取传统上具有挑战性的物品的挑战,例如电子设备、纺织品、软水果、瓷砖和木材。


最令人兴奋的是,他们的机器人技术堆栈采用了大型语言模型(LLMs),使得通过直观的自然语言控制机器人成为可能。他们开发了一个名为PickGPT的转换模型,允许用户通过语音或文本向机器人提供指令和反馈。这使得任何人都可以向机器人提出执行期望任务的请求,而无需拥有专业技术知识。



Sereact结合了其联合创始人的双重专业知识。首席执行官Ralf Gulde在人工智能和机器人技术的交叉领域进行了研究,而首席技术官Marc Tusher则专注于深度学习。这两位创始人在斯图加特大学进行了同行评审研究,该大学是德国最负盛名的自动化和工业制造领域的大学之一。


尽管是一家年轻的企业,Sereact已经吸引了一系列令人印象深刻的合作伙伴,包括戴姆勒卡车、Schmalz、Zenfulfillment、Zimmer Group和Material Bank。这表明拣选和包装行业有着巨大的潜在市场机会。


除了电子商务仓库中的明显应用(无论是拣货订单还是卸垛箱子)之外,还有一系列其他用例。例如,在传统制造中,有一个称为配套的耗时过程,其中涉及到组装所需的精细部件的艰苦收集。从历史上看,机械臂一直难以抓住小部件或在杂乱的环境中挑选出单个零件。Sereact 的软件可以识别这些组件并选择合适的夹具来挑选它们。


Sereact 团队将技术才华与对客户运营环境的敏锐理解以及帮助克服劳动力短缺和高效、持续运营的真正愿望结合起来。作为第一批将LLM和分拣包装相结合从学术可能性转变为现实世界影响的人,我对他们执行和扩展真正的机器人挑战者的能力充满信心。




更多阅读:

如何评估AIGC初创公司的竞争优势?

海外大模型市场竞争格局

AI合成数据市场竞争格局


如果您也在从事AI相关工作,欢迎扫码添加小编微信(pkcapital2023),和一群对创业和投资有热情的小伙伴一起交流

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存