海外独角兽

其他

Voice Agent:AI 时代的交互界面,下一代 SaaS 入口

技术,能够为多达四名儿童提供个性化互动,且在不使用客户数据的前提下,根据用户反馈持续更新,从而提升智能和同情心。请点击文章末尾处阅读原文查看参考文献。排版:Doro延伸阅读为什么英伟达能达到
7月26日 下午 8:58
其他

为什么我们相信英伟达能到 5 万亿|AGIX 投什么

万亿美元左右。市场上会有观点认为,因为竞品的快速追赶,英伟达护城河与此同时也在不断变窄,但拾象的判断是:推理对系统要求更高,英伟达系统的护城河其实是越来越宽的,这是英伟达实现
7月24日 下午 10:03
其他

专访 Luma AI 首席科学家:我们更相信多模态的 Scaling Law

之前,他们几乎没有特别好的正向现金流,但这个产品一出现,大家的兴趣都被激发出来了,商业模式也很容易推广。我觉得多模态模型也是类似的情况,我们可能还需要再等一等。海外独角兽:多模态的生成未来也会是一个
7月22日 下午 8:05
其他

10 万卡集群:通往 AGI 的新门票

Transformer,让模型具备处理大量视频、图像、音频和文本数据的能力。目前还没有人能完成这项任务,但各大公司正在积极扩张。OpenAI/Microsoft、xAI
7月17日 下午 8:04
其他

通用机器人是 AI 时代的新 "iPhone" 吗?

机器人数据机器人数据不足也是通用机器人面临的一大问题。这里的机器人数据指机器人与现实世界交互的数据。除了真正将机器人部署至实际生产环境中、实际使用之外,机器人数据收集方式还包括以下几种:•
7月12日 下午 8:19
其他

专访 LanceDB 创始人:多模态 AI 需要下一代数据基建

合作处理文本。我们也正在与一家暂时不能公开的大型视频公司合作。在所有这些模态中,共同的特点是庞大的数据规模、复杂的检索与数据管理需求,以及需要与分布式训练无缝集成。海外独角兽:这会回到我们之前提到的
7月11日 上午 10:27
其他

Kore.ai:LLM能否为AI客服带来新一轮洗牌与机遇

客服行业第二至四阶段的颠覆从问答和对话增强开始、到多方位价值机会,再到企业数据利用。因此,我们判断成立年限较长、有一定行业经验和客户积累的公司比新的初创公司受益更大。在过去一年,Kore.ai
6月27日 下午 8:12
其他

为什么 AGI 应用还没有大爆发?

是对“模型即产品”、“模型即应用”这种说法的反击吗?因为创始人说他是先思考产品,再思考模型,而不是像很多大模型公司提出的是先提高模型能力、再同步去想产品。二者之间的思考逻辑其实是反的。Guangmi
6月24日 下午 9:11
其他

互联:让数据中心成为新一代计算单元

到最多价值。本篇内容是我们对数据中心互联的主题研究,通过对各个互联环节的细颗粒度拆解,来厘清互联的现状、趋势和关键机会。以下为本文目录,建议结合要点进行针对性阅读。👇01
6月21日 下午 9:32
其他

拾象AGIX指数发布:AI 时代的纳斯达克100

也是一种强大的底层通用能力,我们正在通过投入算力、投入对可解释性的研究,尝试驾驭这个能力。在通用技术出现的早期,期待其作为独立产品并产生巨量收入,显然是对其能力的低估和短视。2.
6月18日 下午 10:39
其他

OpenAI联创:RLHF是超级智能的秘密武器

Schulman:我很难准确说出来瓶颈会是什么。除了执行任务的连贯性之外,模型在和人类交互时还存在各种问题,比如很难深入思考事物,或者关注用户提出的具体问题,所以我不认为仅仅改善一点连贯性就足以实现
5月30日 下午 8:47
其他

AGI马拉松与大基建

这类数据。而且人类无法规模化复制,运算能力也不够强。碳基跟硅基是可以很好地互补。就像人无论跑得多快也比不上轮子的转动速度一样,硅基智能有可能是未来地缘博弈最大的一个关注点。未来十年主题可能就是硅基的
4月23日 下午 8:01
其他

Writer:企业级全栈式文字生成平台,如何对抗ChatGPT冲击?

界面、电子邮件、基本管理员工具等功能。后者除以上功能外,还包括支持多个团队、API访问、数据集成、深度定制模版、高级安全性支持等进阶功能,需咨询定制服务价格。02.客户与场景Writer
4月22日 下午 8:02
自由知乎 自由微博
其他

Suno AI:音乐生成迎来MidJourney时刻,Suno能否挑战Spotify?

键盘、混音设备等,目前部署一套基础的设备需要约几千美元,更早期需要的投资更多。制作周期取决于音乐类型和规模,从几天~几个月不等,成本从几千~几十万美金不等。根据多家咨询公司的估算,市场空间大致为
4月19日 下午 8:07
其他

Vercel:用生成式UI重塑前端开发

正在重塑软件的生产方式,而前端开发是最先可能受影响的领域:前端开发逻辑适合模板化,且开发者多、头部开发语言集中。前端的视觉属性适合用户快速表达偏好,形成数据飞轮。随着前端代码能够被实时生成,生成式
4月2日 下午 8:13
其他

红杉美国:GenAI是一场10倍速的生产力革命

只是重复以往数据中的统计模式,而非真正地进行深入的思考和逻辑推理,这种状况将会通过新的研究方向得到改善。一些研究正在尝试让模型更好地进行推理环节计算和游戏式价值迭代(gameplay-style
3月30日 下午 1:31
其他

AI重塑法律行业:为80%的工作带来10x提升

协助律师查找法条及案例,起草、审核合同,使律师专注制定核心方案策略。如人工审核法律合同错误率高、消耗时间多、会存在主观偏见;LLM
3月29日 下午 8:01
其他

Sora的算力数学题

还可以被用来进行数据增强,也就是将对现有视频的展现方式进行各种各样的转换。这里提到的数据增强实际上已经可以通过上面的技术报告中的示例来说明了。原始视频中,一辆红色汽车行驶在一条森林道路上,经过
3月27日 下午 8:05
其他

Notion CEO:为什么RAG会彻底改变知识型工作?

出现之前,人们之所以需要计算机是因为需要一个地方来存储信息,并且可以随时检索、调用这些信息,但检索主要依赖于关键词,并且这个词要相当精确,因此有的时候还会要求用户具备一些优化关键词的技巧。但有了
3月6日 下午 8:02
其他

我们距离AGI还有多远?

倍的计算硬件资源,但搜索确实是机器学习中最可靠的理念之一,它的一大优势就是真实有效性。我们现在使用搜索较少,是因为我们已经找到了更好的计算使用方法。如果我们没有更好的算法,搜索将始终是一种会消耗额外
2月29日 下午 8:01
其他

Scaling能通往AGI吗?

HumanEval。在这些测试中,模型展现出了和人类平均水平相当甚至更高的性能表现,但这并不能作为智能程度的准确衡量标准,因为当前模型在智力方面远不如人类。•
2月21日 下午 8:02
娱乐

专访月之暗面杨植麟:lossless long context is everything

的定制化去完全取代微调?我认为现在正在往这个方向走,未来模型不需要微调,而是通过强大的上下文一致性和指令跟随能力来解决问题,长期趋势应该是底层技术个性化,这会是一个很重要的变化。比如,GPT-4
2月8日 下午 3:57
其他

Perplexity CEO:AI 创业公司要先做产品,后做模型

最终决定使用哪些链接来构成答案,并不意味着你可以随意向模型提供低质量输入,然后期待它能变魔法似的从中提炼出最相关的链接,还标好了所有的引用。其实你向这些能处理大量上下文信息的模型提供的信息越多,出现
2月1日 下午 8:06
其他

八问Canva:在AI时代称王还是落败?

内部在高优升级这一点。ReferenceBlogs@Canvahttps://www.meritechcapital.com/benchmarking/comps-table延伸阅读新摩尔时代:拾象
1月10日 下午 8:04
其他

新摩尔时代:拾象 2024 LLM 猜想

也将会是一个多模态模型。短期内,图片、视频、3D、音频等多模态的生成和理解是两条赛道,站在终局视角,随着智能能力的提升,理解和生成能力一定是一体的,单一模态模型更像是一种中间过渡态。•
1月6日 下午 2:01
其他

专访VideoPoet作者:LLM能带来真正的视觉智能

实现了一种向量化的映射器,将图片这类非文本的多模态信息先编码映射到大语言模型的词汇空间中,实现图片到文本转译,再通过金字塔形逐层细化的图片文本转译,从而实现对图片的文本化精确理解。Tokenizer
1月4日 下午 1:12
其他

跨年对谈:千亿美金豪赌开启 AI 新摩尔时代

张小珺:你觉得往未来看的话,发展应该关注的有哪些核心的要素?李广密:大模型再往后就关注两条主线,我们自己内部总结为“新时代摩尔定律”。第一条主线就是智能能力的进化,主要关注推理能力。未来参数量数据
2023年12月31日
其他

Speak:用LLM重塑语言学习,再造一个Duolingo?

的创新在于用差异化的“北美教师”供给和线上授课的方式降低了少儿外教的门槛。从成本和教学体验维度来衡量,我们可以把现有的学习解决方案进行简单分类:1)基于录播课的异步学习公开资源和工具(如
2023年12月15日
其他

Mistral AI:开源不是威胁,模型变小才能催生Agents

工作。RETRO:在大模型的训练中,为了实现更高的模型性能,会同步增加数据量,从最初的万级,到达现在的千亿级,这种方式虽有效,但是难免会有如数据集难理解、增加模型偏差等一系列问题。DeepMind
2023年12月8日
其他

LLM-first IDE:Code Agents 超级入口,软件开发的“Excel 时刻”

从报错信息中得知你可能打错了文件名/文件路径,会主动用文件夹浏览工具扫描代码库,它要么会告诉你这个文件夹里没有此文件,或是建议另一个类似的文件名(可能是大小写错误)。由于我们仍处于
2023年12月6日
其他

Filming Less:AI时代的视频剪辑产品淘汰赛

功能上都做得比竞品好将是决定性的优势,因为当前创作者的剪辑工作流正在变得更分散,使用不同的工具(各个单点上最好的)用于主要剪辑、配字幕、调色、画质增长、视效等,建立单一平台内绝佳的
2023年12月1日
其他

专访Pika Labs创始人:探索视频生成的GPT时刻

Demi:我们会发布新的模型,新产品和以前比会有很大的变化,首先肯定是生成质量的提升,能够生成的内容风格会更多,其次,编辑上也会更加灵活,我们会提供画布延展、局部重绘、视频时长拓展等功能。使用上除了
2023年11月29日
其他

Mistral AI:欧洲最强模型团队,打造开源轻量LLM

技术工程能力相对较弱相较于美国等地的科技公司,欧洲的企业在技术工程方面相对较弱。这为LLM公司提供了进入市场并提供技术支持和服务的机会。根据行业进行拆分,欧洲公司主要为传统公司,技术工程能力弱:•
2023年11月23日
其他

2023独角兽市值分析:Gen AI的崛起与地域分布

家独角兽。总体来看,这可能暗示湾区的独角兽数量稍显逊色。我们将持续关注这一重要指标的变化。北京和上海的独角兽公司占据了中国独角兽总数的五分之三,以及总市值的三分之二。深圳的独角兽市值为
2023年11月17日
其他

Figure:为人类部署数十亿台人形机器人

Interface),可以直接与我们的物理世界互动。它的出现将为人类带来诸多益处,有助于解决劳动力市场中的重要问题,例如提高人们在工作中的生产率,减轻家务和护理老人的负担。我们的远期计划是在全球部署
2023年11月9日
其他

Endor Labs:比Snyk更进一步的开源安全卫士,Prisma Cloud操盘手创立

Analysis,软件组成分析)围绕“漏洞”的开源安全叙事转变为围绕“可触达性”和“依赖关系”。这一叙事的完整逻辑很清晰:大量的组织在今天已经不是在做“软件开发”,而是“软件组装”
2023年11月2日
其他

Hex:数据行业是否会出现“Figma” 的机会 ?

作者:Kefei、Zongqing编辑:penny排版:Scout当前每家企业都在加大对数据的投入,企业内部数据参与者越来越多,企业开始要求非数据职能的员工也要具备数据素养,如产品、运营、财务人员等等,他们对数据分析和可视化的需求也在提升。然而,协同、共享和发布数据工作仍然复杂,数据行业仍然未出现像
2023年10月31日
其他

Inceptive:指令药物时代的 AGI 编辑器

folding)就是个很好的例子。即使我们假设在蛋白质折叠的环境中没有伴侣蛋白和其他物质,也很难解答蛋白质折叠的过程是什么,或者最早促使蛋白质翻译开始的动力是什么。(拾象注:在生物学中,翻译是指将
2023年10月25日
其他

Character AI:如何把LLM变成人类想象力引擎?

早期存在忽视社区的问题,缺乏与用户的沟通,引起用户强烈不满。但近期加强了社区团队,改善了用户关系。但用户对团队设置过滤机制的反对意见始终很强烈,希望能进行更开放的角色扮演。因为色情和暴力内容属于
2023年10月20日
其他

Nile:前Cisco掌门人创立,用AIOps重构千亿企业网络

招募渠道伙伴的页面非常强调“高两位数分润”、“正向现金流”、“co-sell”等关键词,证明对经销商的心理理解很深,主打“共赢”和“一起赚钱”。这些元素在
2023年10月17日
其他

AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?

的延迟宽容度还比较高。但未来对于许多应用来说,低延迟是至关重要的,其速度直接影响了知识工作者的工作效率。例如最极端的,在自动驾驶汽车或高频交易系统中,延迟的减小可能会直接影响到系统的性能和安全性。
2023年10月13日
其他

Sambanova:前瞻的芯片能匠,软硬结合抢滩企业LLM Serving

的使用门槛,更引入了开源模型的灵活性和适应性。通过提供友好的用户界面,它将帮助那些入门级的用户(比如一些小金融机构和制造公司等)更容易地定制和应用复杂的模型,以满足他们具体的业务需求。此外,客户尝试
2023年10月12日
其他

Synthesia: AI Avatar的PMF样本,像PPT一样做视频

就预言,合成媒体正在成为人们日常生活的一部分,它会极大地降低内容创作的门槛,实现前所未有的创造力表达。或许这会进一步改变人与人之间的沟通方式,催生出全新的内容消费形式。客观来说,Synthesia
2023年9月27日
其他

GenAI云计算百亿角斗场,算力之外的错位博弈

以上。总而言之,我们期待上述的五股趋势将多样化模型和云计算格局,而其中也必然孕育着巨大的投资机会。接下来,我们会从硬件、软件、商业化和服务等角度详细比较各家云计算公司的优劣势。综合来看:•
2023年9月21日
其他

11Labs:声音模态能否突围OpenAI?

年成立的公司兴起前,文本到语音本身的转换已经很好了,有多种音色可供选择,但是缺少自然度,并且在长音频中严重缺乏情感及韵律的变化。随着模型变大,这些模型的速度、韵律、情感、语调都更接近人类,终于在过去
2023年9月14日
其他

“AI版YC”创始人:我们要如何跨越AI Hype Cycle?

improvement),这个很好理解。但他另外一个更有趣的观点是,人们之所以对资本主义感到不适,是因为资本主义从根本上来说是一种基于生物基质运行的程序,对人类来说并非理想环境。尼克·兰德(Nick
2023年9月8日
其他

Jan Leike:OpenAI将如何在4年内实现超级对齐?

如何执行称为间接对象识别(IOI)的自然语言任务来弥合机械可解释性在复杂大模型中表现的差距,证明对大型机器学习模型的机械理解是可行的,这为可解释性扩展到更大的模型和更复杂的任务提供了机会。Jan
2023年8月31日
其他

Luma AI会是3D领域的Midjourney吗?

场景有限,收集数据的难度更大,成本也更高。至于哪条路径更好?行业最后是否会收敛到其中一条路径?又或是有新的路径?这些问题目前在学术界仍有争议,暂时无法给出明确的结论。03.团队•
2023年8月29日
其他

Alkira:SD-WAN 先驱再创业,多云网络对 GenAI 关键吗?

设备管理团队、网络团队、安全团队、云团队各自负责一摊事,给网络的集中管理和可见性也带来挑战。华纳音乐集团的诉求是一个统一的网络环境、大型企业级别的云网络质量以及配套集中的管理与治理。它
2023年8月25日
其他

Anthropic创始人访谈:Scaling与强化学习,可解释性与AGI安全

Function)的时候,我们才需要担心这类问题,但现在我对模型、尤其是模型内部机制的研究后,我的观点发生了动摇:大模型似乎已经具备成为主动代理所需要的诸多认知机制,比如归纳头(Induction
2023年8月18日