机器之心

其他

不到60秒就能生成3D「手办」,Meta发力3D生成,ChatGPT时刻要来了吗?

AI发布TripoSR的团队VAST。Meta此篇论文中引用了不少VAST团队的论文,不仅包括TripoSR,也包括刚被ECCV收录的UniDream、曾经爆火的Wonder3D、Triplane
7月3日 下午 7:08
其他

全球首台生物计算机开放服务:16个人脑类器官,能耗节省百万倍

机器之心报道编辑:泽南、亚鹂使用人类脑细胞,活的。科幻小说《三体》中,为了支撑科技的发展,人类提出了几种下一代计算机的方案,其中除了传统的冯诺依曼架构,还包括量子计算机和生物计算机。其中量子计算的概念现在已有大量研究,生物计算的研究却少有报道。近日,一家瑞士初创公司
5月27日 下午 12:20
经济

李飞飞亲自撰文:大模型不存在主观感觉能力,多少亿参数都不行

根本没有这些,就像它没有嘴巴放食物进去,也没有胃去消化食物一样。认为人们应该相信它说自己饿了的观点,就像是在说应该相信它说自己正在从月球的暗面跟使用者说话一样荒谬。人们知道这不是真的,LLM
5月24日 下午 12:43
其他

李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com在不久之前的
5月21日 下午 12:07
科技

OpenAI CEO下场回应「封口协议」,争议还是到了股权利益上,奥特曼:我的锅

进行国际治理,并帮助开创了评估人工智能系统灾难性风险的科学。其次,我们一直在为安全部署能力越来越强的系统奠定必要的基础。首次使用一项新技术并不容易。例如,我们的团队做了大量工作,以安全的方式将
5月19日 下午 12:34
其他

李飞飞解读创业方向「空间智能」,让AI真正理解世界

数据集。我们的进步非常迅速,从最初的图像标注到现在,算法的速度和准确性都有了显著提升。我们甚至开发了能够识别图像中的对象并预测它们之间关系的算法。这些工作是由我的学生和合作者完成的。
5月16日 下午 1:42
其他

Ilya官宣离职,超级对齐负责人Jan直接辞职,OpenAI还是走散了

按照现有路径发展下去,也许在不久的将来,一个超越人类的人工智能系统就会诞生。但更加令人担心的是,「超级人工智能」可能会带来一些意想不到的负面后果。这就是「对齐」的意义。这个团队的第一篇成果发布于
5月15日 下午 5:17
其他

OpenAI颠覆世界:GPT-4o完全免费,实时语音视频交互震撼全场,直接进入科幻时代

的话,不用等它说完就可以继续下一轮对话。其次,你不用等待,模型反应极快,比人类的回应还快。第三,模型能够充分理解人类的情感,自己也能表现出各种感情。随后是视觉能力。另一个工程师在纸上现写的方程,让
5月14日 上午 4:20
科技

闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香

等社交平台上看到它的身影。这些帖子一般有两个主题:通义千问又开源新模型了!通义千问新模型还挺好用!还有人以通义千问为例,反驳中国在人工智能方面落后的说法。而且,这一反驳并非来自主观感受。在最近的
5月9日 下午 6:08
其他

斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」

的发言人均对此保持沉默,李飞飞也未作回应。休假两年李飞飞被誉为「人工智能教母」,此称号源自「人工智能教父」称谓,通常用来致敬三位在计算机科学领域取得卓越成就的开拓者
5月4日 下午 12:12
其他

半年涨粉1000万,这个AI聊天搭子是怎么火的

机器之心报道编辑:蛋酱最近,很多快手用户都能发现,一个名叫「AI小快」的账号格外活跃。在视频作品的评论区,经常有人跟「AI小快」聊得火热,一个抛梗、一个接梗:如果你问点严肃问题,AI小快一样有问必答:没看明白的视频,还能帮忙解读:甚至还有离谱之中带有一丝合理的扩图,网友已经笑倒在评论区:这让人很好奇,「AI小快」到底是谁?新晋千万粉丝网红「AI小快」点开「AI小快」的主页,大家就明白了,它的正式职业是快手官方派来的
4月28日 下午 1:00
其他

当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律

一致的路线,即通过单一步骤直接生成高质量的视频。从底层来看,这是一种「一步到位」的实现方法,基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理,文本到视频的转换是直接且连续的。另外基于
4月27日 下午 12:47
科技

MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评

等领先大语言模型相比,“海螺AI"的一大亮点是支持语音交互,也是我们最先体验的功能。使用语音首先要有一个听整天都不嫌腻的声音,“海螺AI"为此提供了丰富选项,听起来还比较自然,不会太机械和生硬。
4月24日 下午 5:55
自由知乎 自由微博
其他

长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale AI数据库正式开源

都用低成本实现了高精度和高性能查询真实场景下性能和成本的平衡正因为向量检索在大模型应用中的重要性和高关注度,越来越多的团队投入了向量数据库这个赛道。大家一开始的关注点都是努力提升纯向量搜索场景下的
4月11日 下午 12:35
其他

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

Sora、视频生成技术、多模态大模型等前沿领域的技术突破和应用实践,助力企业和从业者紧跟技术发展潮流、掌握最新技术进展与技术突破。早鸟期即将结束,快来锁定入场席位吧!©
4月7日 下午 1:02
其他

国内首个AI程序员入职阿里云:专属工号AI001,KPI是一人写完公司20%代码

给程序员们带来了一波又一波冲击。这种革命性的进展,只花了两年多的时间。而通义灵码在阿里云正式上岗,标志着编程率先成为大模型技术落地的领域之一。编程语言的边界从此被打破,Java
4月3日 下午 12:03
其他

46秒AI生成真人视频爆火,遭在线打假「换口型、声音」

配音。更多其他人也支持这种观点,即在预先存在的视频(真人)中进行口型和声音替换。面对纷至沓来的质疑,视频上传者展开了「对线」。她表示,这段视频之所以看起来真实,是因为自己将脚本与
3月27日 下午 12:35
其他

来自科技进步一等奖的肯定:腾讯破解万亿参数大模型训练难题

年开始,大模型的兴起进一步提升了模型参数量,各大公司都推出参数规模达千亿、万亿大小的模型,这些模型普遍采用深度神经网络模型,存在模型分布式训练难和应用复杂带来的模型设计难两大核心痛点。为什么是
3月26日 下午 6:45
其他

突发!Stability AI的CEO,跑路了

AI、管理团队、董事会和投资者有机会共同致力于实现公司下一阶段增长的全面愿景。我们共同致力于保留多年来培养的卓越团队、尖端技术和充满活力的开发者社区,确保
3月23日 下午 2:25
其他

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

机器之心报道机器之心编辑部苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在
3月15日 下午 12:44
其他

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

Murati:平衡利润和安全并不是真正的难题,真正困难的部分是搞清楚安全与社会问题,这是我坚持下去的真正原因。记者:这个产品确实让人惊艳,但也引发不少担忧,我们也讨论过了,真值得吗?Mira
3月15日 下午 12:44
其他

刚刚,OpenAI官方发文驳斥马斯克,自曝8年间邮件往来截图

年成立时的宣言。另外,大家比较好奇的一点是双方邮件中的一句话,「不幸的是,人类的未来掌握在■■■的手上。」众多网友纷纷猜测■■■中是谁?谷歌吗?还有人发现了以前从未听过的有趣观点,「OpenAI
3月6日 上午 11:55
其他

0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

Demo:https://huggingface.co/spaces/stabilityai/TripoSRTripoSR
3月5日 上午 10:49
其他

53页PDF广泛流传,核心员工相继离职,OpenAI到底有什么秘密?

被解雇的前一天,他参加了一个活动,并且在访谈环节发表了一些引人猜测的言论,比如「这是我们创造的工具还是我们创造的生物?」「这将是我们最大的更新。」很多人将其解读为,OpenAI
3月4日 下午 12:29
其他

因为AI,构建「腹部地图」这个医学工作加速了数百倍

人体器官分割是医学图像分析的关键技术,在自动化疾病诊断和手术治疗中发挥着重要作用。传统的医学图像分割依靠放射科医生手动完成,耗时费力。例如,绘制单个腹部器官的标注通常需要放射科医生大约1小时的时间。约翰霍普金斯研究团队通过利用放射科医生和智能算法相结合的优势,对近万例CT扫描中的25种人体组织结构进行了详细标注,也对其中部分肿瘤提供了伪标注,构建起名为“腹部地图”的重要医学工具。用传统方法完成这项工作需要花费放射科医生近107年。据估算,该智能算法能为后续绘制更大规模,更大范围的“人体地图”加速至少533倍。腹部地图的建立可以为多个医学领域,例如自动手术规划,人工智能(AI)研究,虚拟/增强现实,临床教学等,提供丰富的数据支持。前期实验表明,在腹部地图上训练的AI模型能够自动识别器官边缘,在准确率,鲁棒性,迁移性上超越现有模型水平,大大减轻了人工标注的负担,为后续应用在癌症检测和量化等相关任务中提供可能。该项目的研究成果发表在医学影像分析,机器学习,计算机视觉领域的顶级会议中,例如MICCAI,RSNA,NeurIPS,ICLR,ICCV等,在这期间构建的大规模医学数据集将在ISBI和MICCAI的挑战赛中与大家见面。
3月2日 上午 10:24
其他

马斯克起诉OpenAI:他们做出了AGI还授权给微软,这是对创始协议赤裸裸的背叛

的董事会,他早些时候表示,有人向他提供了这家初创公司营利部门的股份,但他出于原则立场拒绝接受。不过,马斯克想打赢这场官司可能没有那么容易,因为他所给出的诉讼文件涉及一些尚未理清的事实,比如
3月2日 上午 10:24
其他

刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

可以培养下一代「创作者」(creator)。只需要一张图像就可以创建一个全新的交互环境,这为生成和进入虚拟世界的各种新方法打开了大门。例如,我们可以使用最先进的文本生成图像模型来生成起始帧,然后与
2月26日 下午 6:20
其他

国内公司有望做出Sora吗?这支清华系大模型团队给出了希望

这个小组也并没有去考虑太多关于商业和产品的事情,所以可能他们在最开始的时候主要还是聚焦在如何实现真正好的视频生成能力,然后去相信说只要我有这么强的能力,上面一定能搭出更多的商业化产品。对外赋能底层
2月26日 下午 6:20
其他

Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了

生成的图在质量上实现了很大改进,支持多主题提示,文字书写效果也更好了。以下是一些官方示例:提示:史诗般的动漫作品,一位巫师在夜晚的山顶上向漆黑的天空施放宇宙咒语,咒语上写着
2月23日 上午 10:45
其他

OpenAI工程师必备经典《苦涩的教训》,原来20多年前就有了原型

研究人员常常试图在自身智能体中构建知识,从短期看,这通常是有帮助的,能够令研究人员满意,但从长远看,这会令研究人员停滞不前,甚至抑制进一步发展,突破性进展最终可能会通过一种相反的方法
2月23日 上午 10:45
其他

开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用

所示。参考链接:https://www.theverge.com/2024/2/21/24078610/google-gemma-gemini-small-ai-model-open-source©
2月22日 上午 12:04
其他

Sora为何出自OpenAI?一线员工作息时间线揭秘:我们疯狂地卷

再次宣布离职,这次只待了一年。虽然他表示「没发生什么特别的事情」,不过在第二天又秀了一下日程表:让人感觉到溢出屏幕的轻松。只有产品上线之前的一线工程师才这样吗?并不是。引爆了生成式
2月21日 上午 11:45
其他

7万亿美元:OpenAI超大芯片计划曝光,要重塑全球半导体行业

就增加芯片、能源和数据中心的全球基础设施和供应链进行了富有成效的讨论,这对于人工智能和相关行业至关重要。鉴于国家优先事项的重要性,我们将继续向美国政府通报情况,并期待稍后分享更多细节。」7
2月10日 下午 12:35
其他

黄仁勋:从此之后,请叫我黄院士

NSF)。当选美国国家工程院院士是工程领域专家的最高专业荣誉之一,以表彰入选者「在工程研究、实践、教育等方面做出的重大贡献」,「在新兴领域技术做出的开拓性工作和传统工程领域中的重大贡献」以及「在开发
2月7日 下午 12:01
其他

俄罗斯小哥ChatGPT找女友:聊了5239个女生,现在订婚了

名女生进行过沟通……」来源:https://twitter.com/biblikz/status/1752335415812501757最近几天,社交网络上人们正在轮番向一位俄罗斯小哥送去祝福。23
2月6日 下午 12:44
其他

胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览

就需要付费了(打折促销码:MESHY2GO)。感兴趣的读者可以去尝试一下:https://app.meshy.ai/zh/login©
2月6日 下午 12:44
其他

看房、打碟、开特斯拉车门、吸尘攒金币:刚刚,第一批把Vision Pro抱回家的人已经开玩了

还是有一些「硬伤」的,比如头显太重,长时间佩戴不舒适;续航时间不够长,插电使用活动范围受限;虚拟键盘点击不方便;视场角小,画面有黑框等等。这些问题的存在会让人产生疑问:等这波热情退却,已经购买
2月3日 下午 12:35
其他

小红书开源「InstantID」效果炸裂,被Yann LeCun点赞,迅速蹿上Github热榜

榜首,许多小伙伴玩得不亦乐乎~比如,把马斯克送上了火星。让蒙娜丽莎拍「樱花写真」,微笑依旧很神秘。甚至可以让语文课本中的杜甫从二维变三维,穿越到现代变身「帅大叔」。图灵奖得主
2月1日 下午 12:39
其他

刚刚,字节版GPTs「扣子」上线了

chatbot(聊天机器人),无需有编程经验,扣子就可以快速创建出各种类型的聊天机器人,并将它们部署在不同的社交平台和应用程序上。创建完成之后,发布流程也十分简洁。扣子支持发布到
2月1日 下午 12:39
其他

Hinton、LeCun、Bengio三巨头,马维英、陈海波等华人入选,2023 ACM Fellow公布

Chen)机构:上海交通大学入选理由:为改进操作系统和分布式系统的可扩展性和安全性做出贡献。陈海波为上海交通大学特聘教授、并行与分布式系统研究所所长,领域操作系统教育部工程研究中心主任。他曾当选
1月25日 上午 11:08
其他

一键实景转动画,清华系初创公司全球首发4D骨骼动画框架,还能生成个性化角色

模型的先验知识,即便输入的视频未覆盖完整物体,「AnimatableDreamer」也能自动补全画面信息,实现较好的生成质量。可以说,「AnimatableDreamer」的提出直接打通文本到
1月19日 上午 10:57
其他

安徽,全面瞄准通用人工智能

的生态体系,打造活跃、开放、创新的通用人工智能产业生态,将安徽打造成具有全球影响力的人工智能科技创新策源地和新兴产业聚集地,为全面建设走在全国第一方阵的高水平创新型省份和科技强省提供新引擎。“1”
2023年12月31日
其他

华为诺亚的盘古Agent来了,让智能体学会结构化推理

为:作者强调需要将这些函数与外部函数分开定义、学习和使用,这样用户就可以重新定义任何被认为对其任务有帮助的任意嵌套。我们可以根据方程重写盘古智能体的优化问题。更详细的形式为:其中
2023年12月26日
其他

陶哲轩青睐的证明助手Lean,用上了大模型

的白盒自动化项目)相结合,来搜索多策略证明。找到证明后,你可以单击该策略以将其插入编辑器中。前提选择。该策略用于检索潜在有用前提(premises)的列表。目前,Lean
2023年12月16日
其他

​陶哲轩用 AI 形式化的证明究竟是什么?一文看懂 PFR 猜想的前世今生

1,便能得到所有奇数。像这样的有移位(shift)的子群称为陪集(coset)。陪集并不具备子群的所有性质,但它又能保留子群在许多方面的的结构。举个例子,奇数和偶数一样是均匀分布的。Timothy
2023年12月10日
其他

五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈

模型都必须是时间和输入不变的,这样才能提高计算效率。为此,研究者采用了一种硬件感知算法,通过扫描而不是卷积来计算模型,但不会将扩展状态具体化,以避免在
2023年12月5日
其他

简化版Transformer来了,网友:年度论文

的每次更新轨迹在不同深度下几乎没有区别。BERT接下来,作者展示了他们的简化块性能除了适用于自回归解码器之外,还适用于不同的数据集和架构,以及下游任务。他们选择了双向仅编码器
2023年11月28日
其他

全网大讨论:引爆OpenAI全员乱斗的Q*到底是什么?

Q-table,更新规则通常表示为:图源:https://twitter.com/BrianRoemmele/status/1727558171462365386Q-learning
2023年11月25日
其他

留给谷歌的时间不多了:18年老员工辞职炮轰领导层

年担任谷歌首席执行官)经常根据董事会的讨论领导公司。各种产品的成功和失败也是客观的,成功者收获赞扬,失败者收获批判性的经验,目的是吸取教训而不是追责。公司有一个远景,有所偏离时也会做出解释。在
2023年11月24日
其他

一封信导致Sam Altman被开除?神秘「Q*」项目曝光,进化令人震惊

的致敬,该程序可以下国际象棋、围棋和将棋。该团队假设,给语言模型更多的时间和计算能力来生成对问题的回答,可能会让它们在学术上取得新的突破。知情人士透露,Transformer
2023年11月23日