查看原文
其他

每日 AI 商业资讯-2024.3.28

洛克船长 洛克AI 2024-03-28

60年代美国对未来工作的预测:“到2000年,机器将生产出如此多的产品以至于每个人在美国实际上都将变得富有。即使是不工作的家庭,根据政府福利,按照某个估计,也将有年收入30,000至40,000美元(按1966年的美元计算)。如何有意义地使用闲暇时间将是一个主要问题。” —《时代》,1966年2月25日

“到2000年,人们每周工作不会超过四天,每天工作不会超过八小时。加上法定假日和长假期,这可能导致一个年度的工作周期只有147天,并有218天的休息日。” —《纽约时报》,1967年10月19日




今日热门 AI 新闻


🎨 OpenAI的Sora助力艺术家,激发创意探索 

💬 GPT-4或移除消息限制,DALL-E 3添加图像修补

📲 苹果将于6月10-14日WWDC透露AI计划

⚡ 扎克伯格亲自挖角谷歌AI人才加入Meta

💰 X Premium用户获得AI助手Grok访问权限

⚛️ 高效量子计算获重大突破

🌐 三星启动AGI计算实验室







今天我还会为您推荐

🆕 5款新AI工具

📄 最新AI研究论文

🔖 阅读完毕后,欢迎留言告诉我您的想法。


  • 01
    热点 AI 新闻详述


 🎨 Sora:初体验 

OpenAI的Sora在艺术界引起了热潮。与Trillo和Kleverov等艺术家合作,Sora生成了具有现实主义和超现实主义风格的视觉效果,助力创意探索。电影制作人Trillo称赞它能够突破局限,自由探索创意。对于像羞怯儿童这样的群体,Sora扩展了讲故事的可能性。此外,艺术家发现它能够克服技术障碍,实现快速原型制作和可视化。OpenAI的驻场艺术家Alex Reben正在探索将Sora生成的AI图像转化为实体雕塑的潜力,展现了它在各种艺术领域的多样性。

据估计,Sora每小时在每个NVIDIA H100 GPU上可以生成5分钟的内容。Factorial Funds预计,这相当于每个GPU每天可生成120分钟的内容,因此为像TikTok和YouTube这样的创作者平台提供支持,可能需要大约89,000个H100 GPU。然而,考虑到实际使用模式和高峰需求,这一数字可能会增加到大约720,000个GPU。此外,创作者通常会生成多个视频草稿,进一步加倍了硬件需求。OpenAI计划在今年晚些时候公开推出Sora,未来版本将融合声音和编辑工具。他们还将以好莱坞电影制片厂和经纪公司为目标,旨在将Sora整合到电影制作过程中。

💬 OpenAI暗示GPT-4和DALL-E 3将获升级:

消除限制,增强创造力 - Tibor Blaho最近的一项发现表明,OpenAI正在探索为即将推出的GPT-4和DALL-E 3模型引入创新功能。对于GPT-4,一项预期改进是取消消息限制,可能会被一个基于请求复杂度动态调整的系统所取代。此外,可能会实施"模型调优选择器",根据请求的适用性,在GPT-4和GPT-3.5之间进行优化资源分配。OpenAI还在测试一种"升级响应"功能,允许GPT-3.5和GPT-4输出之间更流畅的过渡。与此同时,DALL-E 3的潜在升级包括具有图像修补功能的图像编辑器,进一步拓展了它的创意潜力。

 📅 苹果WWDC 2024日期锁定:

AI战略即将揭晓 - 苹果已经宣布,其年度全球开发者大会(WWDC)将于6月10日至14日举行。虽然一些软件开发者将被邀请到公司园区参加第一天的活动,但大会将主要通过苹果网站直播。在苹果CEO蒂姆·库克2月份表示公司在AI领域有重大投资之后,分析师预计苹果将在大会上揭晓其期待已久的AI战略,并展示令人兴奋的消费者功能。传统上,WWDC将集中展示iPhone、iPad、Mac和Apple TV的软件更新。然而,今年还有一个额外的期待,那就是可能会推出Vision Pro虚拟现实头盔的首个重大软件更新。

 📝 看来马克·扎克伯格亲自试图从谷歌挖角AI研究人员加入Meta 

据报道,该公司正越过传统面试流程,并提供更高的薪资,试图吸引来自谷歌DeepMind等竞争对手的人才。Meta首席执行官马克·扎克伯格甚至亲自通过电子邮件与研究人员直接联系。这种积极主动的策略与Meta修改后的技术路线图保持一致,计划到2026年实现统一的AI模型来推动视频和新闻源推荐。

 💰 埃隆·马斯克表示,本周所有X Premium用户将获得访问AI助手Grok的权限 

 此前,xAI已于3月初开源了基于Grok大型语言模型的底层架构。现在,每月8美元的X Premium用户可以访问Grok,这个以能够处理敏感话题和提供非同寻常回应而闻名的AI助手。值得注意的是,Grok利用X平台的实时数据,这可能使它比OpenAI的ChatGPT和Anthropic的Claude更具优势。

 ⚛️ 全球范围内的安全量子通信更近一步 

 滑铁卢大学的量子计算研究所(IQC)的研究人员利用尖端人工智能实现了量子通信领域的重大突破。他们在《通信物理学》杂志上发表的研究详细介绍了一种基于人工智能的优化过程,用于从量子点源高效产生近乎完美的纠缠光子对。这种结合诺贝尔物理和化学奖的方法与人工智能相结合,比以前的方法效率提高了65倍。与加拿大国家研究委员会合作开发的这种新型光源,为量子密钥分发和全球安全通信网络带来了希望。

 🌐 三星加入AGI竞赛:启动新实验室并寻求国际合作 

 三星电子公司正式加入了通用人工智能(AGI)的竞赛,在美国和韩国启动了AGI计算实验室。由前谷歌AI芯片专家Dong-hyuk Woo博士领导,这些实验室将专注于开发专门用于AGI的半导体。最初的努力将针对于推理任务、服务应用和大型语言模型(LLM)的芯片。三星计划优化芯片架构以降低功耗,并将持续迭代新的设计。此举为三星与Meta等专注于AGI开发的科技巨头,以及此前曾表示有意与韩国公司合作设计AI芯片的OpenAI等公司开启了潜在合作的大门。


  • 02
    一句话新闻


> 高通推出S5 Gen 3声学平台,"AI性能提高近50倍" 

> 谷歌、英特尔和高通瞄准打破英伟达在AI领域的主导地位 

> Adobe的Firefly服务向开发者开放20多个生成式和创意API

> 高斯抚色技术让复杂体积效果的实时渲染更容易实现

> 阐释AI驱动的协作平台Zoom Workplace

> 介绍Stable Code Instruct 3B - 来自Stability AI

> Anthropic推动AI测试规范化,寻求第三方合作

> 警惕虚拟现实应用中的伪装漏洞

> 中国生成式AI开发者加紧升级聊天机器人处理超长文本

> 研究人员发现大型语言模型中一种出人意料的简单检索机制


  • 03
    5款新 AI 工具


Eternity AI

是印度理工学院帕特纳的一个研究项目,开创了一种具有实时互联网接入功能的LLM,减少了虚假输出,并集成了10万多个行为参数来模拟人类行为。

Otto Engineer

是一个自主的AI软件工程师,它在浏览器中使用Web Containers运行,可以安全地执行代码。它可以自行迭代和测试代码,支持npm包,无需任何设置。  

Martin

就像Jarvis一样是一个AI管家。它可以学习、集成日历,甚至处理电子邮件。由Deepgram、OpenAI和Claude-3提供支持。

TigerEye

是一款面向销售、营销和财务领导者的AI驱动规划工具。它支持快速场景测试和协作执行,提供预测性分析和参数化规划。

Pickaxe Studio

是一个无需编码的GPT商店平台。你可在其上出售AI工具和聊天机器人的收费订阅。部署工具、设置使用限制、监控活动。

  • 04
    arXiv 上值得关注的论文


📚 arXiv是一个免费的在线图书馆,研究人员在这里分享出版前的论文。

📄 大型语言模型代理操作系统

该论文提出了AIOS,一种将大型语言模型(LLM)与基于代理的智能相结合的创新操作系统。AIOS解决了代理调度、上下文维护和异构集成等挑战,优化了资源分配,支持并发代理执行,并确保了访问控制。论文介绍了AIOS的架构,强调了LLM专用内核设计和代理调度器、上下文管理器、工具管理器等核心模块。通过封装LLM和OS功能,AIOS使代理能够无缝地将LLM推理与OS级操作相结合,用于各种任务。该研究概述了AIOS的分层结构,从应用层到硬件层,凸显了它在推进基于LLM的代理开发和部署方面的潜力。

📄 FlashFace:保持高保真身份的人像个性化

FlashFace是一种新颖的方法,用于在保持高保真身份的同时实现人像个性化。与现有方法不同,FlashFace将面部身份编码为一系列特征图,保留了细节特征如疤痕和纹身。此外,它引入了一种解耦的整合策略,平衡了文本和图像指令,对于提示与参考图像冲突的情况尤为重要。FlashFace的架构包括用于特征图编码的参考网络、用于文本和图像控制信号的独立层,以及一种新颖的数据构建管线,确保参考图像和目标图像之间的差异。凭借这些创新,FlashFace实现了精确的语言控制和高保真效果,在人像定制和人脸交换等各种应用中得到了体现。

📄 Octree-GS:实现一致的实时渲染与LOD结构化3D高斯模糊

Octree-GS方法引入了一种基于层次细节(LOD)的框架,通过3D高斯模糊增强了实时渲染能力。传统3D高斯模糊技术在处理包含复杂细节的大场景时存在着不一致的渲染速度和不充分的细节级别表示等问题。Octree-GS通过使用分层锚点构造场景,并根据观察足迹和场景丰富度动态选择LOD,解决了这些问题。这种方法确保了一致的渲染性能,同时在不同细节级别下保持了高保真效果。Octree-GS在视觉质量和实时渲染稳定性方面均优于现有方法,并通过对多种场景的实验得到验证。尽管Octree-GS提高了细节捕捉能力而不牺牲性能,但八叉树构建和渐进式训练等某些方面仍需进一步完善以获得最佳性能。

📄 通过自动提示优化提高文本到图像的一致性

该论文提出了OPT2I框架,旨在解决当前文本到图像(T2I)生成模型在提示图像一致性方面的挑战。现有方法通常需要对模型进行微调,专注于附近的提示样本,并在图像质量、多样性和一致性之间面临权衡。OPT2I利用大型语言模型(LLM)迭代优化提示,旨在最大化一致性评分。它在生成经过修改的提示和使用所选指标评估一致性之间进行迭


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存