阿里云通义听悟新增视频自动提取PPT;鸿蒙4.0或搭载AI大模型 | AI日报
欢迎围观“头号AI玩家”的「AI日报」栏目。AIGC前沿资讯,及时拿捏!
【1分钟速看版】
🔧 阿里云通义听悟新增视频自动提取PPT等功能
🌄 北大团队提出Dragon Diffusion,可一键拖拽编辑图像
🚗 百度Apollo官宣文心大模型首批智舱应用伙伴
💻 余承东“剧透”鸿蒙4.0:或搭载AI大模型
☁️ 百度千帆大模型平台接入LLaMA2等33个模型
🌃 传OpenAI正测试第三代图片生成模型DALL-E 3
🤖️ 英伟达发布Perfusion AI文生图模型,体积仅100KB
🎵 Meta发布AudioCraft,可帮助用户创作音乐和音频
🍎 郭明錤:苹果的生成式AI技术明年也不会推出
🏠 谷歌研究团队利用GPT-4击败AI-Guardian审核系统📰 澳大利亚新闻集团利用AI每周生成3000篇当地新闻报道国内资讯
1. 阿里云通义听悟新增视频自动提取PPT等功能
8月2日,阿里云通义听悟上线了三大新功能,包括国内音视频AI领域首创的视频自动提取PPT,以及浏览器插件、钉钉和微信小程序,帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容。
在通义听悟本次更新的功能中,“自动提取PPT”支持自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。“浏览器插件”功能支持用户开会、上网课、看直播、看视频时,可用Chrome和Edge浏览器插件全程录制,并实时生成双语字幕。(来源:快科技)
2. 北大团队提出Dragon Diffusion,可一键拖拽编辑图像
近日,北京大学张健团队、腾讯ARC Lab和北京大学深圳研究生院-兔展智能AIGC联合实验室共同合作,提出了一种在扩散模型上实现拖拽式图像编辑操作的开创性方法DragonDiffusion。
它可以支持多种图像编辑模式,比如物体移动、物体缩放、物体外观替换和内容拖拽,具有非常丰富的应用场景,同时解决了Stable Diffusion生成图片中部分残缺的问题,可以很好进行控制重绘。据悉,实验室近期还会推出原创对标Stable Diffusion的大模型。(来源:量子位)
3. 百度Apollo官宣文心大模型首批智舱应用伙伴
4. 余承东“剧透”鸿蒙4.0:或搭载AI大模型
8月2日,余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。(来源:财联社)
5. 百度千帆大模型平台接入LLaMA2等33个模型
8月2日,百度智能云“千帆大模型平台”升级了三大功能。百度智能云AI与大数据平台总经理忻舟表示,目前,千帆大模型平台已经全面接入LLaMA2全系列、ChatGLM2、RWKV、MPT等33个大模型,成为国内拥有大模型最多的平台。接入的模型经过千帆平台二次性能增强,模型推理成本可降低50%。
海外资讯
6. 传OpenAI正测试第三代图片生成模型DALL-E 3
近日,OpenAI正在准备下一代DALL-E AI模型(DALL-E 3),目前该公司正在进行一系列Alpha测试,而部分用户已经提早接触到了该AI模型。Discord上的一位匿名用户分享了他在测试 DALL-E 3时的体验。
澳大利亚新闻集团发布的招聘信息
今日话题
近期,在马德里Colección SOLO美术馆,迎来了世界上第一只专门写艺术评论的AI小狗A.I.C.C.A.。
然后,这篇附有作品照片的评论会被打印在热敏收据纸上,像拉粑粑一样被小狗排出😅。
各位玩家读艺术评论的时候,有没有遇到过这种情况:明明拆开来每个字都懂,但连起来却完全搞不懂。
说不定,艺术评论连AI小狗都写得更好一些噢。
头号AI玩家交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
也欢迎围观小红书@头号AI玩家,我们在这里日常练习AI绘画,目标每日一更。
欢迎分享、点赞、在看
一起研究AI