查看原文
其他

8月AIGC复盘:AI绘画模型迎来新王;大厂加速“收购”AI独角兽;AI换脸技术滥用重创韩国

AI新榜 AI新榜
2024-09-24

这里是“AI新榜”的月更栏目:AIGC月刊。每月更新,以下是我们梳理汇总的2024年8月AIGC行业趋势、AI热点要闻、新上线的AI工具和AIGC热门应用案例。希望能带给你一些启发和思考,也欢迎在评论区和我们交流你的所思所想。




8月AIGC行业趋势


1. AI绘画开源模型新王诞生


8月1日,Stable Diffusion团队前核心开发人员Robin Rombach宣布成立黑森林实验室(Black Forest Labs),并推出一款开源文生图模型FLUX.1,这在AI领域引起了巨大震动。

FLUX.1拥有12B参数,测试数据显示,其性能大幅度超过了DALL·E 3、Midjourney V6闭源模型,开源SD3系列的Ultra、Medium、Turbo和SDXL被全线秒杀。


最让人惊艳的是FLUX.1极其逼真的写实风格生图,与xAI新发布的Grok 2合作后,各种创意图片刷屏X,有评论称:“我们正在进入一个不需要跟KOL付费合作的时代,品牌只需要用AI生成与他们的美学相匹配的influencer就行了。”


FLUX.1共包括三个版本:Pro版,提供最先进的图像生成性能,通过API使用;dev版,非商用的指导蒸馏模型,继承了Pro版多数性能;schnell版,最轻量级的版本,可以商用的开源模型。

FLUX.1的发布与开源对于推动文生图技术创新、提升模型质量、增加行业透明度、促进AI技术的普及与应用都意义重大。团队表示,文生图只是一个开始,未来还会推出文生视频模型,和Sora、Gen-3、Luma等一线产品过过招。可见,随着AI技术的不断发展和应用,AI在创意产业中的作用将越来越重要,能为艺术家、设计师和更多创作者提供强大的新工具。

Flux.1官网:https://blackforestlabs.ai/announcing-black-forest-labs/
相关阅读:《文生图赛道又出黑马,爆火的Flux真能拳打Midjourney吗?(附对比实测)》

2. 大厂“收购”AI独角兽


AI独角兽企业在今年下半年面临了一些显著的变化和挑战,随着研发成本的增加和盈利模式的不确定性,融资变得更加困难,一些AI独角兽开始寻求与大型科技公司的合作或被收购。

Adept AI、Humane和Stability AI在内的几家明星AI初创公司纷纷传出寻求“收购”的消息。但与传统的直接收购不同,这种 “挖人、授权技术” 的模式被The Verge称为“反向收购招聘”(reverse acquihire),最早由微软在今年3月收购Inflection AI时使用,而亚马逊也在6月对Adept AI的交易中采用了类似的模式,他们招募了该公司约66%的员工,包括联创兼CEO David Luan在内的核心团队,并获得了部分技术的非独家授权。

到了8月,AI独角兽们加速卖身大厂,谷歌以超25亿美元收购Character.Al,联创Noam Shazeer和Daniel De Freitas将重返谷歌。据The information消息,由四位前谷歌员工创立的AI图像公司Ideogram,已经至少与一家科技公司就出售Ideogram进行了谈判。


而当前中国的AI融资市场仍旧火热,百度、阿里、腾讯等大厂都在加码投资。月之暗面8月完成新一轮3亿美元融资,投后估值33亿美元,目前在AI六小龙中估值最高(智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰六家表现突出的AI初创公司,业界称之为“AI六小龙”)。

不过海内外的AI行业正在经历一轮洗牌期,AI独角兽如果无法找到可持续的商业模式和合作伙伴,很有可能还是会被大厂收购,行业整合趋势明显。

参考:《大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!》
《AI行业现状:巨头主导,创业公司寻出路》


你可能错过的10大AI热点


1. 欧盟《人工智能法案》正式生效,罚款最高达全球年营业额7%


8月1日,在欧盟官方发布《人工智能法案(Artificial Intelligence Act)》最终完整版本20天后,全球首部全面监管人工智能的法规正式生效。

据介绍,《人工智能法案》旨在确保在欧盟开发和使用的人工智能是值得信赖的,并有保障措施保护人们的基本权利。《人工智能法案》规定,对违反被禁止的人工智能应用程序的罚款可能高达全球年营业额的7%,对违反其他义务的罚款最高可达3%,对提供错误信息的罚款最高可达1.5%。该法案中的所有条款将在两年内全面适用,但其中一些将会更早实施。

2. AI独角兽Character.Al超25亿美元卖身谷歌


AI独角兽Character.Al管理层近日透露,谷歌将以每股约88美元的估值收购Character.Al投资人的股票,大约是该公司在2023年A轮融资股票价值的2.5倍,当时Character.Al的估值为10亿美元。因此,谷歌对Character.AI的整体收购价值将超过25亿美元。

目前,谷歌已向Character.AI支付模型授权费,并将整合Character.AI创始人兼CEO诺姆·沙泽尔、总裁丹尼尔·德弗雷塔斯,以及约30名从事模型训练和语音人工智能工作的员工加入Gemini AI项目。

3. AI视频模型Gen-3 Alpha Turbo向免费用户开放


8月15日,Runway宣布其最新训练的模型Gen-3 Alpha Turbo适用于所有计划,包括免费用户的试用计划。据介绍,Turbo版本目前支持图生视频,其生成速度是原始Gen-3 Alpha的7倍,价格仅为原来的一半。

4. 百名视频创作者起诉OpenAI


近日,一位YouTube博主在美国加利福尼亚州北区地方法院正式递交了集体诉讼文件,指控OpenAI擅自转录了数百万个YouTube视频来训练大模型,目前有超过100人参与该集体诉讼。目前,OpenAI对该集体诉讼没有发表回应。

起诉书显示,创作者们拥有YouTube视频的所有权,OpenAI的行为违反了YouTube的平台条款,并且从创作者们的损失中获得了不正当利益,要求OpenAI赔偿超过500万美元。

5. 一配音演员声音被AI化,起诉后获赔25万元


近日,北京互联网法院审理了一起AI生成声音人格权侵权案件,最终判决原告胜诉。原告配音演员殷某某发现自己的声音被AI化后,在某智能科技公司运营的平台中对外出售,便以被告行为侵害其声音权益为由起诉至法院。

法院认定涉事的文化传媒公司和软件公司未经原告同意,擅自AI化使用其声音,构成了侵权行为,判决其向原告赔礼道歉并赔偿25万元。

6. “毒舌”AI走红X,12天吸引用户超400万


近期,IDE平台Wordware推出了一个名叫“发现你的推特人格”的AI Agent,用户只需把推特账号输入进去,该AI Agent会自动分析用户推文并给出“毒舌”点评,自上线以来,仅12天时间吸引用户超400万。其背后的开发平台Wordware也一炮而红,收入飙到1小时4000美金,创下了Product Hunt发布史上最高票数纪录(近7000 upvotes)。

试玩链接:https://twitter.wordware.ai/
相关阅读:《7天创收10万美金,新增25万用户,Wordware要做第一款AI OS》

7. AI直播换脸马斯克,超90万网友围观


8月10日,X博主“MatthewBerman”仅用一张马斯克的静态图片,就在直播流中完成了较为自然的换脸效果,吸引了超90万网友围观。整个直播测试在暗光环境下进行,但脸部表现相当流畅,切换各种刁钻角度也没有崩坏。其背后的技术Deep-Live-Cam被称为“直播版Deepfake”,目前已在Github上开源,收获31K星标。

不过这种AI深度伪造技术也引发了关于技术边界、伦理道德等方面的广泛讨论。近期韩国Deepfake犯罪事件冲上热搜,受害者包括大量未成年人。

项目地址:https://github.com/hacksider/Deep-Live-Cam
相关阅读:《Deepfake重创韩国,N号房事件重演,波及上百所学校》

8. 秘塔AI搜索收到知网28页侵权告知函


8月16日,AI创企秘塔科技官方发文称,旗下AI搜索产品“秘塔AI搜索”近日收到《中国学术期刊(光盘版)》电子杂志社有限公司(简称知网)长达28页的侵权告知函,指称秘塔AI搜索未经许可向用户提供知网学术文献题录及摘要数据。
秘塔AI搜索强调其“学术”版块仅收录论文的文献摘要和题录,未提供文章内容本身,阅读正文需通过来源链接跳转至网站获取。秘塔科技表示“即使不理解”也尊重知网选择,即日起将停止收录知网文献的题录及摘要数据,转向其他权威知识库。

9. 文生图模型Ideogram 2.0发布


8月21日,Ideogram团队发布了其最新版本的文本到图像模型Ideogram2.0,免费开放使用。

针对不同创作需求,Ideogram2.0提供常规、现实、设计、3D和动漫五种风格。其中,Ideogram2.0对设计样式进行了重大改进,特别是在文本渲染方面。这使得用户能够轻松创建高级图形设计,如贺卡、T恤设计、海报和插图,同时支持更长、更准确的文本呈现。

官网地址:https://ideogram.ai/

10. 智谱清言上线视频通话功能


8月30日,智谱AI旗下智谱清言上线视频通话功能,支持实时互动聊天,比如玩你画我猜的游戏、辅导孩子写作业、解释专业论文等。用户在智谱清言App首页底部输入框右侧的电话按钮,进入通话界面点击视频按钮即可体验。

此外,智谱AI近日发布了新一代基座大模型GLM-4-Plus,在语言文本能力方面取得了与GPT4o及 405B参数量的Llama3.1相当的成绩;GLM-4-Flash大模型免费开放,可通过智谱AI大模型开放平台调用;视频生成模型CogVideoX-5B开源。


新上线的9个AI工具/功能


1. 360发布AI助手,可一站体验国内15家大模型


8月1日,360发布“AI助手”,能够一站体验文心一言、豆包、MiniMax、Deepseek等国内15家大模型。用户可通过360桌面悬浮球、360安全浏览器等方式体验,AI助手将自动调动国内不同大模型,交叉验证模型能力后提供问题最优解。


基于多家大模型能力,360还推出了AI办公工具集,集合图片生成处理、文本音视频读写、AI PPT、AI翻译等功能。

体验地址:https://bot.360.com/


2. 字节AI音乐产品“海绵音乐”开放公测


8月1日,字节推出的AI音乐产品海绵音乐正式开放公测。用户只需提供一句简单的灵感,海绵音乐就能迅速生成一首完整的歌曲,时长约1分钟。同时,海绵音乐支持用户一键分享自己的创作,未来还将推出下载功能,便于用户制作视频配乐。豆包随后也上线了音乐生成功能。


体验地址:https://www.haimian.com/featured
相关阅读:《字节AI出新招,抖音造梗又有新武器?》


3. Seele推出“AI+3D”情感陪伴产品Koko Al


近日,由原网易云音乐副总裁王诗沐创办的AI初创公司Seele推出了一款AI情感陪伴产品“Koko Al”。基于自研3D多模态大模型EVA-01,Koko Al结合了3D模型、动画表演和语音聊天,让用户能与虚拟角色进行面对面的互动体验。

据介绍,用户可以通过文本或语音与各种角色交流,还能根据个人喜好定制角色的外貌和性格,目前Koko Al免费开放体验。


Koko Al官网:https://www.seeles.ai/


4. Stability AI推出Stable Fast 3D模型


Stability Al近日推出了一款图生3D模型“Stable Fast 3D”,称只需0.5秒就能快速生成完整且自然的3D模型,目前该模型已在Hugging Face平台上架。


体验地址:https://huggingface.co/spaces/stabilityai/stable-fast-3d


5. 阿里通义App推出“角色扮演”功能


8月6日,通义App推出了“角色扮演”功能,用户可以通过上传一段视频,将人物替换为卡通角色,实现机器人带娃、孙悟空跳舞、二次元女生职场搬砖等画面。


6. 快手推出AI对话助手App“飞船”


近日,快手基于自研大模型“快意”推出AI智能对话助手App“飞船”。用户可以和默认助手“领航员”进行对话,获取各类信息和知识。另外,“飞船”支持创建和定制专属AI虚拟角色,进行内容创作、知识解答,并具备语音交互功能。


7. 百度文库AI助手App“橙篇”上线


8月15日,百度文库“橙篇”App在各大安卓平台上线。橙篇集成了智能全网搜索和AI今日热点等资讯功能,并引入了多图一键成片、超长文章写作、文件理解总结等生成式大模型功能。此外,它还支持文字和语音输入。


体验地址:https://cp.baidu.com


8. 光启慧语推出AI助手App“晓象”


AI初创公司光启慧语近期推出了旗下AI助手“晓象”的移动端应用。晓象的主要功能包括AI克隆、内容生成、个性化互动、知识分享和信息解读等。用户可在晓象App中选择感兴趣的知识博主AI分身,浏览其生成的文章、视频或音频内容,并与AI分身进行互动。


9. 昆仑万维AI短剧平台SkyReels开启内测


8月19日,昆仑万维发布了全球首个集成视频大模型与3D大模型的AI短剧平台SkyReels。据介绍,SkyReels集剧本生成、角色定制、分镜、剧情、对白/BGM及影片合成于一体,创作者能够“一键成剧”,输入一个简单创意,SkyReels即可完成从剧本到成品短剧制作的全流程,单次可生成视频长度达180秒。

目前SkyReels已开启内测申请,预计于9月正式上线。


内测申请地址:https://skyreels.ai/beta
相关阅读:《AI一键生成短剧?我们实测了三个AI短剧工具,试图体验当导演的快乐》



4个AIGC热门案例


1. 用AI设计的穿戴甲火到巴黎奥运了


8月5日,36氪在B站发布了一条视频“被AI武装的义乌小商品,在巴黎奥运上卖爆了”,目前播放量超63万。视频中,36氪团队为一名来自义乌的穿戴甲生产厂家,用通义千问打造了一款AI穿戴甲设计产品LumiNail。只需要一个关键词,LumiNail就能够以此进行原创设计,并筛选出可能更受欢迎的“热门爆款美甲”。在巴黎街头,许多当地人都被AI设计做出的实物所吸引。

据36氪报道,许多头部商家已开始实践AI生产的产品,另有超过1万户商户使用AI辅助经营,可以说AI赋予了义乌商品更多的可能性。

埃菲尔铁塔款

2. 和爱豆拍AI合照,商汤的秒画趣拍火了


一键实现和爱豆拍合照,最近在抖音上火了。该AI写真模版出自商汤科技推出的AIGC产品“秒画趣拍”,目前已上线小程序端进行试运营。除了“爱豆合照”AI写真模版,秒画趣拍还支持用户自行发布模版。官方称,秒画趣拍试运营第9天日活跃用户超52万,用户总量超146万。


3. AI增肌滤镜刷屏,细狗一秒变猛男


“苦练三年不如别人下个Giga。”最近,又一AI滤镜全网刷屏,通过Gigabody的AI增肌特效,网友们一夜之间都练成了健硕身材,小红书上相关图文浏览量动辄几千。

与之前大火的黏土滤镜类似,AI肌增肌契合了部分网友对于创意表达和社交互动的需求。AI肌肉滤镜曾在TikTok爆火过一阵,剪映海外版CapCut还推出了相关模版,利用锐化的方式实现增肌的效果。


4. 麦当劳用AI美女做薯条广告片,X播放量超千万


8月17日,日本麦当劳发布了一条薯条广告片,由博主“KakuDrop”用Luma AI的视频生成工具Dream Machine v1.5创作完成。视频中,风格迥异的美少女们依次亮相,在不同场景下展示着麦当劳薯条。目前该视频在X平台上播放量超1100万。


‍不少网友惊叹于AI广告片的制作水准,表示“少女太可爱了”。但与此同时,也有网友认为这种广告令人“食欲下降”,不应使用AI制作。

‍相比动辄上百万的制作成本,AI广告确实是“低成本、高效率”,但要想制作高质量的作品,目前AI能做的更多是辅助作用。

DreamMachine:https://lumalabs.ai/dream-machine/creations
相关阅读:《15秒出圈视频,千万次网友观看,AI广告何时迎来“ChatGPT时刻”?》


「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、在看
 一起研究AI‍
继续滑动看下一个
AI新榜
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存