查看原文
其他

特别策划 | 网络视听平台“抢滩”人工智能

钟 茜 综艺视听
2024-08-22

当下,AI炙手可热。

中国互联网络信息中心预测,2032年生成式AI市场规模有望达到1.3万亿美元。艾瑞咨询发布的《2023年AIGC场景应用展望研究报告》显示,2024年AIGC(人工智能生成内容)仍是投资热点。各大网络视听平台高度重视新技术带来的新机遇,积极布局AIGC赛道,取得了一系列创新性成果。


爱奇艺:

AI助力流程优化、内容创新


爱奇艺作为行业内较早布局人工智能的公司,已将生成式AI成功应用于策划、制作和宣发等多个环节。爱奇艺首席技术官刘文峰介绍,目前,爱奇艺正积极将平台丰富的影视资料数据与大模型结合,进行深度训练,开发针对影视产业场景的生成式AI垂直应用。

刘文峰

在内容策划阶段,生成式AI显著提高了剧本、小说的阅读效率,进而提升了内容的创作效率和创意水平。刘文峰介绍,爱奇艺基于经典小说、剧本、历史资料等专业内容,构建了垂直领域的知识库,投入大量技术和业务资源研发训练,形成了独具特色的影视文学大模型。目前,这一大模型已经成功接入爱奇艺自主研发的小说和剧本评估工具,大幅提升了剧本阅读速度,对剧本场景和人物的拆解准确率达到90%以上。

具体而言,工作室的制作人使用生成式AI工具,能够在原1/3的时间内完成3倍的阅读量,相当于提升了9倍的阅读效率。此外,该工具还可以直接提取世界观、故事大纲、人物介绍及人物关系图等关键信息。刘文峰表示,生成式AI对语言的深入理解能力也被广泛应用于剧本评估,“爱奇艺的AI算法能够精准识别剧本中的情节点,判断哪些是强情节点。”这使得创作者在剧本策划阶段就可以有针对性地调整,打造更加引人入胜的故事情节。


在制作与宣发阶段,生成式AI能够为虚拟制作、声音制作、资产制作及广告素材、文案的生成提供强有力的支持。刘文峰介绍,生成式AI可应用于概念海报的设计,“目前,爱奇艺已有项目采用AI生成的建筑作为原画,并据此搭建了逼真的场景用于拍摄,效果非常出色。”在声音制作方面,爱奇艺的AI配音技术已经成功支持250部引进国内的译制片及826个中文节目的配音工作,有助于优质内容的国际化传播。

在搜索环节,早在2017年,爱奇艺便上线了“以图搜剧”功能,经过多年技术探索,成功搭建了“星罗剧情理解平台”,该平台能够实现对影视剧的分钟级深度理解(通过深度剧情理解,可以针对性列出分钟级的剧情看点,总结热议话题,回答剧情相关问题,并根据用户需求进行播单推荐)。目前,爱奇艺的AI搜索功能可以完成角色搜索、剧情搜索、明星搜索等多项任务。

此外,平台还可以通过对弹幕、评论及正片关键帧的学习理解,迅速生成对应的剧情片段和剧情看点,自动剪辑生成视频,为用户提供个性化内容推荐。在《长风渡》《乐队的夏天》第三季等多个热门IP的推广上,爱奇艺积极应用AI技术辅助,站内运营和站外推广效果显著提升。

芒果TV:AI覆盖内容生产运营全链路

在文化与科技融合发展的战略布局下,芒果TV进一步强化人工智能与内容创制之间的产学研转化,成功搭建了“芒果大模型”。这一多模态行业垂类大模型,覆盖文本、图像、音频、视频等生成能力。

芒果TV相关负责人介绍,依托湖南广电庞大的音视频数据资源、丰富的内容制作经验、优秀的算法人才团队及多元的业务场景,相较于通用大模型,“芒果大模型”在行业知识储备、内容生产经验方面更为专业,具备针对节目制作、媒体宣传等场景的精细调优与快速响应能力。

目前,AI已全面应用于芒果TV的内容生产运营流程。在创作阶段,剧本智能评估应用“小说智选”借助大型语言模型,进行文本的多维度分析和开放式交互,能够在5分钟内精读1000000字,帮助团队迅速筛选高质量小说。目前,芒果TV微短剧“大芒”团队已采用此AI工具挑选剧本,不仅剧本评估效率翻倍,还提升了40%的创作效能。

湖南广电在综艺《我们仨》中推出AI导演“爱芒

节目制作环节,芒果TV推出了AI导演“爱芒”。除了在综艺《我们仨》中完成首秀,“爱芒”还参与了《爱的修学旅行》动态漫画制作与配音工作,《湘行漫记》AIGC动态漫画左宗棠主题内容的共创,以及《大侦探》宣传片制作等工作。目前,“爱芒”已能满足剧本解读、角色推荐、拍摄规划等一系列业务需求,并在持续进化中。

平台运营方面,湖南广电聚焦生成式AI研发了一系列用户互动应用。例如,用户互动应用“AI海龟汤”上线一周便吸引了90,000的日活跃用户数(DAU),显著推动互动空间业务数据增长;平台推出的多档节目中,拟人AI角色的对话互动也取得良好商业化成果。在视频二次创作场景下,湖南广电构建了AI自动化创作平台,日产10000条短视频,自动剪辑分发到站外,有效拓展了站外流量。

宣传环节,湖南广电充分利用AI的内容生成能力,结合影视内容创新宣传。例如,在今年4月完播的《与凤行》宣传中,推出微博超话#芒果与凤行AI婚礼圆满了#,引发网友广泛讨论,阅读量超过30000000。

人才培养方面,芒果TV举办多届“马栏山杯”国际音视频算法大赛,成功组建了一支智能算法团队,在CVPR2023、ACM SIGKDD CUP 2023等国际赛事中屡获佳绩。去年,芒果TV还推出了AI应用工具箱AIGC HUB,让AIGC成为推动内容生产的新质生产力。

蔡怀军

湖南广播电视台副台长、芒果超媒董事长蔡怀军表示,湖南广电高度重视大模型、AIGC等新技术的探索与应用。目前,数千种新技术已广泛应用于湖南广电的综艺节目、纪录片、电视剧、晚会等领域,新技术使用占比超过90%,为内容创新和产业发展注入了强大动力。

阿里大文娱:AI赋能内容制作“三化”

近年来,阿里大文娱持续增强科技创新的投入与布局,依托AI等前沿技术,推动内容制作走向标准化、流程化、数智化。

在数字人领域,阿里大文娱成功打造首个超写实数字人——厘里。她能够精准模仿人类的面部表情,根据场景和角色需求灵活变换造型。厘里已成为阿里大文娱旗下多个业务的代言人,包括优酷、淘票票、妙鸭相机等,还曾在热播剧《异人之下》中亮相,引发行业关注和网友热议。

数字人“厘里”参演真人剧集《异人之下》

在影视内容创作方面,优酷推出的古装探案剧《大唐狄公案》也采用了人工智能生成技术。剧中第一集,镜头从青砖古瓦的宏伟建筑扫过,呈现古代长安城的全景,画面中的街道行人、亭台楼阁、古建筑等均由AI辅助生成。

《大唐狄公案》用AI辅助生成长安城场景

在AI写真领域,阿里大文娱开发了AI人像写真应用妙鸭相机,利用AI技术,将用户的普通照片转换成专业水准的写真。妙鸭相机还与多个IP、品牌合作,推出类型丰富的写真模板,如《这!就是街舞》《铃芽之旅》《新闻女王》等,满足用户个性化、多样化需求。

郑勇

阿里大文娱CTO郑勇表示,未来,阿里大文娱将继续深入探索前沿技术在文娱行业的应用,让新技术在高质量作品中发挥关键作用,让艺术更好地呈现。

抖音:全面布局大模型、AI应用

抖音集团持续加大AI赛道投入力度。此前抖音已推出多款独立AI产品,如豆包、扣子等。2023年8月,抖音发布了旗下首个针对手机App端的聊天机器人——豆包。这是一款和百度“文心一言”、阿里“通义千问”类似的对话式大模型产品,可以为用户提供多语种、多功能的AIGC服务,包括但不限于问答、智能创作、聊天等。今年2月,抖音上线了新一代AI Bot开发平台——扣子,可以快速、低门槛搭建基于AI模型的对话机器人,支持一键发布到豆包、飞书、微信公众号等多个渠道。

字节跳动旗下云服务平台火山引擎已发布大模型服务平台“火山方舟”,集成了智谱AI、月之暗面等多家AI科技公司及科研团队的大模型,面向企业提供模型精调、评测、推理等全方位平台服务。此外 ,抖音集团自研的云雀大模型,也通过“火山方舟”面向企业提供服务,目前已接入今日头条、剪映、番茄小说、西瓜视频、飞书、豆包、悟空浏览器、懂车帝等网站和App。至此,抖音逐渐完善从大模型到AI应用的全面布局。此外,抖音旗下今日头条、剪映、飞书等产品也正在抓紧融合AI技术,促进用户体验升级。

快手:“大模型综合性能即将追平GPT-4” 

去年8月,快手宣布内测自研大语言模型“快意”,打造“全模态大模型AIGC解决方案”,为用户提供包括文本生成、图像生成、3D素材生成、音频生成、视频生成等在内的多种技术能力。随后,快手又于去年9月发布了自研文生图大模型“可图”,它能够基于开放式文本生成绘画作品。

3月20日,快手召开业绩电话会。快手创始人兼首席执行官程一笑披露了公司在生成式AI领域的进展。程一笑表示,公司去年启动AI战略后,一步步扎实推进自研大模型的研发训练,“有信心在未来半年内,使大模型的综合性能达到GPT-4的水平。” 


快手高级副总裁、电商事业部兼商业化事业部负责人王剑伟在近日举办的快手2024磁力大会上表示,人工智能正在内容生产、理解、分发和互动承接的全链路上提升效率。智能化生产方面,快手研发的视频AIGC产品“盘古”、数字人直播AIGC产品“女娲”成绩突出。AIGC短视频素材推动获客成本同比降低62%,数字人直播的转化率接近真人水平;快手营销域大语言模型的短视频内容理解力达到91%,追平GPT-4水平;全站智能投放让优质商家的GMV(商品交易总额)增长30%;快手提供的智能客服、私信等工具,通过智能机器人实现24小时自动多轮互动,双聊率提升至真人水平的4倍。

B站:优化产品体验、提升创作者效率

B站董事长兼CEO陈睿透露,AI已经成为B站科技内容增长最快的领域之一。过去一年,超过2亿用户观看了科技类视频,科普内容的播放量增长近200%,AI相关稿件产出量突破百万大关。

内容生态蓬勃发展的同时,B站不断探索新技术,以优化产品体验、提升创作者效率。B站自主研发的Index大语言模型在文本分类、实体标注、创意写作等自然语言处理任务中表现出色,已应用于视频理解、内容搜索及直播等多个场景,不仅提升了用户寻找心仪内容的便捷性,也让UP主能够高效创作。

例如,B站推出的AI搜索助手通过对视频内容的深度理解和学习,可以针对用户提问,提供直接且概括性的回答,并精准推荐相关视频。AI视频小助手可以帮助用户快速总结视频内容,满足信息整理和查询需求,降低学习成本。B站还将AI技术应用于无障碍直播间,通过实时数据和AI字幕等功能,让视障和听障用户也能享受沉浸式直播体验。在英雄联盟S13比赛期间,数百万用户通过无障碍字幕和实时数据功能观看赛事直播。


内容创作方面,B站将大语言模型应用于文字、图像、语音生成等场景。其中,AI故事生成功能尤为引人注目。该功能基于生成式AI技术,能够理解、分析用户上传素材,用户只需选择喜欢的风格(系统提供多种风格供用户选择),便能自动生成涵盖特效、配音、字幕等的完整视频内容。

AI语音生成方面,B站将该技术应用于视频、直播、纪录片等多种场景。近期,虚拟歌手洛天依在11周年生日会上首次使用B站自研的AI语音生成技术配音。粉丝纷纷表示,AI配音表达流畅、语气灵动,高度还原了洛天依的虚拟音色。

B站还利用AI技术推出数字分身功能——采集真人素材训练大语言模型,帮助UP主构建等比复刻的数字人形象。通过此项技术,UP主输入文案即可生成实拍级真人出镜的视频效果。例如,人文历史UP主“大象放映室”运用这一技术后,内容生产效率与稳定性得到大幅提升,其数字分身的动作、语音、神态十分自然,受到观众一致好评。

特别策划|AI探路影视新质生产力



投稿请发送至邮箱:

zongyiweekly@163.com


—END—
文章精选



来都来了,点个“在看”再走吧~~~



继续滑动看下一个
综艺视听
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存