其他
文生图关键问题探索:个性化定制和效果评价
文生图(Text-to-Image Generation)是AIGC(AI Generated Content,人工智能生成内容)的一个主要方向。近年来,文生图模型的效果和质量得到飞速提升,投资界和研究界都在密切关注文生图模型的进展。这一领域还有什么样的问题或者发展方向?本文介绍了近期文生图的发展历程,从四个不同角度来介绍这一领域目前面临的关键问题和研究进展。
问题一:模型的机器评价与人工评价之间缺乏一致性。通过机器评价指标,比如FID值等,评价结果往往和真实的生成效果并不一致,因此不能很好地评价不同模型的效果。而人工评价标准难以统一并有高昂的成本。 问题二:如何在生成过程中实现更高效的控制。如何提高生成图像和文本输入之间的一致性,特别是在使用简短的提示句来生成图像时,目前难以有效地控制所生成图片与文本之间的相关性程度。 问题三:如何进行定制个性化模型。如何定制一个文生图模型,是行业应用的关键。快速的进行新概念/风格/人物的学习,是文生图落地到各应用场景的第一个拦路虎。 问题四:高质量文图数据集的缺乏。数据的重要性不言而喻,大量高质量的文图数据是文生图发展的血液,没有数据再好的算法也发挥不了作用。
如何评价文生图模型的效果
可控生成
同时输入多个实体不能实现完全生成; 实体之间的关系不能体现; 颜色和数量不能体现; 文字显示不出来。