从前慢 | 为了让文字有温度,他们决定教计算机“手写”汉字
艺术家创作一种新字体时通常需要写大量的范例字体,为了减轻其负担,我们希望通过AI学习少量的新字体样本,就能生成这种字体的任意汉字,让艺术创作更省时省力。
—— 小队长如是说
”2019年海育国际AI夏令营
“人工智能生成手写体”项目小组展示
为什么会想做手写字体项目?
随着现在科技发展,人们用笔的机会越来越少了,手写成了一件奢侈的事。很多时候我们可以在键盘上打出某个字,却不一定可以在纸上写出这个字。现在家人朋友之间互送祝福也多是通过用手机编辑一条祝福信息。
心意到了,却总感觉少了点什么。相对而言收到一封手写的明信片所带来的欣喜,远远超过了一段手机上的祝福文字。因为手写的每一个字都有温度。
一些背景知识
2018年1月22日,汉仪字库在其官方微博账号上宣布其与阿里巴巴联合制作的“全球首款人工智能字体”“阿里汉仪智能黑体Beta版”上线,并有偿许可他人进行商业性使用。
汉仪于该字库的介绍中提到,人工智能技术参与了该字库的设计过程,而其目的则是为了高效完成设计中的大量重复性工作,从而提升字库制作效率。
在更早些时候,方正手迹推出了一款名为“手迹造字”的手机应用。该应用允许用户仅需通过手写或扫描等方式输入100个以上指定的个性化单字,便可通过机器自动填充的方式,生成符合GB2312-80标准的,含6763个汉字和数百个符号的,可在手机或电脑上使用的个性化计算机字库。
AI生成手写体要如何实现?
作为生成模型两座大山之一,生成式对抗网络(GAN)自从问世以来就颇受瞩目。相对于变分自编码器,生成式对抗网络也可以学习图像的潜在空间表征,它可以生成与真实图像再统计上几乎无法区分的合成图像。
GAN的基本原理其实非常简单,这里以生成图片为例进行说明。假设我们有两个网络,G(Generator)和D(Discriminator):
G是一个生成图片的网络,它接收一个随机的噪声z,通过这个噪声生成图片,记做G(z)。
D是一个判别网络,判别一张图片是不是“真实的”。它的输入参数是x,x代表一张图片,输出D(x)代表x为真实图片的概率,如果为1,就代表100%是真实的图片,而输出为0,就代表不可能是真实的图片。
可是,GAN提出后很长一段时间,并没有得到很好的发展。2016年NIPS会议之前,GAN的文章发表并不是很多,但是16年之后就发展了很多,到目前呈一个指数增长的趋势。生成式对抗网络(GAN)成为了近年来大热的深度学习模型,在计算机视觉领域,得到了广泛的研究。可以说是计算机领域革命性的技术成果,具有广泛的应用价值(如图像生成、图像转换、面部属性操作等)。
项目组员沐远同学向大家展示GAN的应用
教计算机“手写”汉字
通过学习了解生成模型以及GAN的工作原理,与潜在用途。并探索GAN体系结构的基础:生成器和鉴别器网络,我们进而开始构建自己的简单的对抗系统。
目前就读于北京大学的梁书豪同学,自从“入坑”计算机专业就一发不可收拾的对各种编程语言着迷。
2019年8月,他参加了海育国际AI夏令营。与同期的何沐远同学一起成立了“人工智能生成手写体”项目小组,经过不断的努力(写代码),在夏令营导师的专业指引下,最终通过构建和训练生成对抗式网络。从而实现人工智能生成手写体汉字,在项目展示环节大放异彩!
该项目使用了经典的pix2pix(像素对像素)网络结构,实现了精确的字体匹配,在测试的两种字体中都表现出了很好的风格对应。
相比于商业化的应用,目前的模型还存在一些缺陷。比如消耗资源较大,还不能调整细节,不能智能化输入字体等问题。若未来将该项目投入使用,还需优化模型结构和用户体验等。
海育国际AI夏令营精彩回顾 ↓海育国际AI夏令营完美收官!相逢有时,后会有期~
看过来!硬核的人工智能主题课程,每一天都精彩纷呈~
了解项目详情,寻求AI课程合作资源
请联系海育小助手☟
更多精彩请持续关注“海育国际”公众号,或扫描下方二维码加入海育家长群,掌握最新国际教育动态。
美国海育国际(HiElites.com)致力于向东方家庭及机构提供全球的优质教育和职业发展资源,由中美两国的教育学博士、前名校招生主任、顶尖升学导师、高级职场精英等团队组成。
海育360°国际教育服务结合学员自身优势与兴趣,激发其潜能,并引领其进行文化融入与人脉搭建,内容涵盖学业规划、背景提升、升学指导、求职就业、海外综合服务等。海育还与战略合作伙伴联合推出◆ K12国际教育合作◆ STEM课程开发与引进◆ 寒暑假微留学◆ 国际教育交流研讨◆ 国际师资培训◆ 企业家研学等项目,助力中国教育改革与教育国际化发展。