查看原文
其他

科技爱好者周刊#278:棘手的 AI 版权

阮一峰 阮一峰的网络日志 2023-12-22

这里记录每周值得分享的科技内容,周五发布。

本杂志开源[1],欢迎投稿[2]。另有《谁在招人》[3]服务,发布程序员招聘信息。合作请邮件联系[4]yifeng.ruan@gmail.com[5])。

封面图

鸡鸣驿位于河北省张家口,是中国现存最大的古代驿站遗址,当年供邮差休息和更换马匹。(via[6]

棘手的 AI 版权

AI 是一个新事物,带来了很多前所未有的问题。

最棘手、最有争议、也最有意思的,大概就是版权问题。

具体来说,就是下面这个问题:AI 训练(学习)时,能不能使用版权材料,从而具备模仿版权所有者的能力?

举例来说,前一段时间,网上出现了“AI 孙燕姿[7]”,有人用孙燕姿的歌曲作为训练材料,让 AI 模仿孙燕姿的声音,演唱其他歌手的歌曲。

我问大家,这有没有侵犯孙燕姿的版权?

一种观点是,侵犯版权了,因为未经授权就模仿了孙燕姿的声音。如果听任 AI 模仿孙燕姿,真人还没唱,AI 就先唱了,以后谁还会花钱去听真人演唱?

另一种观点是,没有侵犯版权,因为 AI 是学习孙燕姿的声音,而不是复制。AI 唱的是孙燕姿本人没有唱过的歌曲,属于 AI 的创作,所以不存在侵犯版权。

你赞成哪一种观点?

这个问题有趣的地方在于,如果把 AI 换成人,就没有争议了。

假设有一个小姑娘,刻苦模仿孙燕姿,终于有一天,可以用一模一样的声音演唱了,这个小姑娘有没有侵犯孙燕姿的版权?

我相信,所有的人都会认同,这不是侵权行为。一个人模仿另一个人的特点,并不侵犯后者的版权。

我模仿梵高的风格画画,模仿鲁迅的风格写作,模仿那些最优秀的程序员的风格编程,达到了可以乱真的地步。只要我创作的是自己的作品,就都是合理合法的行为。那么为什么 AI 做同样的事情,就会被认为侵权呢?

但是,又不能完全把 AI 等同于真人。模仿梵高的画家千千万,丝毫不影响梵高真迹的价值,换成 AI 就不一定了。

如果允许“AI 孙燕姿”与“真孙燕姿”同时存在,搞不好会严重冲击后者的收入。人们还会不会掏钱购买孙燕姿的歌曲,真是不一定。

这就是困难的地方。如果认定 AI 模仿不是侵权,我们不知道会有怎样的后果,现有的版权资产会不会大幅贬值。

而且,AI 冲击最大的,还不是已经成名的人,而是底层的小人物。试想一下,如果没有版权保护,电影公司雇佣一天群众演员,使用 AI 充分学习他们,然后就可以无限使用他们的“AI 分身”,最多改一下他们的脸,然后就再也不必雇佣他们了。

总之,AI 的版权是一个非常麻烦的问题。版权保护的是“复制权”,但是 AI 涉及的是“学习权”。如果禁掉 AI 的学习权,相当于说,有些事情只能人做,不能机器做,这说不通,现实中也很难操作。如果不禁,可能影响版权所有人的生计。

另外,除了个人风格的复制,内容的总结也是类似的情况。你看完一部小说(或电影),把情节复述给朋友,这是完全合法的。但是,AI 能不能做这件事呢,“10分钟帮你读完一部小说“?我们也可以从同样的角度,来思考这个问题。

[本周软件] TGFX:强大易用的 2D 图形库

本周,向大家介绍一款比较重要的工具软件。

它是国内很多头部业务的核心组件,前不久刚刚开源,知道的人还不多。它就是来自腾讯的 2D 图形库 TGFX[8]

很多朋友可能不清楚,图形库是干嘛的,为什么很重要?

我们每天使用计算机(包括手机),接触的都是图形界面,那些漂亮的组件,它们都依赖于图形库。计算机本质上只是一个计算引擎,只会计算。你想要图形界面,必须调用专门的图形库,才能获得图形能力。

图形库(包括组件库)一般由操作系统提供,但是如果软件跨系统,或者要求特殊效果,就必须用外部图形库。目前最流行的通用 2D 图形库是谷歌的 Skia,它是开源的,Chrome 浏览器、Android 系统、谷歌地图都用它。

TGFX 的开发目的,就是要替代 Skia。 它起源于腾讯的动效解决方案 PAG[9]。当时,腾讯内部很多项目,都有很强的动画效果需求,而且要求跨平台,所以就有了 PAG 这个专门制作动效的工具。

PAG 的核心就是图形库,最早用的是 Skia,但后来发现两个问题:首先,Skia 有历史包袱,打包体积大,性能也比较保守;其次,中国开发者看重的一些问题,开发团队往往不能(或不愿)跟进。

最终,PAG 团队下定决心,换掉 Skia,开发自己的图形库 TGFX。 这件事的难度不小,要用 C++ 开发,兼容各种操作系统的图形接口(目前主要是 OpenGL),做出各种各样的图形,还要保证性能和渲染效果。他们2021年开始做,直到今年才小有所成。TGFX 有几个鲜明特点。

(1)充分利用现代 GPU 的计算能力,保证性能。

(2)提供全面的图形能力:各种图片、矢量和文本的 2D 绘制全部支持。

(3)做到 Skia 的轻量化平替,打包体积仅 400KB,实现了 2MB 的 Skia 的绝大部分功能。

(4)使用成本低。API 与 Skia 基本相同,并且进行了简化和整合。

PAG 4.0 把图形引擎从 Skia 改成 TGFX 后,包体积降低65%,矢量渲染性能提升 60%。

截止2023年7月,借助 PAG 项目,TGFX 已经运行在1000+的国内头部业务,其中不仅有腾讯的微信、手机 QQ、王者荣耀,也有小红书、知乎、BiliBili 等外部项目。稳定性经过了10亿+用户设备的验证,性能表现也不凡,比如为腾讯文档带来了50%的内存降低。

TGFX 以前是 PAG 项目的一部分,最近才独立出来,变成一个单独的开源项目,放在 GitHub[10] 上面。如果你的项目需要图形引擎,不妨试试它。

这个项目才刚刚开源,腾讯会对它长期大力投入。对图形开发有兴趣的朋友,可以研究一下它的代码和文档,相信可以学到很多东西。有什么想法和意见,都可以向开发团队反馈,他们会及时响应。

科技动态

1、AI Pin[11]

上周,世界第一个可穿戴 AI 设备在美国上市,叫做 AI Pin。

它可以别在上衣上面,就像一个徽章,它的名字 Pin 就是“别针”的意思。

它的底层是安卓系统,通过手机 SIM 卡联网。它带有语音和摄像头,你可以跟它对谈。

举例来说,你看到一个火龙果,就问它:“这个东西含糖量多少?”它会回答:“整个水果含有7.31克糖。”

以后我们看到有人自言自语,不要奇怪,他可能在跟 AI 对话。

除了语音操控,它还支持触摸和手掌投影。

它的售价为699美元(约人民币5100元),每个月还有24美元(约人民币175元)的服务费。这么贵的价格,功能又没有超过手机,销售前景不乐观,几乎肯定会失败。


2、探路者1号飞艇[12]

11月8日,当今世界最大的飞行器,探路者1号(Pathfinder 1)飞艇首次试飞,它是谷歌创始人谢尔盖·布林资助的项目。

它的长度为124.5米,比三架波音737 Max 加起来还要长。

它使用电机操控,内部有13个氦气气囊,骨架由碳纤维和钛金属制成,外层还有特殊的阻燃涂层,总体上相当安全。

所有人员都呆在底部的乘客舱(上图中,飞艇底部的小房间)。这个乘客舱相当小,一次最多载14人,最大负载在2吨到5吨之间。

飞艇的优势是低空慢速飞行,还可以悬浮,并且非常安静。但是,它的载客量这么小,也不能防大风,很难有什么实际用途。


3、眼球移植[13]

上周,一家纽约医院宣布,已经在今年5月27日,完成了世界第一例“眼球移植手术”,将一个人的眼球移植给另一个人,真是惊世骇俗。

患者是一名46岁的男子,他的左眼因严重电烧伤而失明。

移植五个月后,他的眼睛还是没有恢复视力,但是大脑能够感知眼睛的神经信号,并且血管保持畅通。医生认为本次手术是成功的,正在等待神经进一步生长,看看能否恢复视力。

虽然这个手术已经在动物身上进行过多次,但是人的眼睛更为精细和复杂,手术之前要用计算机进行 3D 模拟,精确对准骨骼和移植位置(上图)。

整个手术持续了21个小时,投入的医生、护士、后勤人员共140余人(上图)。

如果“眼球移植”能够成功,就为那些因外伤而失明的人提供了巨大的福音。


4、Steam Deck 的照明[14]

Valve 公司即将发售掌上游戏机 Steam Deck 的新版本“Steam Deck OLED”。新版本的主要卖点,就是有一个更亮的 OLED 屏幕。

为了突出这一点,他们想到一个点子,在广告里面使用 Steam Deck OLED 为自己照明。

上图就是广告截图,一个 Steam Deck OLED 在中央,照明完全来自周围的 Steam Deck OLED。

为了实现这个效果,他们制造了一个巨大的金属圆球,把许多掌机挂在上面。

并且,使用软件将所有屏幕同步,然后摄影师待在球体内拍摄,才达到想要的效果。

文章

1、如何发布一个 TypeScript 软件包?[15](英文)

TypeScript 语言写的软件包,怎么发布到 npm 上面?


2、C++ Fiber 基础知识[16](英文)

React 引入了 Fiber,这个词到底是什么意思?它其实来自 C++,本文就介绍 C++ Fiber 的基本知识,前半部分都是通俗的讲解。


3、被复制最多的 StackOverflow 代码片段[17](英文)

问答网站 StackOverflow 里面,被最多人复制的代码片段是什么?本文告诉你,这段代码里面其实还有一个小错误。


4、可拖动对象的网页实现[18](英文)

作者详细讲解,如何在网页上实现一个可以拖动的对象,并且鼠标和触摸都可以拖动。


5、自适应文本框的 CSS 实现[19](英文)

用户输入文本,如何让网页输入框随着文字的增加,自动增加高度?不用 JS,只用 CSS。


6、如何生成虚拟的世界地图[20](英文)

作者想写一个环游世界的游戏,就用算法生成了一张虚拟的世界地图。虽然看不懂技术,但是每一步都有图片,很好玩。


7、英国青少年动画比赛的最佳动画[21](英文)

今年英国青少年动画比赛的头奖得主,是一个16岁的少年。他的作品《机器人做串串》的制作水准,让人惊叹。

工具

1、ShortbreadAI[22]

这个网站让你方便地生成漫画。


2、ripsecrets[23]

这个工具用于检查代码仓库,有没有泄漏密钥。它可以配置在 CI/CD 流程里面自动运行。


3、EmojiGen[24]

根据文字提示生成 Emoji 图案。


4、screenshot-to-code[25]

一个开源的 Web 应用,用户上传一张网页截图,它会通过 OpenAI,给出该网页的 HTML/Tailwind/JS 代码实现。


5、PageSpyWeb[26]

一个开源的远程调试工具,提供类似浏览器控制台的界面,进行远程调试。(@wqcstrong[27] 投稿)


6、IPS[28]

一个命令行工具, 查询和处理 IP 地理位置数据库。(@sjzar[29] 投稿)


7、GWS[30]

一个开源的高性能 WebSocket 实现,包括服务器和客户端,用 Go 语言编写。(@lxzan[31] 投稿)


8、ChatGot[32]

在一个窗口内,同时跟多个模型互动,可以让 GPT 输出文字,然后用 @midjourney 生成图片。(@qinleilxl[33] 投稿)


9、网页 AI 评审[34]

这个 Web 工具对用户提供的网址,进行 AI 评审,给出页面的设计问题和改进建议。

它是免费的,但是用户多的时候,会停止服务。如果 AI 表现好,以后设计稿评审和代码评审都可以交给它了。


10、AITDK[35]

用户输入文章的主题,该网页工具会自动生成 SEO 友好的标题、描述、关键词和常见问题解答。(@typewe[36] 投稿)

资源

1、GPT 在线目录

基于 GPT 的工具越来越多了,下面的网站将这些工具整理在一起,做成一个在线目录,方便查找。

•GPTsHunter[37](@airyland[38] 投稿)•AwesomeGPTs[39](@GregoryZeng[40] 投稿)•BestGPTs[41](@qinleilxl[42] 投稿)•GPTs Works[43](@idoubi[44] 投稿)•GPTs Today[45](@KarnaughK[46] 投稿)•GPTs-store[47](@RunnningDogg[48] 投稿)


2、Bubble[49]

该仓库收集各种可以放在 GitHub Profile 和 Readme 上面的小组件。(@LHRUN[50] 投稿)


3、Bing 图像创建器[51]

微软官方的 AI 文生图服务。


4、YesChat.ai[52]

该网站提供最新 AI 模型(GPT4V、Dalle3、Claude 2)的免费体验,不过每天有次数限制。(@zengdamo[53] 投稿)


5、机器学习入门教程[54]

微软官方推出的机器学习的入门教程(英文)。

图片

1、太空工具包[55]

11月1日,国际空间站的宇航员出站,进行日常的维修工作,不慎一失手,将一个装螺丝刀的工具包遗失在太空中。

于是,这个工具包就成了地球的一个卫星(实际是太空垃圾),距离地面300多公里。下图就是从国际空间站往下看这个工具包。

最妙的是,现在你在地球上,使用普通的家用天文望远镜,对着国际空间站的方向,是可以看到这个工具包的。


2、GPT-4V 自动生成图表[56]

上周,OpenAI 对外开放了 GPT-4 Vision (简称 GPT-4V)功能。你可以上传图片,然后向 GPT 提出各种玩儿问题。

有人就上传了文字表格的扫描照片(下图左),让它自动生成可视化图表(下图右)。

这证明了,GPT-4V 内置了 Python 脚本,可以完成数据可视化。早期是处理 .csv 文件,现在则可以从图片中提取数据。


3、MacOS 弹窗[57]

苹果的 MacOS 系统正变得越来越庞杂和臃肿,有大量的弹窗,用来请求权限和安全提示。

下图是一位站长购买 Mac 电脑后,从旧 Mac 电脑迁移系统时的截图。

当时,迁移助手已迁移了所有应用程序,所有设置为自动启动的应用程序同时启动,就出现了这样的画面。

文摘

1、讲故事能力[58]

当代世界是一个资本过剩的世界,只要有足够的人相信你,你就能拿到投资和高估值。

作为创始人,你的讲故事能力,直接影响你的项目能否成功

只要你能很好地解释自己,提炼出项目的亮点,并让公众以正确的方式了解你,你就有很大机会得到投资。

马斯克和特斯拉就是最好的例子。特斯拉的估值非常高,只要投资者相信它的故事,它就有足够的时间去实现它的估值。如果做不到让投资者相信,它的估值就会崩溃。

这意味着,马斯克的各种夸张言论和新闻,并不是哗众取宠那么简单。他实际上是以一种低成本的方法在宣传,营造一种氛围,让人们知道并相信他的故事,支持公司的高估值。

一家公司的故事讲述得越好,它获得资金就容易,市盈率就越高。

言论

1、

软件的第一个版本,最多三个人就够了:一个程序员、一个设计师、还有一个机动,既干一点编程,也干一点设计。

如果你发现三个人不够,那就换人,或者缩小软件初始版本的构想。

-- 《Getting Real》


2、

我对 ChatGPT 的理解就是,它类似于“整个人类知识的最大似然估计”。

我发现,周围的人对它有两种截然不同的看法:(1)嗯,这只是一个愚蠢的统计模型;(2)该死,人类完蛋了!

-- 《如何认识 ChatGPT》[59]


3、

Debian 官方下载站,20多年来坚持不使用加密协议 HTTPS,只使用签名文件确保文件可靠。这是为了让那些不支持 HTTPS 的老电脑也能下载到更新包。

-- 《旧电脑的可用性》[60]


4、

15世纪,德国人古腾堡发明了欧洲第一台印刷机,可以快速印刷书籍。

当时,一些人反对这个发明,理由是印刷书籍越容易,传播错误信息就越容易。最终,印刷机还是发展起来了,因为大多数人认识到,防止错误的最佳方法是事实,而不是限制印刷机。

-- 《错误信息的解药》[61]

往年回顾

互联网公司需要多少员工?(2022 #231)

移动支付应该怎么设计?(2021 #181)

你的头脑是二值逻辑,还是三值逻辑?(2020 #131)

子辈能大幅超越父辈吗?(2019 #81)


(完)

References

[1] 开源: https://github.com/ruanyf/weekly
[2] 投稿: https://github.com/ruanyf/weekly/issues
[3] 《谁在招人》: https://github.com/ruanyf/weekly/issues/3599
[4] 邮件联系: mailto:yifeng.ruan@gmail.com
[5] yifeng.ruan@gmail.com: mailto:yifeng.ruan@gmail.com
[6] via: https://baike.baidu.com/item/%E9%B8%A1%E9%B8%A3%E5%B3%84/8364068
[7] AI 孙燕姿: https://www.stcn.com/article/detail/872694.html
[8] 2D 图形库 TGFX: https://github.com/Tencent/tgfx
[9] 动效解决方案 PAG: https://pag.art/
[10] GitHub: https://github.com/Tencent/tgfx
[11] AI Pin: https://hu.ma.ne/
[12] 探路者1号飞艇: https://techcrunch.com/2023/11/08/the-worlds-largest-aircraft-breaks-cover-in-silicon-valley/
[13] 眼球移植: https://www.scientificamerican.com/article/doctors-complete-first-successful-face-and-whole-eye-transplant/
[14] Steam Deck 的照明: https://idlethumbs.social/@ja2ke/111396017651485944
[15] 如何发布一个 TypeScript 软件包?: https://blog.liblab.com/typescript-npm-packages-done-right/
[16] C++ Fiber 基础知识: https://agraphicsguynotes.com/posts/fiber_in_cpp_understanding_the_basics/
[17] 被复制最多的 StackOverflow 代码片段: https://programming.guide/worlds-most-copied-so-snippet.html
[18] 可拖动对象的网页实现: https://www.redblobgames.com/making-of/draggable/
[19] 自适应文本框的 CSS 实现: https://www.amitmerchant.com/textarea-auto-increase-height/
[20] 如何生成虚拟的世界地图: https://frozenfractal.com/blog/2023/11/2/around-the-world-1-continents/
[21] 英国青少年动画比赛的最佳动画: https://younganimator.uk/winner/1699875910225x437970782709919500
[22] ShortbreadAI: https://shortbread.ai/
[23] ripsecrets: https://github.com/sirwart/ripsecrets
[24] EmojiGen: https://emoji.fly.dev/
[25] screenshot-to-code: https://github.com/abi/screenshot-to-code
[26] PageSpyWeb: https://github.com/HuolalaTech/page-spy-web
[27] @wqcstrong: https://github.com/ruanyf/weekly/issues/3616
[28] IPS: https://github.com/sjzar/ips
[29] @sjzar: https://github.com/ruanyf/weekly/issues/3631
[30] GWS: https://github.com/lxzan/gws
[31] @lxzan: https://github.com/ruanyf/weekly/issues/3623
[32] ChatGot: https://start.chatgot.io/login
[33] @qinleilxl: https://github.com/ruanyf/weekly/issues/3624
[34] 网页 AI 评审: https://uxaudit.vercel.app/
[35] AITDK: https://aitdk.com/zh-CN/
[36] @typewe: https://github.com/ruanyf/weekly/issues/3614
[37] GPTsHunter: https://www.gptshunter.com/
[38] @airyland: https://github.com/ruanyf/weekly/issues/3617
[39] AwesomeGPTs: https://awesomegpts.pro/
[40] @GregoryZeng: https://github.com/ruanyf/weekly/issues/3619
[41] BestGPTs: https://bestgpts.app/
[42] @qinleilxl: https://github.com/ruanyf/weekly/issues/3624
[43] GPTs Works: https://gpts.works/
[44] @idoubi: https://github.com/ruanyf/weekly/issues/3629
[45] GPTs Today: https://gptstoday.com/
[46] @KarnaughK: https://github.com/ruanyf/weekly/issues/3635
[47] GPTs-store: https://gpts-store.net/
[48] @RunnningDogg: https://github.com/ruanyf/weekly/issues/3637
[49] Bubble: https://github.com/LHRUN/bubble
[50] @LHRUN: https://github.com/ruanyf/weekly/issues/3620
[51] Bing 图像创建器: https://www.bing.com/images/create
[52] YesChat.ai: https://www.yeschat.ai/zh-CN
[53] @zengdamo: https://github.com/ruanyf/weekly/issues/3632
[54] 机器学习入门教程: https://github.com/microsoft/ML-For-Beginners
[55] 太空工具包: https://www.usatoday.com/story/news/nation/2023/11/10/nasa-tool-bag-dropped-by-astronauts-international-space-station/71536725007/
[56] GPT-4V 自动生成图表: https://resobscura.substack.com/p/generative-ai-for-historical-research
[57] MacOS 弹窗: https://sixcolors.com/post/2023/11/a-picture-is-worth-a-thousand-permissions-requests/
[58] 讲故事能力: https://kwokchain.com/2021/09/29/narrative-distillation-1/
[59] 《如何认识 ChatGPT》: https://xorvoid.com/chatgpt_a_mental_model.html
[60] 《旧电脑的可用性》: https://blog.karthikkumar.org/usability-of-old-computers-f06a7f00f72e
[61] 《错误信息的解药》: https://fcpp.org/2021/07/28/misinformation-should-be-refuted-not-censored/

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存