查看原文
其他

终于可以聊下 ChatGPT 偷袭出版业的一种姿势

XDash 增长黑客范冰 2023-03-10

1)

OpenAI 的 ChatGPT 持续爆火,基于其 API 开发的第三方应用工具也在井喷。

最近看到网友 @liuzhida 开发的网页服务「风声雨声」,就是「基于 GPT-3.5 的翻译服务」。

它的网址是:https://fsys.app/

功能简单说就是上传中文文档,然后返回给中英双语对照的版本。适合沉浸式英文阅读、严谨材料的学习。

2)

自《增长黑客》出版以来,我始终聚焦前沿黑科技如何促进商业和个人的 10X 增长。

关注我比较久的朋友,可能还记得,基于 AI 的双语翻译这件事,我两年前就折腾过。

2020 下半年 - 2021 上半年那会儿,我热衷打磨自己的信息输入输出流程,还分享过我的个人知识管理(PKM)迭代经验信息筛选管道做过 2 小时体量的油管直播

我甚至自行开发了一套双语翻译系统,代号叫——「西塞罗(CICERO)」(古罗马著名政治家、雄辩家、哲人,死于话多)。

用它可以翻译中英(实际上也支持其它语种,比如日语)对照的电子书,并且加入了 AI 识别精华高亮的模块。

当时 GPT3 还在内测,并未向大众公开。所以我用的翻译技术,来自 DeepL。算是那时候全球最强劲的 AI 翻译服务。

翻译一整本书,通常需要较大的文字处理配额,而我又喜欢一次翻译好几本,所以起初花钱买了 DeepL Pro 版本,一个月几十美金,用上了付费的 API 接口。

后来想了下大可不必,于是为了省预算,我用 Selenium 做了一个很 tricky 的版本,可以绕过 API ,直接通过 Chrome 浏览器的无头模式(headless),从免费网页版获取对照翻译的前后文

免费有免费的麻烦。比如:

  • 免费版有一次最多翻译 5000 字的限制

  • 某些特殊符号(包括 markdown 语法)在翻译时会丢失

  • 某些英文标点在翻译后会映射成错误的中文标点等

  • 傻傻地不启动翻译,需要在最后输入一个空格才开始工作


为此我还慢慢调试打磨了一整套策略,才让对照翻译的任务变得丝滑。

在陆续搞定这些问题后,有相当一阵子,我处在兴奋狂啃海外新书的状态中。

我还专门写过文章,披露我的高效阅读技巧如何速读一本书的精华(现在回看,不足为外人道)。

3)

独乐乐不如众乐乐。有这好玩的黑科技,就得炫耀给身边朋友们。

于是私下里给真格的 yusen、flomo 的少楠 + lightory、刀法的 doris 都分享过一些新翻译的、尚未被国内进口的新书。

像是《亚马逊逆向工作法》(Working Backwards)、《卡片笔记写作法》(how to take smart notes)、《The Story of Lululemom》(露露乐蒙传记,好像目前暂时仍未在国内出版?),小圈子内嗅觉敏锐又爱研究的朋友,都能第一时间读到。

后来想想,能不能干脆借此聚集一波爱书之人,而且是有独立主见、不容易被社媒营销带货风潮忽悠、英文好擅啃外文的书友?想必是高知人群偏多。便萌生了免费提供对照翻译电子书,做一个社群的小尝试。

当时给这个社群起名 —— 拼书书。

灵感来源自然是拼多多。之所以有个「拼」,也是希望社群里的朋友不要纯白嫖,而是做点贡献,稍微缴纳点入群费,这钱我拿来去 Amazon 买新书。

4)

这个社群小规模试跑了三个月,最终果断作罢。几个原因:

1/ 起初大家是外文书荒,后来发现社群内一周能提供三五本新书,阅读消化的速度跟不上出新书的速度,于是对「追新书追热书」这事逐渐怯魅。

2/ 显然,有版权问题等违规可能。尤其是当网友主动索要「我认知范围外某些领域的书」,例如涉及政治、经济格局、军事等,势必导致我极大的审核压力和风险。

3/ 「读书是被高估的美德」。当个人基于兴趣驱动的阅读需求,杂糅到社群的党同伐异和炫耀攀比之风后,势必歪曲这件事的纯粹性,变得背离初衷。

这事结束得悄无声息,群不久就沉寂了。

交了入群费的网友也没有一个来追问后续,毕竟从收到的新书价格上看,早就超过了那点份子钱。

5)

我也曾考虑过,是否有其他规避风险的办法。

比如:做个网页版,书籍由网友自行上传,而非我代购。—— 这固然能靠避风港原则部分解决版权争议,但并不能彻底摆脱违规的连带责任,得不偿失。

比如:不提供全输翻译,只输出精华句段摘录 —— 但是否精华的鉴别权在我手,这是非常主观的判断,且某些非工具类书(例如有完整故事线的传记)不适合只摘录句段,否则阅读体验很不连贯。

比如:直接出租我这个对照翻译工具 / 精华摘录工具 —— 但 on demands 日常随时蹦出的订制翻译需求,会挤占我的时间(本来就想做成一个自动化的事情,不想做成一个强人工客服生意),卖 liscence 的需求频度太低,续费率不会高。

在全盘考虑之后,觉得还是不要把这事商业化了。哪怕是公益开源都不行,很容易变成天神盗火,却玩火自焚。

于是还是私下悄悄跟朋友们分享,以及友情推荐新书给出版社,或者帮他们做小规模市场调研/校对/推荐吧。

像我近年作序的《纳瓦尔宝典》 、 WeWork 传记《亿万负翁》等,都是这样。

6)

这回 OpenAI 的 ChatGPT API,倒是让「将技术封装成用户所见即所得的产品」、「用摘要/缩句/改写来规避版权风险」变得更简单了。

技术难度大副降低,意味着作恶成本更低。

所以我的判断是,拼书书尝试过的商业化路径,更不能做。

堂而皇之窃人劳动成果的事情,窗口期总是有限的,且监管只会更严。

拿技术练手和小范围博短期名声可以,别玩过了。

经历了过去几年的增长泡沫,我愈发关注「可能在什么地方暴毙」,而非「如何不顾一切地摧枯拉朽增长」。

我公司的咨询和 FA 业务,也都是以此为基准来制定策略的(今年继续聚焦 Web3 和 AI,欢迎接洽合作:xdash@duck.com )。

7)

当然,出版行业也得警觉了,尤其是前几年倚靠外版书引入吃到甜头的。

技术层面,AI 让普通人读到外版书的时间,从国内原本平均一两年,缩减到了半个小时(这里没有讨论合规等政策层面的问题)。

出版社内的翻译、审校角色,也很容易被 AI 轻易取代 80%,甚至做得更好(比如让 AI 同时尝试 10 种文风来润色原文)。

最近 K.K 一本畅想未来世界的新书也快上市了,我也给写了推荐语 —— 且坦率地告诉编辑,都是用 AI 生成的。

ChatGPT 正从各个角度对出版业发起偷袭,而出版业这一次还剩什么底牌呢?

8)

最后,还是要给关注 AI 商业化变现的朋友,强烈推荐订阅这个小报童专栏,干货很多且不贵:

与我微信交流

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存