终于可以聊下 ChatGPT 偷袭出版业的一种姿势
1)
OpenAI 的 ChatGPT 持续爆火,基于其 API 开发的第三方应用工具也在井喷。
最近看到网友 @liuzhida 开发的网页服务「风声雨声」,就是「基于 GPT-3.5 的翻译服务」。
它的网址是:https://fsys.app/
功能简单说就是上传中文文档,然后返回给中英双语对照的版本。适合沉浸式英文阅读、严谨材料的学习。
2)
自《增长黑客》出版以来,我始终聚焦前沿黑科技如何促进商业和个人的 10X 增长。
关注我比较久的朋友,可能还记得,基于 AI 的双语翻译这件事,我两年前就折腾过。
2020 下半年 - 2021 上半年那会儿,我热衷打磨自己的信息输入输出流程,还分享过我的个人知识管理(PKM)迭代经验、信息筛选管道,做过 2 小时体量的油管直播。
我甚至自行开发了一套双语翻译系统,代号叫——「西塞罗(CICERO)」(古罗马著名政治家、雄辩家、哲人,死于话多)。
用它可以翻译中英(实际上也支持其它语种,比如日语)对照的电子书,并且加入了 AI 识别精华高亮的模块。
当时 GPT3 还在内测,并未向大众公开。所以我用的翻译技术,来自 DeepL。算是那时候全球最强劲的 AI 翻译服务。
翻译一整本书,通常需要较大的文字处理配额,而我又喜欢一次翻译好几本,所以起初花钱买了 DeepL Pro 版本,一个月几十美金,用上了付费的 API 接口。
后来想了下大可不必,于是为了省预算,我用 Selenium 做了一个很 tricky 的版本,可以绕过 API ,直接通过 Chrome 浏览器的无头模式(headless),从免费网页版获取对照翻译的前后文。
免费有免费的麻烦。比如:
免费版有一次最多翻译 5000 字的限制
某些特殊符号(包括 markdown 语法)在翻译时会丢失
某些英文标点在翻译后会映射成错误的中文标点等
傻傻地不启动翻译,需要在最后输入一个空格才开始工作
为此我还慢慢调试打磨了一整套策略,才让对照翻译的任务变得丝滑。
在陆续搞定这些问题后,有相当一阵子,我处在兴奋狂啃海外新书的状态中。
我还专门写过文章,披露我的高效阅读技巧、如何速读一本书的精华(现在回看,不足为外人道)。
3)
独乐乐不如众乐乐。有这好玩的黑科技,就得炫耀给身边朋友们。
于是私下里给真格的 yusen、flomo 的少楠 + lightory、刀法的 doris 都分享过一些新翻译的、尚未被国内进口的新书。
像是《亚马逊逆向工作法》(Working Backwards)、《卡片笔记写作法》(how to take smart notes)、《The Story of Lululemom》(露露乐蒙传记,好像目前暂时仍未在国内出版?),小圈子内嗅觉敏锐又爱研究的朋友,都能第一时间读到。
后来想想,能不能干脆借此聚集一波爱书之人,而且是有独立主见、不容易被社媒营销带货风潮忽悠、英文好擅啃外文的书友?想必是高知人群偏多。便萌生了免费提供对照翻译电子书,做一个社群的小尝试。
当时给这个社群起名 —— 拼书书。
灵感来源自然是拼多多。之所以有个「拼」,也是希望社群里的朋友不要纯白嫖,而是做点贡献,稍微缴纳点入群费,这钱我拿来去 Amazon 买新书。
4)
这个社群小规模试跑了三个月,最终果断作罢。几个原因:
1/ 起初大家是外文书荒,后来发现社群内一周能提供三五本新书,阅读消化的速度跟不上出新书的速度,于是对「追新书追热书」这事逐渐怯魅。
2/ 显然,有版权问题等违规可能。尤其是当网友主动索要「我认知范围外某些领域的书」,例如涉及政治、经济格局、军事等,势必导致我极大的审核压力和风险。
3/ 「读书是被高估的美德」。当个人基于兴趣驱动的阅读需求,杂糅到社群的党同伐异和炫耀攀比之风后,势必歪曲这件事的纯粹性,变得背离初衷。
这事结束得悄无声息,群不久就沉寂了。
交了入群费的网友也没有一个来追问后续,毕竟从收到的新书价格上看,早就超过了那点份子钱。
5)
我也曾考虑过,是否有其他规避风险的办法。
比如:做个网页版,书籍由网友自行上传,而非我代购。—— 这固然能靠避风港原则部分解决版权争议,但并不能彻底摆脱违规的连带责任,得不偿失。
比如:不提供全输翻译,只输出精华句段摘录 —— 但是否精华的鉴别权在我手,这是非常主观的判断,且某些非工具类书(例如有完整故事线的传记)不适合只摘录句段,否则阅读体验很不连贯。
比如:直接出租我这个对照翻译工具 / 精华摘录工具 —— 但 on demands 日常随时蹦出的订制翻译需求,会挤占我的时间(本来就想做成一个自动化的事情,不想做成一个强人工客服生意),卖 liscence 的需求频度太低,续费率不会高。
在全盘考虑之后,觉得还是不要把这事商业化了。哪怕是公益开源都不行,很容易变成天神盗火,却玩火自焚。
于是还是私下悄悄跟朋友们分享,以及友情推荐新书给出版社,或者帮他们做小规模市场调研/校对/推荐吧。
像我近年作序的《纳瓦尔宝典》 、 WeWork 传记《亿万负翁》等,都是这样。
6)
这回 OpenAI 的 ChatGPT API,倒是让「将技术封装成用户所见即所得的产品」、「用摘要/缩句/改写来规避版权风险」变得更简单了。
技术难度大副降低,意味着作恶成本更低。
所以我的判断是,拼书书尝试过的商业化路径,更不能做。
堂而皇之窃人劳动成果的事情,窗口期总是有限的,且监管只会更严。
拿技术练手和小范围博短期名声可以,别玩过了。
经历了过去几年的增长泡沫,我愈发关注「可能在什么地方暴毙」,而非「如何不顾一切地摧枯拉朽增长」。
我公司的咨询和 FA 业务,也都是以此为基准来制定策略的(今年继续聚焦 Web3 和 AI,欢迎接洽合作:xdash@duck.com )。
7)
当然,出版行业也得警觉了,尤其是前几年倚靠外版书引入吃到甜头的。
技术层面,AI 让普通人读到外版书的时间,从国内原本平均一两年,缩减到了半个小时(这里没有讨论合规等政策层面的问题)。
出版社内的翻译、审校角色,也很容易被 AI 轻易取代 80%,甚至做得更好(比如让 AI 同时尝试 10 种文风来润色原文)。
最近 K.K 一本畅想未来世界的新书也快上市了,我也给写了推荐语 —— 且坦率地告诉编辑,都是用 AI 生成的。
ChatGPT 正从各个角度对出版业发起偷袭,而出版业这一次还剩什么底牌呢?
8)
最后,还是要给关注 AI 商业化变现的朋友,强烈推荐订阅这个小报童专栏,干货很多且不贵:
与我微信交流