查看原文
其他

港科大郭毅可:一个会「提问」的机器,远比复刻ChatGPT更重要

此念 2024-04-30

The following article is from AI科技评论 Author 黄楠

本文经授权转载自微信公众号:AI科技评论(ID:aitechtalk)

作者:黄楠

编辑:陈彩娴

导读

今年 4 月,位于香港清水湾、香港科技大学的一个小型会议室内,汇集了十几位顶尖的科学家,有以郭毅可为代表的香港本地高校教授,以及专门从北京飞赴港岛的何晓冬、王小川等多位 AI 大牛。他们屏气凝神,热烈地讨论着大模型带来的技术热潮。


这轮创新中,香港可以做什么?这是郭毅可彼时所提出的问题。


香港优势在于高校多、人才丰富,但要把大模型部署到本地、并能应用起来,还需要大量 GPU,算力是大模型生存与发展的必要条件。


讨论的最终结果是:必须要有一个机构作为依托,先做一个香港自己的基础大模型(下称“香港大模型”)出来。


大模型在国内爆火最初,很多浪潮中的创业者喜欢以“中国版 OpenAI”来讲故事。2015 年,OpenAI成立,这种独立于商业之外的科研机构模式,被外界视为ChatGPT得以大获成功的基座。但在郭毅可看来,OpenAI之于大模型,它走通的大模型路径可以学、它的技术长期理想主义可以学,而不是所谓的商业模式。


“OpenAI很好,但创新不是如何去思考在中国再现它。每个人有自己的方法论,如果只能看到‘复制’、无疑脱离了创新本身应有的意义。”


他认为,从机构属性自身出发,无论是如OpenAI、DeepMind的海外公司,还是国内像智源、百度、阿里达摩院等各类公司,并不存在真正意义上的模式“差异”,大家的目标是相同的:聚集有一批聪明的人,去做最尖端、最具探索性的工作。


这种朴实的理念也延续到具体的行动上。


之后的四个月里,香港由香港政府资助,港科大牵头、香港五校联合成立了香港生成式人工智能研发中心(HKGAI),港科大成为国内首个全面启用ChatGPT服务的高校,目前,香港大模型也在HKGAI紧锣密鼓地研发中、不日将面世。


不在排行榜的分数上争高低,郭毅可透露,香港大模型的关注点更具体:多少人愿意用?哪些场景可以用?怎么用?出现问题了如何解决?


人工智能的市场很大,香港大模型定位成为一个开源技术基座,在此之上,所有香港本地的市民和企业都有机会使用大模型并可以这个技术基座开发生成式人工智能的应用。用技术来解决过去解决不了的、实实在在的问题,这才是创新的伟大所在。


郭毅可笑称自己是“工程师”,少说、踏实做好过程中的每一步,是他予以“创新”的本质。


8 月初,在港科大郭毅可的办公室里,我们与他就香港生成式AI研究中心、HKUST ChatGPT的话题进行了一场对话。


以下为访谈实录,雷峰网-AI科技评论作了不变原意的编辑整理:




cinian


01

GPT 革新教育范式

▲ 图片来源:Matt Chinworth

 AI科技评论今年 6 月 1 日,港科大正式开放了“港科大版ChatGPT”,是国内首个全面启用GPT服务的高校。专门做一个校园GPT的原因是什么?


郭毅可:我们是首个用ChatGPT的学校,做一个校园GPT的目的在于更好的理解用户体验,从而认真研究ChatGPT在大学教育中的有效使用。


校园 GPT 是希望让学生、老师都可以用上这样的服务和技术,所以当时我们就想,还是买一个Subscribe Server,把GPT部署在校园网内,所有的使用数据归我们自己管,这样一方面既起到数据保护的作用,另一方面也能基于数据做更多的统计和研究、更好地理解ChatGPT在大学教育中的作用。


 AI科技评论在学校部署一个GPT里的成本高吗?


郭毅可:并不像大家想象的那么高,一年大概三百万港币左右。


 AI科技评论使用HKUST ChatGPT后,具体带来了哪些变化?


郭毅可:变化是具体且多方面的,这当中核心的问题是,如何用它来改变我们过去的教育模式。


过去的教育模式主要采用记忆式,ChatGPT出现后改变了这一情况,单纯依靠记忆去学习知识的方式开始变得没有用,任何问题、ChatGPT都可以给你回答。


这就需要我们去思考,这样的回答有多少的准确性,可信度。聚焦到教育方法上,这就是要培养学生的批判性思维的能力。


ChatGPT的有效运用,是需要有许多创造性思维的。


举个例子,例如很多考卷我们可以让ChatGPT做一下,对考卷的质量有一个大体的认知,这样我们就可以考试作出有意义的设计,可以改变考题,如果你出的考题ChatGPT能考100分,说明试卷可能没有什么难度,但如果模型只能考70分,这样的卷子拿去给学生考才有意义。


你可以把ChatGPT的考分作为及格分,要求学生必须比机器做的好。现在,普遍的看法认为有了ChatGPT之后学生会抄袭,实际上这个看法很片面。以前搜索引擎刚刚开始的时候,大家也在说可以抄袭,现在 ChatGPT跟搜索引擎的区别是什么?


其实并没有,ChatGPT只是将搜索引擎里的信息进行了总结,我们可以将它视作一个非常好的思维链搜索引擎。所以对它能力的恐惧,没有必要太夸张。


实际上,ChatGPT对教师提出了很高的要求,教师们必须改变教学方法,使得学生在和机器的交互中形成自己的思考,提高自己的能力。


 AI科技评论这个过程中如何辨别机器的回答、并将机器的回答转换成我们自己的知识和答案?


郭毅可:学会批判地看待它。ChatGPT给你的不是知识,是压缩,提炼过的信息。把这样的信息去粗取精,去伪存真,使其成为知识,是我们在人工智能时代教育学生的主要任务,这都对老师提出了更高的要求。


我们的教育再也不是简单地要求这个学生去回答一些书本上的问题,例如物理的定义、怎么使用定理等等,这都是过去的做法。


 AI科技评论大模型的出现会如何影响人才教育模式?


郭毅可:最直接的影响是,知识积累的途径发生了变化。让人如何在和智能机器的交互中更快地学到东西。这种改变是必然发生的。


之前出现了一个专门向机器提问的岗位叫Prompt Engineer(提示工程师),其真实含义是人要学会跟机器交流。这类岗位的存在,我觉得有点傻,这种工作要是有,也是暂时的,但它的确反映了当前人与机器交流的水平需要提高。Prompt Engineer是否会长期存在?对大模型的研究和开发有什么影响?欢迎添加作者微信(finfl26est)交流。


并且,机器本身也在发生很大的变化。目前大模型才刚刚开始,再过5年、10年,大模型也会发生很大的发展。例如现在的大模型只能回答问题,或许在不久的将来我们还能看到会提问的大模型,这将是交互性人工智能时代的到来。


 AI科技评论为什么学会提问更难?


郭毅可:所谓的提问有两种,一种是不懂装懂,另一种则是真的不懂、计算机也知道自己不懂,这就不容易了。


现在绝大部分的大模型都是在不懂装懂,真正知道自己不懂的几近于无,这是第一个方面。


另一方面,模型要知道什么是对、什么是错,这就意味着大模型有了价值观。不是什么问题都乱提,而是能给出令人觉得有价值的问题。


反之,人给出的回答机器也需要进行判断,看正确与否。所以,有价值观的机器才可以和人产生有意义的交互。因此,从这些方面来看,我们距离真正的交互式人工智能还很遥远。




02

讨论「AI 取代人」还太早

▲ 图片来源:Matt Chinworth

 AI科技评论此前您曾提到一个观点,认为AI的发展是“人创造更聪明的机器,更聪明的机器培养更聪明的人”;这一看法与此前外界对生成式AI的担忧、人类难以控制的观点是否相悖?


郭毅可:人应该比机器聪明。今天我们对生成式人工智能要做的就是努力地研究它,适当地使用它,用大模型做更多对我们有利的事情,在研究的过程中自然可以有管控它的方法。但前提是我们必须要实践,不要想当然。


我们要首先要使用它(GPT),这能减少很多对生成式AI误会的产生。任何新技术的出现,势必会产生好坏两端不同的看法。


过去有了汽车、有了飞机,人类也担心事故风险、是不是生命就变得危险了;有了计算器,我们也担心人就不会算数?这些担忧并没有发生。只有使用之后你才会发现,人不是这么活的。


机器的确节省了一部分人的劳动力。比如做开会记录、AI可以将交流的内容自动录下并成文,比如翻译、如果GPT的翻译能力比人更强,又为什么不把这件事交给机器去做?


很多的事情是应该被机器取代的, 但人总是有人的用处,最大的用处就是在于人可以驾驭自己创造的机器。或许最开始机器可能会误用,会有负面的效果,但这些都会被管控的。


AI来之于人、由人研发,为人所用,至少现阶段无需太过悲观,认为它会带来毁灭性的灾难。


 AI科技评论有些职业确实会因此而消失。


郭毅可:关键还是如何改变你自己。


部分岗位确实会取消。例如传媒,ChatGPT的写作能力带来极大的影响,未来的传媒形势也随之发生变化。


再过4年,我们阅读和新闻传播的方式一定是今天这样么?职业在社会上也会分化,文字生产者可能变成视频的内容生产者等等。但这样的改变有错么?400年前一样没有报纸、杂志。


所以我们没有什么好担忧的。职业变化是必然的,技术推动社会和人的能力的发展也是永恒的。


每次新的技术出现,总有一批人或欢呼、或谩骂。但这并不会、也不能改变什么。我们要做的是在规则范围内,以科学的方式去探索。而不是等技术在某天发展到一定阶段时才发现,这件事别人都做了、而你还不懂。


 AI科技评论今天大模型市场上,人才也是一个被争抢的焦点。从 OpenAI、微软出来的人热度都很高。


郭毅可:什么叫挖人?我认为这是件很可悲的事情。OpenAI第一代的人从何而来?


不可否认的是,我们确实需要有领军的人物,有经验的工程师来带领去完成一次又一次的迭代。但看今天世界上,所有的创造有多少是已经创造过的?


一个人在OpenAI工作过本身具有很多的偶然性,对大模型有多少的贡献也存在很多不确定性。同时,一个人在一个问题上做了贡献,并不等于他的明天还没贡献,甚至往往做了一件事情成功、就意味着他会缺乏创新能力,不要去这么想问题, 认为创新的捷径就是挖人,这太幼稚了。


我在选择人才上思考的是:要做什么事情,需要具备什么样的能力,我要的人是否有通过学习获得这些能力的灵气,是否可以有踏踏实实做好一件事的耐心,是否可以独立思考,坦诚相见。


 AI科技评论如何理解您刚刚提到人在创造中的偶然性?


郭毅可:OpenAI今天的成就不是偶然,它在创新上做的很好。但深入到团队里,他们之中有几个是谷歌的成员?并没有。所以说,某个人在这个节点在OpenAI工作过,这件事本身是有偶然性的,并不意味着他一定是天才。


因此,如果我们的角度是,因为这个人参与过大模型、懂得怎么做,我们 copy起来更容易,那么我认为,这种想法本身就否定了创新,也不尊重知识产权。


Transformer提出是在2017年,之后在2020年OpenAI发布了 GPT-3,三年时间过去了,该学的也都学会了。如果今天有OpenAI团队因为我们的工作想加入,我很欢迎,但我并不希望他将OpenAI的那套方法论带过来,不需要。因为每个地方、每个人的做法不同。


多数VC对初创公司的关注点会放在创始团队上,发现团队里有OpenAI 的人便赶快投钱、没有就不投,类似的思路能够成就一家成功的公司么,并不一定。


Midjourney只有12个人,依旧做成了一家这么伟大的公司,它挖了哪些人么?并没有。因此我觉得,挖人这件事境界不高,档次不够。




03

不做 OpenAI「第二」

▲ 图片来源:Matt Chinworth

 AI科技评论之前您曾提到,有做一个香港版OpenAI的想法,目前这件事还在进行中吗?


郭毅可:正在进行中。


香港没有OpenAI、也没有智源,我们需要一个像智源这样的机构。我们确实也这么做了,成立了香港生成式人工智能研发中心。可以说它在做的事情,就相当于一个智源,但我们的组织机制、创新文化、技术途径和智源不会相同的。


由于香港的主体或应用很多,因此,我们至少要有个自己的 foundational model,下一步才能去思考大模型如何发展,如何跟金融、法律、艺术等相结合进行应用。


 AI科技评论对这个中心有哪些设想?


郭毅可:香港生成式人工智能研发中心由港科大牵头,联合港中文、港大、港理工和港城大,五所香港高校一起打造研究中心,集中力量为香港的政府、市民去做这件事,届时也会以开源的方式跟大家见面。


站在工业界的立场,有些企业和公司有自己的任务、自己的目标,那个环境更职业一些。架构上不同,但我觉得目前的架构比较好、也更适合我们。


研发中心主要做两件事,第一件、做一个香港的基础大模型,第二件要在基础模型做应用的系统,要有国际水平,也要有香港特色。现在都在推进当中。


 AI科技评论一个客观事实是,OpenAI有微软的支持,而国内的非营利性机构研究则是以大学研究立项、国家科研经费支持为主,这种模式差异带来的影响有哪些?


郭毅可:在我看来其实没有什么差异,只是平台不一样。


香港没有类似微软这样的私营产业能够提供支持,但在内地,百度、阿里、京东、腾讯等等,都有专门的研发部门,企业来提供研发支持。而从大学做科研的角度出发,可能更偏重对创新性的要求。


当然,我们的研究中心的不同之处在于,我们是拿着纳税人的钱、为政府和市民在做这件事,在模型侧更注重如何让香港大模型让人们能够用起来,而不是去追求一些人为的指标,比如哪个模型比另一个更精确、任务检验的指标更好。


我们追求的目标是,如何让人们能真正使用起来,令大家觉得大模型对他们的生活是有帮助的,这个很重要。


 AI科技评论您的思路很实在。


郭毅可:一直以来我对自己的定位是工程师,总结起来就是一句话:少说、多做。


 AI科技评论过去一段时间,很多人都会问一个问题,为什么大模型先在美国产生了、而不是中国。


郭毅可:如果将自己定位成一个跟随者、依靠别人引路,那它只能永远慢半拍,充当创造者的解说员和模仿者。


中国不乏创造者,举些成功的案例。从港科大走出去的大疆,过去人们未曾设想过飞机能够以无人机的形式飞行,大疆做成了。内容赛道里的抖音、快手,也跑出了它们自己的模式。


或许这种创新的类型、级别不同,但这并不意味着,中国就没有创新。我并不觉得中国的企业就要比美国的公司落后多少。但可能在做事情的心态上,需要改变和调整。


 AI科技评论OpenAI的模式是否有带来哪些冲击和影响?


郭毅可:首先,我并不认同“OpenAI带来新模式”的说法。


全身心投入到技术创新的研究中去,无论是谷歌的DeepMind,还是国内阿里的达摩院,腾讯、百度等企业内部的AI Lab,长期以来一直都在这么做,因此从这个方面出发,我认为不存在模式上的差异。只是说,可能中国的经济还没有达到一个高度。


一个成熟的经济,必须有一批人去做最尖端、最具探索性的工作。企业有钱就企业投,企业没有钱、国家有钱就国家投。今天的中国有了很多国家实验室,我们也相信他们能够做出创新性的工作。


但重要的是,我们需要明白科学研究是一个长期的过程,并非两年、三年就能完成的事。科学研究从失败里走来,不断地试错,所以要给时间。


 AI科技评论我们看到3月份的创业潮里,很多企业想在说自己要做中国版OpenAI,但近段时间类似的声音似乎变小、变少了,以您的观察来看,发生这种变化的原因是什么?


郭毅可:事物发展两面性一直存在。


我觉得王小川就做得还可以,而且我也相信他能做出一个好的结果。他有梦想,也融到了钱,过去的经历为他提供了很好的知识积累和行业经验。所以我觉得他是有这个能力去做的。其实,中国在大模型研究和发展上的成就是令人自豪的,我们不要妄自菲薄。


有的人看得更远,有情怀、想做出一个中国的拳头产品。有的人聚焦的是它背后带来的商业价值,目的和方向不同。最终成果有成功、有失败,很正常。


 AI科技评论那今天我们想做一个中国版OpenAI,它需要具备哪些条件或特质?


郭毅可:首先我认为,这个说法已经错了。不要去做中国的OpenAI ,OpenAI已经诞生,没有必要再去创造另一个。按照这种思路,如果不久后美国或者其他国家又跑出了新的模式,我们又再做一个“中国版”的 XXX,这无异于失去了自己的创新。


我们要做的,应该是中国自己的生成式人工智能,做自己的AI,而非对 OpenAI的盲目崇拜。有了OpenAI后,谷歌就不值钱了吗?事实上并非如此。


甚至,要佩服的是Microsoft而不是OpenAI,Microsoft率先以 Copilot的模式将所有技术集中在其产品中,真正把 OpenAI 的东西转变成embedded insight,这是技术所带来的真正伟大之处,因为它并非仅仅是技术本身,而是聚焦对人类问题的攻克,正如DeepMind用 AI 来解决蛋白质结构、经济学等各个领域的问题。


OpenAI值得我们学习之处,是它对科研的初心,从最开始还没有做起来的阶段、就敢于把所有的东西都公开、开源出来,包括对大模型路线的坚持,它之所以存在的特殊性是我们要学习的,而不是学习它的公司和商业模式。


 AI科技评论也就是说,实现一件事的过程、比达成同样的结果更重要。


郭毅可:是的。不是说ChatGPT很厉害、效果很好,我们就要去追求一个同样好的ChatGPT。坚持自己的方向和路线(也很重要)。


正如前面我所说,一个能够提问的机器,能够跟人辩论、理解语言意义,具有价值观的机器,远比复刻一个 ChatGPT 要重要得多。



- END -





《生命·成长》第四季 正在播出,欢迎收看。

👇

击下方海报即可观看

最新《生命·成长》第四季 完整版纪录片


大家都在看

点击图片即可阅读全文


邱启敬:艺术是对生活、生命、死亡的一次彻底反抗 

《生命·成长》第三季(第二期)


 假如48岁时一无所有,你会怎么做?


孩子摆烂在家不愿出门,怎么办?| 此念课堂

点击阅读原文,看此念出品更多精彩视频

喜欢~马上点击在看  ❤  

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存