查看原文
其他

AI 的“奥本海默”时刻来临,亚洲创新者在探索这些应用潜力

TinTinLand TinTinLand 2024-03-13

AI 到达了“奥本海默”时刻吗?诺兰最近在其执导的新片《奥本海默》一场映后活动谈到,人工智能领域的研究者“将目前的时刻称为‘奥本海默’时刻”,事实上 OpenAI 创始人此前在美国听证会也主张对 AI 实行监管,正如奥本海默曾呼吁国际社会共同控制和管理核能,建立有效的监督机制。我们已窥见 GPT(生成对抗式预训练)模型的巨大潜力,层出不穷的大模型正引领着人机交互、自然语言处理以及创意应用的浪潮。

应用开发正是亚洲创新者的擅长领域。就在上个月,由 Moledao、雷锋网、GAIR 主办,TinTinLand 和 Cointime 联合主办了一场以 AI & GPT 为主题的 Hackathon,旨在促进创新、交流和合作,探索 AI & GPT 技术在各个领域的应用潜力。本次黑客松吸引了各领域的创意者、开发者和技术狂热者,共计 57 个项目报名参与,经过 12 位行业知名评委评估,总计 11 个优质项目入围,最后在第二轮线上路演筛选后,共 7 个项目入选 8 月 15 日于新加坡 Orchard Hotel 举办的决赛。

入围决赛的 7 个项目涉及开发工具、金融监管、教育、消费、创意领域,获奖情况可见《AI&GPT 黑客松决赛跨空间联动, 共同揭秘终极大奖》。未来 AI 将如何潜移默化地改善我们的工作和生活?TinTinLand 深入获奖项目产品细节,与各个团队探讨他们是如何思考,并将想法付诸行动。




创造之路的得力助手

对于创业者来说,时间和资源都是宝贵的。而当前阶段 AI 已展现出颇有价值的辅助能力,将逐渐为创业者和企业显著提升开发效率。获得金奖的 GothubAI 便是从这个角度切入,其核心在于整合和优化各种前沿的人工智能工具,如自然语言处理(NLP)、机器学习模型、自动代码生成工具等,形成一个强大、协同、高效的软件工程平台。

举个例子,Anna 是一个非技术背景的创业家,她有一个关于在线艺术品销售的创业想法,但缺乏实现它的技术知识。借助 GothubAI,Anna 可节省数周乃至数月的开发时间,快速地将她的创业想法变为现实:

1. 需求描述:Anna 向 GothubAI 描述她的需求:“我需要一个艺术品在线商店,允许艺术家上传作品,用户可以浏览和购买。”

2. 需求解析:GothubAI 使用 NLP 技术解析 Anna 的描述,确定她需要一个具有用户注册、艺术家上传作品、在线支付等功能的网站。

3. 自动代码生成:GothubAI 开始自动生成该网站的代码,包括前端界面、后端逻辑、数据库设计等。

4. 自定义和优化:Anna 提供了她喜欢的网站模板和颜色方案。GothubAI 根据这些建议调整和优化生成的代码。

5. 测试和部署:一旦代码生成完毕,GothubAI 会自动进行测试,确保所有功能都正常工作,然后部署到生产环境。

6. 上线:在十几分钟内,Anna 的在线艺术品商店就准备好了,她可以开始邀请艺术家和客户访问她的网站。

这正是 GothubAI 所能提供的价值:为非技术型创业家和早期企业提供快速、高效的软件开发解决方案,使用户快速从概念阶段转到实际的产品原型,为创业者提供了迅速验证其业务想法的机会,而无需投入大量时间和资源开发初步产品。此外 GothubAI 提供的 API 和开发者中心允许进一步的定制和扩展,使得产品可以随着业务的增长而适应和扩展。教育和社区中心也可为创业者提供宝贵的资源,帮助他们更好地理解和利用平台,以及与其他创业者和开发者交流经验和最佳实践。

通过上述优势,GothubAI 不仅帮助客户缩短开发时间,还可以降低总体的开发成本。对于初创企业和创业者,这意味着更快地进入市场,更高的业务敏捷性,以及更低的风险和前期投资。这些都是在竞争激烈的创业环境中成功的关键要素。

对于自动代码生成工具而言,核心挑战是确保代码质量和可维护性。GothubAI 的对策是首先由经验丰富的软件工程师设计预定义的代码模板,以确保生成的代码结构是清晰的、模块化的,从而易于维护和扩展。生成的代码会自动包括详细的注释和文档,生成后会自动进行单元测试和集成测试,以确保代码的功能性并减少后期的错误和缺陷。GothubAI 也集成了代码质量和代码审查工具,如静态代码分析器,并根据用户反馈不断地改进和优化生成算法和模板。这使得创业团队和软件工程师可以放心地依赖 GothubAI,将他们的注意力集中在其他核心开发任务上。

银奖得主 Wireframe Designer 则着手于产品设计,帮助设计师和产品经理将想法可视化,并自动根据他们的描述生成有针对性的设计方案。作为基于 Figma 的插件,Wireframe Designer 使用 AI 快速生成线框图,适用于桌面和移动端设计,并具有灵活的组件库和布局模式,能够重复生成多种方案,从而释放创意和灵感。



数字金融监管与时俱进,

促进 Web3 走向主流

另一位银奖得主 Insightic 是一家提供 AIGC 数字金融合规评估方案的公司,核心科技来自于新加坡国立大学的科研成果以及与政府监管部门和金融机构合作过程中构建的合规评估工具。其中合规风险预分析、智能合约合规分析、链上数据分析等,都有人工智能的参与。

Insightic 利用基于大规模语言模型的技术构建了 AI Agent,进而帮助监管人员、设计、分析师根据任务需求和评估对象,自动化的部署合规评估和风险管理流程,极大程度简化了工作量,降低人工失误。举例而言,团队把一项发在顶级会议的文章的技术以太坊去匿名化(De-anonymization)应用在政府对项目方的监管。给定一个人的以太坊地址,去匿名化可以找到全网最可能属于同一个自然人的前 N 个账户。当个人账户在政府注册登记为虚拟货币发行人的时候,Insightic 可以帮助政府做更精确的链上 KYC。

🔗 相关文章链接:https://dl.acm.org/doi/abs/10.1145/3543507.3583345

几个竞争对手的网络钓鱼(橙色)和正常(蓝色)账户的 T-SNE 可视化

对 Insightic 而言最大的挑战是最开始没有人知道该怎么做数字金融和 Web3 的合规和监管评估,最早期也缺少切入点。而随着团队跟多个政府监管部门每周开会、深入沟通了解他们的监管侧重点和需求,并且大力推广把传统监管结合团队的研究结果和 Web3 Native 的分析方式,这样一套与监管部门共同开发的系统自然会满足他们的固有需求。

早期满足多个不同司法管辖区的需求不易,不过好在合作的监管部门很乐意将 Insightic 这个共同创立的产品,推广给当前司法管辖区的银行、交易所以及其他国家的央行和监管部门。这也让 Insightic 在合作中不断构建全球监管知识体系,以便后续发展。

当前数字金融和 Web3 的合规监管分析正处于高速发展阶段。大多数分析方法和规则来自于银行的固有经验、交易所内部规则和单一司法管辖区的法规条令。然而数字金融和 Web3 的核心在于去中心化、全球性质的金融活动。大力发展单一司法管辖区的知识体系来对抗去中心化金融活动是远远不够且不明智的。

因此 Insightic 正结合联邦学习的技术,目标是结合多个司法管辖区不同部门的知识库,构建更加有效的集智慧合规分析方案。团队认为联邦学习给合规监管提供了最有力的支持。首先,单一司法管辖区下的金融机构和交易所可以在保证自己数据的隐私性的前提下,共享对加密货币技术提供商或项目方的分析方法。共同训练符合当前司法管辖区的人工智能模型。其次,多司法管辖区的监管部门可以通过联邦学习的方式,构建具有全球视野的专注数字金融的大模型,减少法规漏洞带来的潜在危害。



消费、创意、伴侣……

AI 如何融入我们的生活

GPT 大模型的海量训练使得 AI 如同百科全书式的博学家,而日趋成熟的语音合成技术使得 AI 能像人类一样交流沟通。Askio 专注于为不同领域定制 AI 孪生专家,目前已积累 4 个细分行业的领域数据,并通过超过 100 万条文本问答进行了深度匹配和优化,以提升语义提取能力。举例而言,你可以文字咨询一位啤酒专家了解性价比最高精酿啤酒,也可以咨询一位心理辅导专家给予一些建议;未来还可以通过图片交流的方式,向一位 AI 运动康复专家请教身体的恢复情况。

Askio 计划在未来服务电商品牌,与用户对话时,AI 并不直接推广,而是在提供有价值答案的基础上,在识别出购买意图的时候再进行商品推广。譬如用户提问之后,AI 会进行回复,同时 Askio 根据回复的内容进行二次相似度+语义检测,如果识别出用户的购买动机(如什么品牌的低度数啤酒好喝),会紧接着为用户推荐领域专家提前配置好的商品链接,方便用户下单购买。

技术而言,最困难的在于海量数据的清洗、获取和回复排序(data cleaning & data retrieving &sequencing),对此 Askio 采用了一种混合搜索方法,利用一个结构化的向量数据库进行相似度计算,并同时对原始数据进行关键词搜索。通过综合利用这两种方法的结果,实现了更全面和可靠的提示输出,为大型模型提供了更好的性能。针对排序问题,也支持用户在回答历史中不断提交更优的回答,并结合行业领域的数据进行场景优先排序处理,以确保用户获得与具体领域相关性更高的回答。

另一个多模态机器人创作平台 MyShell 则在“说”花费了不少功夫,利用语音合成技术赋予机器人自然且富有表现力的语音能力。通过先进的算法和神经网络架构,该平台可以合成带有语调、情感和语言细微差别的类人声音,从而在用户和机器人之间实现更具吸引力和相关性的交互。

传统的文本转语音(TTS)系统通常比较昂贵,且需要冗长的样本声音才能准确克隆,而 MyShell 团队利用对 TTS、Auto-prompt 和矢量数据库技术的深刻理解设计了一种解决方案,使创作者能够开发具有相当短的样本声音的机器人,大大简化了机器人的创建过程,使创作者能够以比现行市场价格低 97% 的成本创建自己的机器人。

MyShell 团队面临的另一个挑战在于和谐集成支持多模式功能的各种 AI 组件。协调语音合成与语言模型,同时保持实时响应能力需要复杂的优化和同步,特别是在满足各种潜在应用和场景时,团队的多元化专业知识对于无缝编排这些组件、从而带来一致的用户体验非常宝贵。

除了融入私有化大规模语言模型,MyShell 平台的机器人可以通过语音提供个性化帮助,精准、富有同理心地解决用户的疑问,从而提高品牌忠诚度和客户满意度。MyShell 的持续学习功能使机器人能够与用户一起发展,适应不断变化的偏好和需求,这对于专为情感支持而设计的伴侣机器人特别有利。从本质上讲,MyShell 通过和谐地融合语音合成技术和私有化的大规模语言模型,增强了机器人的情感共鸣和认知能力,让机器人不仅是功能性工具,而且是真正的伴侣和合作者。

“无限的创意宇宙”是 MyShell 的愿景,团队谈到一位父亲使用的他们产品,希望创建一个 AI 机器人每天晚上给他的儿子讲故事,同时教他的儿子学习英语,但他不懂如何编程或让机器人发出温柔的声音。MyShell 的目标正是让创作者的人工智能功能民主化,使其易于访问和使用,使用户能够为他们的创作注入独特的个性,使机器人能够根据用户输入动态调整故事,从而产生互动且引人入胜的叙述。

通过提供将先进人工智能技术与个人创造力相结合的工具,MyShell 平台可成为各个领域创新的催化剂。无论是在讲故事、艺术、教育还是其他方面,MyShell 都希望能激发想象力,使用户能够重新定义可能性,并通过协作和个性化的人工智能驱动的创作来丰富人类体验。



数学和编程学习如何更个性化且有趣

个性化学习、教学助手、虚拟导师……AI 在教育领域的应用有助于提升教学质量、学习体验和效率,使教育更加个性化、灵活和智能化,而借助语音识别技术、文字转语音工具等也可帮助到有特殊需求的学生。

SolveGPT 是一款基于 AI 集智的数学解题学习软件,目前已经开放了网页端与安卓端的测试版,实现了从拍照题目识别到题目课件的自动化生成。现有的数学学习工具的实际痛点在于题目搜不到与答案看不懂。SolveGPT 基于大语言模型开发了一种全新的数学学习工具,创新性的引入了多模型对抗与知识点讲解以直击实际痛点。

为了提高求解准确率,SolveGPT 同时将问题输入多个大模型同步求解,并通过比较多个大模型的答案,基于对答案的思路,输出出现频率最高的答案以提高准确率。在现实生活中,为了准确求解一道题目,我们可以将题目同时给多个同学独立求解,如果某个答案出现的频率较高,而其他答案出现的频率较低,说明出现频率高的答案正确率也会较高。

在代码世界中,SolveGPT 同时令多个大模型求解同一个问题,统计输出的答案,并约定频率最高的为正确答案,以实现多模型同步求解的效果,能够有效提高求解准确率。多模型同步求解能够根据答案出现的频率以判断答案的准确率,具体来说,当每个模型求解答案均不相同时,模型的答案准确率较低,当多个模型都求解出同一个答案时,答案的准确率较高。

而为了确保生成的答案能够被用户充分理解,SolveGPT 基于数学课件的讲题顺序,自动化生成题目涉及的数学定义,数学定理,最后再结合定义与定理以讲解答案,自动化全自动生成的针对一道题目的数学讲义能够有效帮助用户理解数学问题。

在数学学习方面,从解释定义、证明定理和题目应用三个角度,SolveGPT 能够自动化生成 PDF 课件,帮助学生理解知识。SolveGPT 基于 LaTex 的 beamer 模版,这是一种数学论文常用的汇报模版,具有排版清晰整洁,数学公式美观等特点。PDF 课件生成的方式是将 Tex 的源文件视为字符串进行编辑,并在字符串内部补充题目解释定义,证明定理到题目应用的文字内容,以生成包含题目内容的 Tex 的源文件,最后对 Tex 源文件进行编译,并输出编译的 PDF 课件。这样的课件生成顺序参考了各世界著名大学的数学讲义的顺序,从原理上讲解题目,是绝大多数数学大学教授的讲课模式,不过 SolveGPT 目前还没有照顾到更多不同层次的学习者需求,今后将根据用户需求进一步开发。

2014 年新加坡发起“智慧国家”倡议,而游戏化面向对象编程(OOP)教育工具则是一个颇受欢迎的领域,它的目标是教育部门让学生更好地为未来的数字社会做好准备。获得最受欢迎奖的面向对象的塔防(Object-Oriented Tower Defense)利用塔防类型的直接性和简单的控制方案来显著降低产品的进入门槛。它利用人工智能和寻路算法以及多种编程设计模式来创建模块化、可扩展且灵活的组件。团队表示选择 OOP 是因为它是一种流行的编程范式,涵盖了全球最流行的 5 种编程语言中的 3 种。

面向对象的塔防是通过仔细研究巴图玩家类型(Bartle’s Taxonomy of Player Types)而创建的,该分类法根据玩家的动机和偏好将玩家分为四种类型:成就者、探索者、社交者和杀手。每种玩家类型可以描述如下:

  • 成就者:这些玩家的动机是获得积分、等级和其他可衡量的成功形式。他们喜欢与他人竞争并实现目标。

  • 探索者:这些玩家的动机是发现新事物和探索游戏世界。他们喜欢寻找隐藏区域、解决谜题以及了解游戏机制。

  • 社交型玩家:这些玩家通过与其他玩家互动来激励。他们喜欢聊天、组建团队以及与其他玩家建立关系。

  • 杀手:这些玩家的动机是与其他玩家互动,但他们喜欢通过战斗和制造混乱来实现这一目的。

在分析了巴图玩家类型后,游戏中添加了积分、等级、徽章、成就等各种游戏元素。每个游戏元素背后的表征和动机如下:

  • 点数:点数表示游戏中存在的生命值和货币资源。它们起到反馈循环的作用,并通过激励学生获得更多此类资源来进步来鼓励他们参与游戏。平衡和管理这些资源背后的策略在于积极利用面向对象的编程来编码他们的炮塔。

生命与货币
  • 关卡:关卡由游戏中生成的无尽阶段来表示。它们为学生提供进步感和成就感,同时挑战他们达到尽可能高的水平。它增强了游戏的可重玩性并促进了战略思维。

游戏回合与敌人波动
  • 徽章:徽章表示为完成关卡后出现的星星。每个等级玩家最多可以收集 3 颗星星。他们对学生的表现提供即时反馈,并鼓励他们积极参与游戏以收集所有星星。每颗星星的达成条件都经过精心设计,以提升游戏玩法和学习体验。

关卡完成横幅

  • 成就:成就由授予奖励的各种任务来表示。它们代表了一系列面向对象编程的挑战,并提供了一种成就感和积极的强化。这个游戏元素的加入鼓励学生积极修改和优化他们的代码。它确保学生不断接触面向对象的编程概念。

游戏任务

总体而言,通过研究巴图玩家类型分类法,并加入各种玩家类型喜欢的游戏元素,该产品能激发学生对面向对象编程教育的兴趣。此外,与传统的课堂讲座相比,游戏化的方法使学习体验更加愉快和引人入胜。它为学生提供即时的视听反馈,使他们能够理解和可视化他们行为的结果。

深入到玩法,“面向对象的塔防”中的每个阶段都包含两种游戏模式:代码模式和游戏模式。

游戏模式说明

在代码模式下,学生能够利用自定义的面向对象的块编程接口来编写塔防游戏的炮塔。这是一个无风险、无成本的环境,使学生能够可视化代码的输出,并鼓励积极尝试面向对象编程。

代码模式

在游戏模式下,学生可以测试他们编码的炮塔。游戏模式是前文讨论的游戏元素所在的地方,由三个基本组成部分组成:地图、炮塔和敌人。每个组件细分如下:

  • 地图:地图是使用遗传算法和 A-star 算法生成的。它被设计为高度可定制的,因为可以调整各种参数来随机生成理想的地图。该地图与游戏化元素密切相关,这些元素促进了上一节中的面向对象编程学习。

  • 炮塔是使用模板方法模式开发的,是学生主动学习和实验面向对象编程的主要游戏组件。

  • 敌人:敌人利用有限状态机,是学生面临的主要障碍。它们有各种形状和大小,要求学生积极修改要处理的代码。

游戏模式

通过利用单例设计模式(Singleton Design Pattern),各种游戏模式和组件能够相互无缝通信。然后,这些游戏模式和组件能够协同工作,以简化抽象概念并帮助学生理解面向对象编程。它们的实施也为该项目的未来工作奠定了稳定的基础。

为了了解游戏的实际效果,面向对象的塔防团队撰写了一篇随附的论文,并利用该产品进行了实验。实验的学生参与者被分为对照组和实验组,并完成了一项测验评估和一份反馈问卷。在测验问卷之前,对照组被禁止接触该产品,而实验组被允许接触该产品。测验评估结果表明,实验组的表现明显优于对照组,实验组的中位分数高于两组的总和。进一步分析结果还发现,与对照组相比,实验组的平均分高出 20% 以上,并且标准差较低。这意味着实验组不仅取得了更好的结果,还能够获得更加一致的结果。

从问卷反馈中得知,参与者非常喜欢该产品,并且更喜欢游戏化的学习体验,而不是传统的课堂讲座。大多数参与者认为该产品激发了他们对面向对象编程的兴趣,或者提高了他们的学习水平。这表明该产品能够有效地吸引学生并提高他们的学习成果。



为更好的未来建设

科技有毁灭的力量,亦可以是通向美好未来的阶梯。原子弹发明后,可控核聚变被寄予“人类能源圣杯”的希望;ChatGPT 的诞生让人工智能能够与人类进行自然、流畅、有趣的对话,开启了新的交互方式和可能性。TinTinLand 相信人工智能不仅是一种工具,它可以是伙伴,一种创造力的源泉,一种改变世界的力量。

Web3 的理想是去中心化、开放、透明、安全的网络,赋予用户更多的控制权和所有权,也为人工智能提供了更多的数据和资源,而 AI 和区块链的结合将推动数据的安全共享和可信度,为去中心化应用提供智能化支持,实现更广泛的协作和创新。

无论你是开发者、设计师、教育者、艺术家、企业家,还是对人工智能感兴趣的普通用户,你都可以在 Web3 上找到你的位置和角色,让我们共同探索 AI 在 Web3、人类工作和生活中的无限潜力,建设更加智能、更加人性化的未来


往期精彩

Web3 社交平台如何脱颖而出?我们和 PoPP 聊了聊

解读 a16z 发布的 SNARK 工具 Lasso 和 Jolt

官宣!TinTinLand 成为 TOKEN2049 官方社区合作伙伴


关于我们

ABOUT US



TinTinLand 是赋能下一代开发者的技术社区,通过聚集、培育、输送开发者到各开放网络,共同定义并构建未来。


Discord: https://discord.gg/kmPnTDSFu8

Twitter: https://twitter.com/OurTinTinLand

Bilibili: https://space.bilibili.com/1152852334

Medium: https://medium.com/@tintin.land2021

YouTube: https://www.youtube.com/channel/UCfHiMcFt-4btbC75FsReQh

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存