查看原文
其他

从Chat-GPT了解技术概念及医疗领域应用

京东健康 陈刚 京东技术
2024-08-25



Tech


导读

作者来自互联网医疗服务团队,团队一直致力于在医疗行业中探索和应用前沿科技。目前主要在医学对话,远程医疗、医学影像诊断等方面进行探索和尝试,相信可以为医生和患者带来更好的医疗服务。




01前言


最近OpenAI在官网上宣告了多模态大模型GPT-4的诞生,它可能是迄今为止最好的多模态模型。主要更新内容如下:

1. 逻辑分析能力更加全面、「考试」能力大幅提升 ;

2. 拥有了识图能力,可以进行更多元的交流 ;

3. 回答更有条理,理解更加准确 ;

4. 创作力大幅提升,可以进行更全面的创作双击编辑块引用内容;

近日、风靡全球的ChatGPT刷新了很多人对人机交互的认知,具有极高的灵活性和适应性,可以很容易的应用到各种不同的产业,引起了行业的诸多变革。Chat GPT的出现正在迅速改变如今的互联网局势,“AIGC”“人工智能”“搜索引擎”等话题迅速成为当下热点。众多互联网企业加速布局AI产业,可以预见下一场技术爆炸即将到来。

本文大致分为两方面内容,第一部分是热门前沿科技概述,主要描述有什么应用场景。第二部分是医疗领域科技前沿,已发生的和可探索的医疗行业的应用场景。



02热门科技技术概念


1、ChatGPT
省流一句话理解:ChatGPT是一种聊天模型程序,能够对文本或语音输入做出类似人类的问答和对话能力,并可处理文本生成、智能客服、优化搜索、代码开发等。
ChatGPT是一种大型语言模型,强大的自然语言处理技术(NLP),由OpenAI开发和训练。它使用深度学习技术,在巨大的文本语料库中学习自然语言处理和语义理解,从而可以回答各种问题、生成文章、翻译语言等任务。

图1. ChatGPT能做的事

ChatGPT的训练数据包括了互联网上海量的文本,其中包括维基百科、新闻文章、小说、博客、论坛帖子等多种类型的文本。它的训练算法使用了Transformer模型架构,是目前最先进的自然语言处理技术之一,通过对大量文本数据的学习,预测出给定输入后面的单词或句子。与其他传统的基于规则或模板的对话系统不同,ChatGPT具有较高的灵活性和自适应能力,可以根据对话的具体情境和上下文产生恰当的回复。同时,ChatGPT还可以通过增加语料库规模来进一步提高模型的准确度和性能。此外,OpenAI已经构建了一个比ChatGPT更强大的系统即GPT-4,甚至可以生成图像和文字。

图2. ChatGPT使用界面

由于ChatGPT的强大能力,它已经被应用到了多个领域,包括智能客服、智能家居、机器翻译、情感分析、自动摘要、文本生成等等。
2、AIGC (AI-Generated Content)
省流一句话理解:生成式AI是利用AI技术生成内容,此处生成和内容都是更为广泛的概念,生成的对象包括常见的图像、文本、音频等显性内容,还包括策略、剧情、训练数据等内在逻辑内容。
AIGC (AI-Generated Content),也叫生成式的AI(Generative AI)是指基于生成式对抗网络 GAN 、大型预训练模型等人工智能技术,它可以自动地生成新的数据、文本、图像、音频和视频等内容。它是建立在深度学习、自然语言、神经网络处理等技术的基础上,通过学习现有数据的模式和规律,生成新的数据。生成式的AI可以模拟出各种各样的人类创造力和想象力,从而在许多领域发挥着越来越重要的作用。
生成式的AI在各个领域都有广泛的应用,例如:
1.文本生成:可以生成新闻文章、小说、诗歌、故事情节等文本内容。
比如:文心一言、ChatGPT。
2.图像生成:可以生成艺术画作、风景照片、人物头像等图像内容。
比如:Stable Diffusion(文中部分图片是生成的)、Midjourney、文心一言、ChatGPT。
3.音频生成:可以生成音乐、对话、声音效果等音频内容。
比如:Music LM、Make-An-Audio、Riffusion。
4.视频生成可以生成电影、动画、视频特效等视频内容。
比如:Gen-2、runwa、Tune-A-Video。
5.游戏生成:可以生成游戏场景、角色、剧情等游戏内容。
比如:Text to Skybox App、Midjourney。
6.虚拟现实生成:可以生成虚拟现实场景、交互对象、环境等虚拟现实内容。
比如:MetaHuman。
生成式的AI技术在创意设计、艺术创作、文学创作、音乐制作、游戏开发、广告营销等领域都有广泛的应用。它可以帮助人们提高生产效率,创造更多的创意和价值。
AIGC技术场景:

图3. AIGC应用场景-引用量子位智库产业报告

3、数字人(Digital Humans)
数字人(Digital Humans)是指一种基于计算机图形技术和人工智能技术,以人类面孔和身体为模板,模拟出一个逼真、交互性强的虚拟人物。数字人可以通过语音和视觉接口与人类进行自然对话和互动,可以应用于虚拟主持、虚拟演员、虚拟教师、虚拟客服等领域。
数字人的制作需要对真实人物进行高精度的3D扫描、建模和渲染,同时需要利用机器学习等人工智能技术来模拟真实人物的语音、面部表情、身体姿态等特征,并实现自然的语音合成和语音识别功能。数字人还可以利用自然语言处理技术,理解人类的语言,并进行自然的对话。
那么如何将照片转为数字人?
通常需要进行以下步骤:
收集数据:首先需要收集自己的数据,包括照片、视频、声音等,这些数据将成为数字人的基础。
人脸检测:利用计算机视觉技术对照片进行处理,检测出其中的人脸。可以使用已有的人脸检测算法,例如OpenCV、Dlib等。
人脸识别:对于检测出来的人脸,需要利用人脸识别技术对其进行识别和分析,从而获取人脸的各种特征和信息。可以使用已有的人脸识别算法,例如FaceNet、VGGFace等。
优化细节:优化数字人的各种细节,包括皮肤纹理、发型、服装等,让数字人更加真实、生动。
3D建模技术:数字人是一种三维模型,因此需要掌握3D建模技术。这包括了掌握3D建模软件的使用,如Blender、Maya、ZBrush等。
动画制作技术:数字人需要具有动态的动作和表情,因此需要掌握动画制作技术。这包括了掌握动画制作软件的使用,如Unity、Unreal Engine等。
材质和纹理制作技术:数字人需要具有逼真的材质和纹理,因此需要掌握材质和纹理制作技术。这包括了掌握材质和纹理制作软件的使用,如Substance Painter、Photoshop等。
下图为数字人副本,目前已结合MetaHuman+Unreal Engine实现。

图4. UE5+MetaHuman自己的数字副本

然后再放两张京东的言小希的美照:

图5. 言希数字人

4、VR、AR、MR
1.虚拟现实(VR)
虚拟现实是一种综合的计算机图形技术,利用众多的传感器设备,模拟出一种接近现实的、人工创造的环境和场景,使用户可以身临其境地进行交互和体验的技术。虚拟现实通常需要使用专门的头戴式显示器(Head-Mounted Display,简称HMD)等设备,通过人眼追踪和立体声音效等技术,让用户感受到身处于一个虚拟的环境中。虚拟现实的应用场景包括游戏娱乐、教育培训、医疗康复、建筑设计等领域。
图6 基于SD(Stable Diffusion)生成的VR眼镜
2.增强现实(AR)
增强现实是将数字信息叠加到现实世界中,通过摄像头或其他传感器捕捉到现实场景,然后通过计算机算法,将虚拟信息与现实场景进行融合,让用户在现实世界中看到数字信息的技术。AR技术可以通过手机、平板电脑等普及设备实现,可以应用于广告推广、电子商务、教育培训、旅游导航等领域。广义的AR概念则指任何一种虚拟世界和现实世界的混合模式,包含MR的概念在内。
3.扩展现实(MR)
扩展现实是介于虚拟现实和增强现实之间的一种技术,将虚拟信息和现实信息进行融合,可以让用户看到现实世界,同时在其中加入虚拟的信息和交互元素。扩展现实可以通过专门的头戴设备或普通的智能手机等设备实现,可以应用于游戏娱乐、工业制造、医疗保健、教育培训等领域。
总体来说,虚拟现实、增强现实和扩展现实都是利用数字技术和交互技术,将数字信息与现实世界进行融合的技术,但它们的实现方式和应用场景略有不同。

图7.VR眼镜和可穿戴设备

5、6G
6G是指第六代移动通信技术(Sixth Generation Mobile Communication),是5G的后继技术。6G的主要目标是在数据传输速率、延迟、可靠性和连接密度等方面进一步提高和优化,以支持更加复杂和普及的应用场景。
相比于5G,6G具有更高的数据传输速率和更低的延迟。预计6G的理论峰值传输速率将达到1Tbps(1万亿位每秒),延迟将降低到微秒级别,可以支持更加复杂和实时的应用,例如增强现实、虚拟现实、自动驾驶、远程医疗等。
此外,6G还将致力于实现更加普及的无线连接,使得大规模物联网设备、智能家居、城市交通、智能制造等场景的互联更加稳定和高效。同时,6G还将加强网络安全和隐私保护,以满足未来数字化社会的需求。
目前,6G仍处于研究和探索阶段,各国和企业都在积极投入资源和人力推进6G的研究和发展。预计6G技术将在2030年左右商用。

图8. 基于SD生成的6G概念图

6、量子计算技术(Quantum computing)
量子计算技术是一种基于量子力学原理的计算技术,通过利用量子位(Qubit)的叠加和纠缠等特性,可以在相对较短的时间内处理大规模的数据和解决一些传统计算机无法处理的问题。
传统的计算机是基于二进制位(bit)的,每个二进制位只能表示0或1,而量子位(Qubit)具有超位置(superposition)和纠缠(entanglement)的特性,一个量子位可以同时处于0和1的叠加状态,多个量子位之间也可以纠缠在一起,从而构建出更为复杂的状态。
利用这些特性,量子计算机可以在相对较短的时间内进行大规模的数据处理和运算,比传统计算机更为高效和快速。量子计算技术在一些特定的领域中已经得到了应用,如量子模拟、量子优化、量子化学等领域。国内以百度团队、图灵量子等机构为代表,量子计算已经在金融等实际场景中展开落地探索。

图9. 量子计算

量子计算未来的发展趋势主要在三个方面:一是规模化。当前量子计算比较可靠,操控的量子比特数大约在100个量子比特左右。今后将逐渐达到几千、几万、几十万、几百万,甚至更高的水平;二是容错化。量子计算需要很多量子比特,但更需要制备出相干时间可以任意长的所谓容错的逻辑量子比特;三是集成化。目前是实现对大量量子比特及其操控系统的集成和小型化,是降低量子计算机的研发成本,实现量子计算机广泛应用的前提。——引用之百度量子计算团队。

7、元宇宙(Metaverse)和Web3
随着2022年底,Meta进行了大规模的裁员,元宇宙显然进入了“降温”的阶段,依赖于研究、创新、投资和政策的生态系统,解决商业模式搭建和本土化落地等问题,或许等设备支持下的内容和场景实现完整落地之时,元宇宙还回再回来吧。
元宇宙和Web3都是新兴的概念,是目前互联网技术发展的趋势和方向。
元宇宙(Metaverse)是一个虚拟世界的概念,它是由人工智能、虚拟现实、增强现实、区块链等技术构成的数字世界,可以在其中进行虚拟的交互、体验和商业活动。元宇宙是一个可以进行无限扩展的虚拟世界,类似于《矩阵》电影中的虚拟世界,但比电影中的虚拟世界更加复杂、真实和广阔。元宇宙可以提供更加自由、多样和有趣的虚拟体验,也可以为人们提供新的商业模式和机会。
Web3是一种新的互联网架构,基于区块链技术构建,它的目标是实现一个去中心化的互联网,让用户掌握自己的数据和数字资产的所有权。Web3的设计思想是以用户为中心,实现数字世界的去中心化和自治,保障用户隐私和安全,同时提供更多的互动和参与机会。Web3的技术包括区块链、智能合约、去中心化存储、加密算法等,这些技术可以实现更加安全、透明、可信的数字世界。

图10. Web1.0到Web3.0的发展路径

总的来说,元宇宙和Web3都是新兴的互联网概念,代表了未来数字世界的发展方向和趋势。元宇宙可以提供更加丰富、多样和有趣的虚拟体验,Web3可以实现数字世界的去中心化和自治,保障用户隐私和安全,让用户更好地掌握自己的数字资产的所有权。这两个概念有很多相似的地方,也有各自独特的特点,它们的出现和发展都将对未来数字世界的发展产生深远的影响。



03医疗领域的科技前沿

1、远程诊疗(Remote Medical Consultation)

远程诊疗是指医生与患者之间通过远程通信技术进行医疗诊断、治疗、监控等活动的一种医疗服务方式。远程诊疗旨在通过数字技术打破时空限制,为患者提供更加便利、快捷的医疗服务,同时也为医生提供了更加高效、精准的医疗服务工具。

远程诊疗可以基于不同的通信技术和平台实现,包括电话、视频、互联网等。通常,患者可以在家中或者远程地点接受医生的诊疗服务,医生可以通过相应的远程诊疗平台,对患者的病情进行诊断、治疗和监控。

远程诊疗的优点在于:

便捷性:患者可以在家中或其他地点接受诊疗,无需前往医院等医疗机构。

时间效率:远程诊疗可以提高医生的工作效率,使医疗资源更好地分配和利用。

降低成本:远程诊疗可以降低医疗服务的成本,避免患者由于医疗服务的费用而拖延就医。

医疗质量:远程诊疗可以使医生更好地掌握患者的病情和病史,提高医疗服务的质量和效果。

但是远程诊疗也存在一些缺点和挑战,比如网络稳定性、数据隐私和信息安全等问题。因此,在进行远程诊疗时,需要特别注意数据保密和隐私保护。同时,医生也需要严格遵守远程诊疗的规定和操作规程,保证医疗服务的质量和安全。

图11. 远程诊疗概念

2、虚拟诊断(Virtual Diagnosis)

虚拟诊断是利用计算机技术和人工智能技术,模拟医生的诊断过程,对患者的病情进行诊断的一种新型医疗服务方式。虚拟诊断可以通过医疗数据的分析、算法的运算和医学知识库的支持,进行自动化的诊断分析和辅助决策。与传统的诊断方式相比,虚拟诊断可以提高诊断的准确性、速度和效率。

虚拟诊断通常需要获取患者的医学数据,如病历、影像等,通过医学图像分析、深度学习算法、自然语言处理等技术,对患者的病情进行自动化的分析和判断。同时,虚拟诊断也可以根据患者的病史、临床表现和检查结果等信息,提供相应的医学知识和参考意见,辅助医生进行诊断和治疗决策。

虚拟诊断的优点在于:

提高诊断准确性:虚拟诊断可以利用大量的医学数据和知识库,辅助医生进行诊断,从而提高诊断的准确性和精度。

提高诊断速度:虚拟诊断可以自动化地进行数据分析和算法运算,从而提高诊断的速度和效率。

降低诊断成本:虚拟诊断可以避免人工诊断的费用和时间成本,降低医疗服务的成本。

提高医疗服务质量:虚拟诊断可以提供更加精准、全面的医学信息和参考意见,从而提高医疗服务的质量和效果。

但是虚拟诊断也存在一些局限性,比如在诊断过程中缺乏人类医生的经验和判断力,缺乏直接的人际交流和沟通等问题。因此,在进行虚拟诊断时,仍然需要医生的参与和辅助,保证诊断的准确性和安全性。

目前医疗行业应用:

1、AI+超声设备辅助诊断肝病-Oncoustics;

2、视网膜AI辅助-鹰瞳Airdoc;

3、肺炎AI影像辅助诊断-北京安德医智科技有限公司、平安科技深圳有限公司等;

4、CT脑卒中AI辅助筛查、心血管AI辅助筛查、心脏斑块AI辅助筛查、骨折AI辅助筛查,肝脏AI辅助筛查,乳腺AI辅助筛查-推想医疗;

此外还有很多智能手段的方案和公司,基本是“诊疗一体化”,完成利用人工智能技术形成筛查、诊断、治疗的服务闭环。

图12. 虚拟诊断-图片来自网络
3、可穿戴设备
可穿戴设备是指可以佩戴在身体上并与智能设备通信的电子产品,如手表、手环、智能眼镜、健身追踪器、心率监测器等。这些设备通过传感器、无线通信等技术,可以实时采集用户的生理指标、位置信息等数据,并将其传输到智能手机或云端服务器进行分析和处理,以提供更加个性化的服务和功能。
可穿戴设备的功能非常多样化,例如:
健康监测:监测用户的心率、血压、步数、睡眠质量等生理指标,帮助用户实时掌握身体健康状况。
运动追踪:通过内置的加速度计、陀螺仪等传感器,记录用户的运动轨迹、距离、消耗的卡路里等数据,帮助用户进行科学健身。
通信娱乐:通过蓝牙或Wi-Fi等技术与智能手机进行无线通信,实现来电提醒、短信推送、音乐播放等功能,也可以实现虚拟现实、增强现实等娱乐体验。
商务办公:可以通过语音识别、手势识别等技术进行日程提醒、邮件查看、即时通讯等商务办公功能。
总的来说,可穿戴设备已经成为了智能硬件的一个重要分支,随着人们对健康和生活方式的关注越来越高,可穿戴设备的应用场景也将越来越多。

图13. 各类可穿戴设备-图片来自网络

4、3D打印仿生
3D打印仿生研究是指将3D打印技术应用于仿生学领域,通过模仿自然界的生物结构和机理,设计和制造出具有类似生物特征的人工材料、器件、机器等,以实现更加高效、智能、可持续的生产和工作。
3D打印技术可以利用多种材料,包括金属、塑料、陶瓷等,可以在复杂的几何形状和微观结构上精细加工和控制。仿生学研究可以将这些特点应用于设计和制造人工骨骼、人工关节、人工器官、仿生机器人等,以实现更加符合人体特征和机理的生物材料和设备。
例如,3D打印技术可以制造出定制化的人工假肢、义肢和其他外科手术器械,可以根据患者的具体需求进行设计和制造,大大提高了患者的生活质量和康复效果。
此外,3D打印仿生研究还可以应用于机器人制造领域。仿生机器人可以通过模仿自然界的生物结构和运动机理,实现更加高效和灵活的运动和操作,例如仿生鱼类可以在水中自由游动,仿生昆虫可以在复杂的环境中爬行和搜寻目标等。这些仿生机器人可以应用于智能制造、物流配送、救援救灾等领域,具有非常广泛的应用前景。
总的来说,3D打印仿生研究是一种创新的研究领域,将3D打印技术和仿生学领域相结合,可以带来许多具有重大社会价值的应用场景。
目前医疗行业应用
1、3D仿生眼睛 明尼苏达大学;
2、3D打印仿生皮肤;
2、3D打印仿生手 Open Bionics;
3、3D打印仿生膝盖撑 远铸智能;
4、3D打印仿生舌头 利兹大学的研究人员与爱丁堡大学合作;

图14.打印皮肤-图片来自网络

5、人类增强(Human Augmentation)
人类增强是一种将技术应用到人类身体、认知和行为方面,以增强人类能力和提高生产力、创造力的技术,暂时或者永久的克服缺陷。它可以通过各种技术手段来改变人类的身体结构和机能,包括基因编辑、植入电子芯片、机器人化辅助等,也可以通过虚拟和增强现实技术来扩展人类的感知和认知能力,以及通过智能化工具和算法来增强人类的决策和行为能力。
人类增强技术的应用场景非常广泛,可以应用于医疗、运动、安全、军事等领域,以及日常生活中的各种场景,如教育、娱乐、通信等。例如,医疗方面可以利用基因编辑技术来治疗一些遗传性疾病,使用智能化假肢和辅助设备来恢复受损的身体机能;军事方面可以利用增强现实技术来增强士兵的感知和战斗能力,使用智能化武器和装备来提高作战效率和安全性;日常生活方面可以利用虚拟和增强现实技术来扩展人类的感知和认知能力,使用智能化工具和算法来提高生产力和创造力。
人类增强技术的应用也存在一些争议和风险,如技术的安全性、伦理和法律问题等,需要综合考虑各种因素来评估和管理。因此,在推广和应用人类增强技术时,需要遵循一定的伦理和法律原则,确保技术的安全和合法性。

图15. 外骨骼机器人

6、脑机接口(Brain-Computer Interface,BCI)
脑机接口是一种将脑电信号转换为控制计算机或其他外部设备的信号的技术。它利用脑电信号采集设备获取人脑的神经信号,并通过算法和模型将这些信号解码为控制命令,从而实现人类和计算机之间的直接交互和通信。
脑机接口技术的应用场景非常广泛,可以应用于医疗、娱乐、交通、军事等领域。例如,在医疗领域,脑机接口技术可以用于帮助失去肢体功能的人控制假肢或轮椅,也可以用于治疗某些神经系统疾病。在娱乐领域,脑机接口技术可以用于控制虚拟现实游戏或应用,提高用户体验。在交通领域,脑机接口技术可以用于驾驶员的疲劳监测和安全控制。在军事领域,脑机接口技术可以用于增强士兵的感知和战斗能力。

图16. 基于SD生成脑机接口外置图

医疗应用:
一些疾病会导致某些神经遭到破坏彻底失能,从而阻碍了很多正常生活功能,比如神经受损导致的瘫痪,患者手臂或腿不能活动;阿兹海默症、癫痫等疾病,手部神经末梢无法控制,剧烈抖动而生活无法自理。这些情况,给患者及其家属带来了无尽的痛苦与折磨,脑机接口作为一种先进的神经通信形式,可以帮助患者恢复部分功能,比如脑控轮椅、 脑控机械手臂、脑控键盘等。
2017年,彼得·斯科特确诊渐冻症,不得不进行全喉头切除手术,再无法发出自己的声音。所以在手术前,他特地录制了15个小时的音频语料,并用AI进行训练学习,手术之后,通过脑机接口来采集脑电波,AI学习他的表述习惯,通过上下文感知来预测下一个词会输入什么,然后用合成语音讲出来,大大提高输出效率,减轻了患者的体力负担。2022年发表在《iScience》杂志上的一项新研究显示,几名四肢瘫痪的患者成功操作一种脑控轮椅,通过了一个充满障碍的房间。这是首次通过非侵入式BCI实现脑控轮椅的案例。
7、计算生物学(Computational Biology)
计算生物学是一门交叉学科,它将计算机科学的方法、技术和算法应用于生物学中,可以收集、整理和分析大量的生物数据,了解生命系统的内部规律和机制,主要研究生命系统中的基本过程以及其计算化和模式化方法,实现对生物学过程的理解和模拟。
计算生物学的研究包括以下方面:
1. 生物信息学:基于大数据的方法,研究生物分子的序列、结构、功能和演化;
2. 代谢组学:研究生物体的代谢网络、代谢产物、代谢通路等,以及其对生物系统的影响和调控;
3. 蛋白质组学:研究生物分子的结构、互作、功能、表达和调控等方面;
4. 基因组学:研究生物基因组的结构、功能、特性及其应用等方面;
5. 系统生物学:研究生物系统的整体属性和特征,利用大规模的数据和数学模型,探究生物体内各个方面之间的协同机制;

图17. 计算生物学-图片来自网络

无论是效率更高的AI制药、范围更广的疾病诊断、还是基因治疗、合成生物、脑机接口等调控治疗技术,乃至于最终的个性化诊治与保健,都离不开计算生物学提供的模拟计算与底层机制推演。----计算生物学深度产业报告 量子位智库。



04总结和展望

本文主要介绍了从分析式AI生成式AI转换下,通过数据学习,数据模型,硬件设备升级,通信技术加强,脑机接口和计算生物学研究等课题的发展下,衍生的新型技术概念和名次,对商业模式是颠覆还是工具进行探索。只是简单的让看到和理解相关概念,有些概念有互相涉及和不完善,请大家见谅,希望对大家了解前沿科技和应用场景有所帮助,如果有需要可以线上一起研究探讨。在我们的确进入了技爆发的历史性时期,众多的前沿科技不断的交叉,在不同的方面改变着我们的衣食住行,保持观察和学习能力,让我们一起提高眼界,打开认知,从预见未来到遇见未来大家一起加油吧。



推荐阅读Java程序员如何优雅编程
如何从0开始搭建组件库
XView 架构升级之路
敏捷研发—前端DevOps流水线实践
继续滑动看下一个
京东技术
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存