喔家ArchiSelf

其他

解读LangChain

随着OpenAI在2020年发布了开创性的GPT-3,我们见证了LLM的普及度稳步攀升,如今还在逐渐升温发酵。这些强大的人工智能模型为自然语言处理应用带来了新的可能性,使开发人员能够创建更为复杂、类似于人类交互的聊天机器人、问答系统、摘要工具等产品。LangChain作为一个多功能框架应运而生,旨在帮助开发人员充分发挥LLMs在各种应用中的潜力。基于“链式”不同组件的核心概念,LangChain简化了与GPT-3/4,Bloom、Huggingface等LLM的工作过程,允许开发者无缝地构建基于LLM的高级应用程序。
2023年9月28日
其他

如何构建基于大模型的App

利用指定数据库中存储的信息。这个限制使我们能够提供LLM生成回答所依赖的来源,这对于可追溯性和建立信任至关重要。此外,它还帮助解决了生成不可靠信息的问题,并能够提供可以在企业环境中用于决策的答案。5
2023年9月24日
其他

Qcon2023: 大模型时代的技术人成长(简)

应用大模型的示例贯穿始终,包括让人眼前一亮的知识库联邦架构——三场演讲,内容都是相当的充实,导致我只能被迫压缩互动环节,每一场分享都留下了些许的遗憾。感谢各位老师的大力支持,
2023年9月4日
其他

论文学习笔记:增强学习应用于OS调度

这是唤醒抢占的粒度。增加此变量会减少唤醒抢占,减少计算绑定任务的干扰。降低它可以提高对延迟关键任务的唤醒延迟和吞吐量,特别是当短周期负载组件必须与CPU绑定组件竞争时。3.4
2023年6月29日
其他

LLM的工程实践思考

的数据生态系统机器学习与微分方程的浅析神经网络中常见的激活函数老码农眼中的大模型(LLM)《深入浅出Embedding》随笔机器学习系统架构的10个要素清单管理?面向机器学习中的数据集DuerOS
2023年6月24日
其他

操作系统性能提升之内核锁优化

性能为王,系统的性能提升是每一个工程师的追求。目前,性能优化主要集中在消除系统软件堆栈中的低效率上或绕过高开销的系统操作。例如,内核旁路通过在用户空间中移动多个操作来实现这个目标,还有就是为某些类别的应用程序重构底层操作系统.在许多领域中,专有化似乎是追求更好性能的答案,集中在应用程序和内核,甚至是在不同的内核子系统之间。特别地,专有化可以构建应用程序向系统请求某些功能的上下文。虽然,应用程序专有化和内核绕过了存储、网络化和加速器,但是,内核中的并发控制可能是整体性能的关键。1.
2023年6月11日
其他

关于操作系统调度器的三篇论文

(https://www.usenix.org/conference/nsdi19/presentation/ousterhout)Jack
2023年6月8日
其他

解读大模型的微调

在快速发展的人工智能领域中,有效地利用大型语言模型(LLM)变得越来越重要。然而,有许多不同的方式可以使用大型语言模型,这可能会让我们感到困惑。实际上,可以使用预训练的大型语言模型进行新任务的上下文学习并进行微调。那么,什么是上下文学习?又如何对大模型进行微调呢?1.
2023年6月7日
其他

浅析多模态机器学习

GPT-4的发布给ChatGPT带来了又一次飞跃,ChatGPT不仅支持文字输入,还能看得懂图片、甚至是漫画、梗图,以GPT-4为代表的多模态大模型非常强大。多模态大模型就是指模型可以处理多种结构/类型的数据,例如GPT-4,它既可以处理你输入的文本,也可以处理你上传的图片。那么,多模态到底意味着什么呢?1.
2023年5月28日
其他

系统学习大模型的20篇论文

的数据生态系统机器学习与微分方程的浅析神经网络中常见的激活函数老码农眼中的大模型(LLM)《深入浅出Embedding》随笔机器学习系统架构的10个要素清单管理?面向机器学习中的数据集DuerOS
2023年5月21日
其他

深度学习架构的对比分析

深度学习的概念源于人工神经网络的研究,含有多个隐藏层的多层感知器是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示,以表征数据的类别或特征。它能够发现数据的分布式特征表示。深度学习是机器学习的一种,而机器学习是实现人工智能的必经之路。那么,各种深度学习的系统架构之间有哪些差别呢?1.
2023年5月14日
其他

解读ChatGPT中的RLHF

的数据生态系统机器学习与微分方程的浅析神经网络中常见的激活函数老码农眼中的大模型(LLM)《深入浅出Embedding》随笔机器学习系统架构的10个要素清单管理?面向机器学习中的数据集DuerOS
2023年5月7日
其他

解读Toolformer

的数据生态系统机器学习与微分方程的浅析神经网络中常见的激活函数老码农眼中的大模型(LLM)《深入浅出Embedding》随笔机器学习系统架构的10个要素清单管理?面向机器学习中的数据集DuerOS
2023年5月3日
自由知乎 自由微博
其他

解读TaskMatrix.AI

ChatGPT在广泛的开放域任务上展现出令人瞩目的强大对话、上下文学习和代码生成能力,而且它所获得的常识知识还可以为特定领域的任务生成高级解决方案概要。不过,除了更强大的学习、理解和生成能力,ChatGPT还有哪些问题需要解决呢?微软最近发布了TaskMatrix.AI,可能是人工智能生态系统中的另一个方向,将基础模型与数百万个API连接起来以完成任务,是Toolformer和chatGPT的结合,可能也是LLM的另一个未来。1.
2023年4月28日
其他

老码农眼中的大模型(LLM)

及其变体),因此,术语大模型与“基于解码器的模型”可以互换使用。一个输入文本的“prompt”,实质上这些系统所做的就是在一个“词汇表”上计算一个概率分布,而词汇表是系统知道的所有单词
2023年4月24日
其他

《深入浅出Embedding》随笔

用Embedding提升ML性能对于传统的机器学习算法,例如XGBoost,采用相同的数据集和算法,但输入预处理的方式如果是Embedding处理,机器学习模型的性能会有较大提升。6.3
2023年4月23日
其他

异想天开!没有CPU的操作系统

MMU进行编程,允许其访问指定的虚拟地址的共享内存。网卡向系统总线发送另一条消息,以授予SSD对共享内存的访问权限。然后,网卡可以通过使用虚拟地址编程SSD中的VIRTIO队列来建立连接。IO
2023年3月29日
其他

一种编译器视角下的python性能优化

延迟实例化(函数实例化被延迟,直到所有函数参数都已知)。许多Python构造还需要编译时的表达式(类似于C++的压缩pr表达式),密码子支持该表达式。虽然这些方法在实践中并不少见(例如.,
2023年3月26日
其他

机器学习与微分方程的浅析

大家都已经使用机器学习了,尤其是基于神经网络的深度学习,chatGPT甚嚣尘上,还需要深入理解微分方程么?不论答案是啥,都会涉及到二者的对比,那么,机器学习与微分方程的区别又是什么呢?从爱情模型的微分方程说起这两个方程预测了夫妻恋爱关系的长久性,基于心理学家
2023年3月19日
其他

操作系统中的系统抽象

抽象通常被认为是计算思维的基本原则,抽象思维能力被认为是工程们最重要的能力之一。2021年图灵奖庆祝了由阿尔弗雷德·阿霍和杰夫·乌尔曼设计的编程语言和编译器抽象,展示了向更高级抽象的方向迈出了一步。那么,什么抽象呢?对操作系统而言,
2023年3月12日
其他

机器学习系统架构的10个要素

服务端来提供可跟踪性,并在模型停止工作时提供用于调试的有用信息。5.机器学习模型服务流水线为在生产环境中使用机器学习模型提供适当的基础设施,既考虑到全程服务,也要考虑延迟。一般来说,有三种服务模式:
2023年3月1日
其他

一文弄清混合云架构模式

当我们在说云架构的时候,通常指的并不是云平台的自身架构,而是基于云平台的软件系统基础架构。云平台的自身架构满足了很多通用层面的需求,例如对象存储,弹性主机,虚拟网络等等,只有云服务厂商的工程师才会涉及。对于一般企业中的工程师而言,
2023年2月26日
其他

软件架构的10个质量属性

一致性一致性保证每个读操作返回最近的写操作。这意味着在执行每个操作之后,所有节点的数据都是一致的,因此,,无论它们连接到哪个节点,所有客户端都可以同时看到相同的数据。一致性提高了数据的新鲜程度。5
2023年2月23日
其他

端边云协同:从云到边缘

SDX是Software
2023年2月19日
其他

不了解持续架构会落伍么?

信息技术是一个日新月异的领域,从自身的发展到学科的教程,再到应用场景的无处不在,导致每天甚至每时每刻都可能会有新的技术或者新的方法涌现出来。“吾生也有涯,而知也无涯”,那么,对于一个工程师而言,不了解并学习持续架构会落伍么?不学习就会落伍在前不久QCon2022(
2023年2月12日
其他

QCon: 工程师成长的金字塔思维

最后对其演变进行简单阐述。引子来自吴军老师对工程师的层次划分,同样是一个金字塔结构。或许,如果用各大厂的职级划分作为例子可能更容易被大家接受和理解,例如在百度,T5/6/7/8/9/10
2023年2月6日
其他

《 持续架构实践 》译者序

当我们接触到《持续架构实践》这本书的时候,因为它的名字,心里面是带着一丝好奇的。系统架构涉及到方方面面的知识,庞大而复杂,每一个知识点钻研下去都可以出许多的著作。对技术人员来说,精力和时间有限,很难精通架构的每个细节,而某些细节的疏漏,恰恰决定了系统最终的成败。
2023年2月4日
其他

走近软件生态系统

中软件生态系统的大小可以由其节点数和连边数衡量,可以用5个特征来表征生态系统的结构,即平均度、簇系数、节点度中心系数、节点距离中心系数和节点介数中心系数。软件生态系统的活跃度可以通过Pull
2023年1月15日
其他

温故知新:从计算机体系结构看操作系统

在编译层,需要新的法有效地在功耗效率与性能之间做出权衡,同时兼顾二进制代码的可靠性。也就是说,降低能耗可能需要从三个途径加以解决:跨层次的能效优化,对“并行”的重构和有效利用“专用计算”。3.3
2023年1月2日
其他

关于隐喻的学习与思考

(事物的时、空特征和关系)映射到其他认知域,以构建该认知域的心理意象。例如,迁移学习本身就包含了隐喻。在软件界面设计中,隐喻的产生与设计者对生活的观察和感知息息相关,也凝聚了设计者过去的知识经验
2023年1月1日
其他

图计算的学习与思考

好的软件不是靠程序分析、查错查出来的,而是由正确的人构建出来的。图成为日益重要的运算对象,图结构是对群体关系的一种抽象,可以描述丰富的对象和关系。图计算的核心是如何将数据建模为图结构以及如何将问题的解法转化为图结构上的计算问题,当问题涉及到关联分析时,图计算往往能够使得问题的解法很自然地表示为一系列对图结构操作和计算的过程。例如,使用基于网页链接的图结构的PageRank算法得到网页权重,作为搜索引擎排序的参考,利用图结构的用户行为数据来得到精确的群体偏好分析和个性化产品推荐结果。1.什么是图计算?图计算是研究人类世界的事物和事物之间的关系,对其进行描述、刻画、分析和计算的一门技术。这里的图是“graph”,而不是图“image”,源自于数学中的图论(graph
2022年12月18日
其他

X 随笔

文件夹、收件箱、画笔、工作簿、钥匙及时钟等。采用GUI后,用户可直接对屏幕上的对象进行操作,如拖动、删除、插入以至放大和旋转等。执行操作后,屏幕能立即给出反馈信息或结果,实现了所见即所得。2.
2022年12月11日
其他

从IPC到分布式软总线的随笔

Mesh组件化与服务化的辨析软件架构的10个常见模式关于软件开发,都应该知道的10个常识服务计算的思考神经网络中常见的激活函数算法与模型的浅析从隐私到隐私计算一文读懂“语言模型”一文读懂中间件
2022年12月4日
其他

Agent 与对象的辨析

如果说对象是70年代以来软件界最激动人心的革新之一,那么,Agent的相关理论和技术,为分布式开放系统的设计与实现提供了新的途径,可以称之为软件开发的又一重大突破。讨论问题的前提是概念的澄清,什么是对象?什么是Agent
2022年11月27日
其他

隐私计算与区块链的融合思考

隐私计算是使数据“可用不可见”的技术,实践中仍存在着一些问题,例如,多方安全计算受到网络带宽或者延迟的影响,联邦学习对参与方和服务器之间的通信稳定性和带宽要求较高,可信执行环境依靠的是硬件,硬件的升级改造成本较高而且存在侧信道攻击的问题。区块链是能够解决多方信任和协作的有利工具,可以记录从数据发布到使用的全过程,通过智能合约制定策略,实现权限控制、记录、回溯等功能,还能够实现点对点的高效传输网络。那么,区块链技术是否能够与隐私计算融合呢?1.
2022年11月20日
其他

隐私计算中可信执行环境的一知半解

隐私计算是使数据“可用不可见”的技术,它包括了密码学、人工智能、安全硬件等众多领域交叉的学科体系。对于隐私计算而言,业界通常分为三大路径技术:以安全多方计算为代表的密码学路径、以可信任执行环境为代表的硬件路径和以联邦学习为代表的人工智能路径。老码农在了解了《从隐私到隐私计算》之后,对《隐私计算之全同态加密》和《隐私计算中的联邦学习》学习之后,如果不再了解一下可信执行环境,总觉得有点怅然若失。尽管“纸上得来终觉浅”,但与“一无所知”相比,
2022年11月13日
其他

一文读懂 Data Mesh

Mesh是超越利用数据仓库和数据湖的数据管理方法,强调组织灵活性,通过授权数据生产者和数据消费者的访问来管理数据,数据所有权分配给特定于领域的团队,这些团队将数据作为产品提供、拥有和管理。4.1
2022年11月6日
其他

隐私计算之全同态加密

数学方式描述的(序理论和抽象代数子学科研究的一种抽象),被认为量子计算安全的,并被认为是后量子密码学。新的硬件加速器体系结构是一个活跃的研究和开发领域,和学术研究不断开发新的和更有效的实施方案,使得
2022年10月30日
其他

服务计算的思考

服务计算,也称为面向服务的计算,可以定义为寻求开发计算抽象、体系结构、技术和工具以广泛支持服务。服务导向将物理、硬件和软件资产转变为一种范式,在这种范式中,用户和资产建立按需交互、绑定资源和运营,提供一种抽象层,将重点从基础设施和运营转移到服务。但是,服务计算还没有充分发挥其潜力。技术进步为服务计算提供了越来越多的机会。为了避免过去的问题,这里首先评估了服务计算的当前状态,然后制定了一个利用新兴概念和技术来交付服务范式的全部潜力的策略。它确定了现实世界中服务计算中发展和潜在实现的主要障碍,并提出了研究方向,使服务计算领域能够重新定义自己,成为数字化进程中的强大引擎之一。1
2022年10月24日
其他

组件化与服务化的辨析

在几乎每一个软件设计的基础上都有一种感知、抽象和分解的方法论。这种理念采用特定的抽象和分解技术将导致更好的设计。在处理变更的场景中,主要有软件开发的组件方法和服务方法,本文分析了它们在处理变更方面的差异。1
2022年10月18日
其他

架构软件工程的未来(精要版)

——软件崩溃后的数据一致性软件系统的多维性能模型关于软件研发生产力的误区与思考远程软件工程师的10个最佳实践软件架构的10个常见模式关于软件开发,都应该知道的10个常识嵌入式开源软件的十大弊端
2022年10月16日
其他

架构软件工程的未来

软件对国家的全球竞争力、创新和国家安全至关重要。它还确保了我们的现代生活水平,并使国防、基础设施、医疗保健、商业、教育和娱乐不断进步。卡内基梅隆大学软件工程研究所领导社区创建了这样一个多年研发愿景和路线图,用于设计下一代软件系统。基于软件的性质,它在能力、复杂性和互连方面在持续无限制的增长。软件的发展似乎没有停滞不前。为了使未来的软件系统安全、可预测和可进化,软件工程界必须共同努力,从战略上推进软件工程的理论和实践,以实现下一代软件依赖系统。1.
2022年10月7日
其他

神经网络中常见的激活函数

深度学习中已经成为了人工智能领域的必备工具,源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。寻找隐藏层的权重参数和偏置的过程,就是常说的“学习”过程,其遵循的基本原则就是使得网络最终的输出误差最小化。在神经⽹络中,激活函数是必须选择的众多参数之⼀,从而使神经⽹络获得最优的结果和性能。经常用到的激活函数有哪些呢?如何进行选择呢?关于激活函数激活函数(Activation
2022年9月25日
其他

人机交互:从过去到现在

以及非常广义的安全概念。情境感知的重要用例包括语音识别,或者更准确地说是基于语音的接口,以及计算机视觉。例如,智能手机不仅是优秀的语音平台,而且能够使用计算机视觉,例如条形码识别和OCR。谈到
2022年9月18日
其他

隐私计算中的联邦学习

数据资产已经成为产品和服务设计的关键工具,但是集中采集用户数据会使个人隐私面临风险,进而使组织面临法律风险。从2016年开始,人们开始探索如何在用户隐私保护下使用数据的所有权和来源,这使得联邦学习和联邦分析成为关注的热点。随着研究范围的不断扩大,联邦学习已经开始应用到物联网等更广泛的领域。那么,什么是联邦学习呢?联邦学习是在中心服务器或服务提供商的协调下,多个实体协作解决机器学习问题的一种机器学习设置。每个客户端的原始数据存储在本地,不进行交换或者传输;
2022年9月12日
其他

从隐私到隐私计算

对于个人电子产品而言,例如手机,平板电脑,便携式电脑等等,或多或少,都会涉及到隐私计算,那么什么是隐私计算呢?理解隐私计算,先要澄清“隐私”的概念,那么,什么是隐私呢?进而,明确隐私计算分别与隐私和计算之间的关系,即隐私计算是为了实现个人隐私保护而进行的计算还是在实现了隐私保护的前提下进行的计算?最后,才是隐私计算涉及的技术和方法。1.
2022年9月4日
其他

算法与模型的浅析

讨论问题的前提是概念的澄清,概念的混淆是研发沟通中的一大障碍,极大地影响了沟通的效率。在人工智能尤其是机器学习领域,算法和模型是两个相关而又有区别的两个概念,弄清二者的含义和联系可以使我们讨论的问题更加明确。什么是算法?在计算机领域,算法有着明确的定义。为了通俗起见,这里引用百度百科对算法的描述:算法(Algorithm)是指解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。也就是说,对于算法而言,能够对一定规范的输入,在有限时间内获得所要求的输出。算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。不同的算法可能用不同的时间、空间或效率来完成同样的任务,一个算法的优劣可以用空间复杂度与时间复杂度来衡量。什么是模型?模型是一个概念外延非常广泛的词,这里同样引用百度百科中的描述:通过主观意识借助实体或者虚拟表现,构成客观阐述形态结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟、不限于平面与立体)。模型可以是模型玩具,科学模型,经济学模型,逻辑模型等等,例如,地球仪就是就是地球的模型,理性人经济人是经济学关于人行为的模型,计算机网络中的7层协议是网络协议的模型等等。其中,科学模型是科学研究中对一类研究方法的通称,使用数学公式、电脑模拟或简单的图示来表示一个简化的自然界,透过分析这个模型,以期能够进一步了解科学,包括说明、验证假说、或资料分析。依据不同需求,科学模型可以借由概念模型帮助了解现象,操作模型给出操作型定义,数学模型帮助量化,以及用图像模型将抽象概念可视化。需要重点关注的是数学模型。数学模型是关于部分现实世界以及为一种特殊目的而作的一个抽象的、简化的结构,用字母、数字及其它数学符号建立起来的等式或不等式,以及图表、图像、框图等描述客观事物的特征及其内在联系的数学结构表达式。简单来说,
2022年8月28日
其他

软件开发中的10个认知偏差

系统方法为避免成为认知偏差或其他错误的受害者,产研人员应该系统地探讨问题空间,并探索可用的解决办法和工具。这种不同任务参数的系统综述有助于避免偏见,例如先入为主、记忆偏差和固步自封
2022年8月21日
其他

浅谈元宇宙中的VR技术

在信息技术发展的过程中,传输带宽起着决定性的作用。从纯文本到多媒体,信息的展示方式日趋丰富。而5G的到来,为信息的三维化呈现及交互提供了更多可能,而全景内容恰恰是虚拟现实(VR))的技术能力,从而在元宇宙中占据了重要的地位。VR
2022年8月14日
其他

从操作系统看Docker

内核为Docker提供的OverlayFS驱动有两种:overlay和overlay2。而overlay2是相对于overlay的一种改进,在inode利用率方面比overlay更有效。Docker
2022年8月1日