企业存储技术

其他

3U 8卡:对AI推理服务器意味着什么?

Lane宽度。从表面上看,这款3U机箱只有5个系统风扇,但尺寸却是80cm(2U服务器一般是60cm风扇)。Nidec这个风扇标称的12V电流可达5.54A,不知配满8块600W
12月9日 上午 7:40
其他

Hot Chips 2024资料公开下载:聚焦AI芯片&散热

https://hc2024.hotchips.org/,演讲主题如我就不搬过来了,毕竟8月的会日程早就挂网上了。微软分享:Inside
12月7日 上午 8:30
其他

CXL分层内存测试:数据库、HPC和Spark机器学习

相同的数据点,仅有一处改变,即不同并行流运行的执行加速情况是以在本地DRAM上单流运行所获得的结果进行归一化的(不同的倍数计算参考点)。以这种形式呈现数据能让我们了解在扩展工作负载时的饱和点。从图
11月29日 上午 7:40
其他

SC24超算大会学习资料分享

Practice这个298页的ppt来自阿拉贡国家实验室,比较适合做存储的朋友。以下是部分章节/目录要点:文件系统代表Performance
11月24日 上午 8:30
其他

SNIA SDC 2024存储开发者会议资料分享

https://www.sniadeveloper.org/events/sdc-2024/agenda/tracks(内含视频链接,qiang外的)
11月21日 上午 7:40
其他

2024 OCP Global Summit会议资料分享 (完整&推荐)

光传输详细演讲议题如下。每个文档的标题我都看了一下,内容的质量和时效性应该都不错。Keynotes(Chronological
10月24日 上午 7:40
其他

OCP峰会Keynote:Intel和AMD都在谈UALink和Ultra Ethernet

Link(UALink),这2个AI互连技术我稍后再展开点讨论。Intel的演讲ppt到了一半,画风突然一变如下——我想前两天许多读者朋友也看到新闻了。Intel和AMD牵头组建x86
10月20日 上午 8:30
其他

AMD EPYC 9005 (Zen 5&5c) 服务器CPU架构解读

6这一代的策略有些不同点(如下图,仅供参考):1、为高端的69xx系列设计了一个尺寸更大的Socket,每颗CPU的内存控制器是12通道;6700及以下为8通道内存,PCIe/CXL
10月12日 上午 7:40
其他

ODCC开放数据中心2024资料分享 (规范标准、白皮书等36份)

https://pan.baidu.com/s/1ZDPjIS902SFmNy_JCOCWdw?pwd=6hvf
9月25日 上午 7:40
其他

ODCC NVMe SSD RAID 性能测试技术报告 (附批注)

下调优方法:首先查看当前支持的模式#cat/sys/devices/system/cpu/cpu0/cpufreq/scaling_available_governors设置Power
9月22日 上午 8:30
其他

向EDSFF迁移:IBM FPGA SSD的设计挑战

1T的密度较大,如今CPU的功耗又增加到350-500W,对风冷散热有挑战,有的品牌就推出过“中间开窗”或者“两侧开窗”的方案。扩展阅读《风冷双路350W:PowerEdge
9月19日 上午 7:40
其他

《企业存储技术》文章分类索引更新(微信公众号合集标签)

四年前,我整理过一篇“《企业存储技术》文章分类索引(微信公众号专辑)”,主要是用于把该链接放在每篇文章的结尾,希望给大家提供一个方便的索引。时至今日,我觉得应该做一次更新了。注1:每篇文章可以加多个“合集标签”,所以可能会看到同一文章在不同合集中出现多次。注2:我仅按照合集的历史文章数量来排序,所以有些当今的热门领域可能还排在靠后位置。另外,最精彩的合集,我故意列在最下面了:)服务器(89篇)机架式、Blade、Intel
9月18日 上午 7:40
其他

MCR/MRDIMM服务器内存:速度提升带来的功耗挑战

2023闪存峰会演讲资料(完整版)》中分享过,Intel的演讲人应该也在JEDEC组织的MRDIMM规范相关人群中吧。MRDIMM的原理,简单说就是在原有RDIMM基础上,将Data
8月4日 上午 8:30
自由知乎 自由微博
其他

服务器设计新趋势:Xeon 6 SoC、前I/O、模块化、1U&2U共用主板?

17G服务器才开始引入的。本质上来说,它上面的RJ-45管理网口、USB和VGA都是连接到主板上的BMC芯片,所以只是把这部分做成标准的模块子卡。BOSS-N1系统盘模块还是支持2个M.2
7月24日 上午 7:40
其他

都说是7B大模型,为什么人家只用CPU就能吐字飞快...

最近我试用了2款基于LLM大模型+RAG知识库的商业软件,按照发布的时间排序,也按照字母的缩写,分别称为F家和L家吧。这2款都支持部分离线使用,Windows下无需手动部署,并且无需GPU(当然有GPU可以跑更快)。稍微仔细点观摩下,底层都是基于Ollama,也可以理解为llama.cpp。关于PC端侧推理应用考虑的要点,我在《PrivateGPT+Qwen2:大模型&
7月16日 上午 7:40
其他

PrivateGPT+Qwen2:大模型& RAG Demo(附AIPC懒人包)

背景:在撰写本文的分享之前,我就已知有一些不完美和遗憾之处,这次希望能达到抛砖引玉的效果。欢迎大家提出自己的建议、可以在下面给我留言。最近一段时间,发现在我身边玩LLM大模型的同事和朋友越来越多。无论是用服务器、移动工作站,还是想在AI
7月4日 上午 7:40
其他

建筑大师七爷,生日快乐!

七爷是我的高中同学。话说当年一共八位兄弟结拜,我和另外几位爷不在其中,但这些年兄弟们聚会啥的,大家都是有时间就尽量参加。在学校时,七爷给我的几大印象是:人仗义、踢球好、表面言语不多然内心成熟智慧。七爷是我们班唯一参加校足球队的。我那时几乎每天都玩篮球,但水平比较菜。记得有一次体活课七爷偶尔过来一起打篮球,表现比我强多了。这运动天赋可见一斑:)七爷曾说过,因为他名字的读音,喜欢听同学们称呼他“普拉蒂尼”。但从踢球的方式上,七爷最喜欢巴蒂,因为他的位置也是前锋。上大学之后,七爷的建筑才华就开始崭露头角,听说在校期间就规划设计过2个幼儿园。记得七爷当年在msn共享空间“小虎看地球”上发去欧洲考察的照片,有一双审美的眼睛才能拍出那样的取景。七爷的事业如火如荼地发展着:从设计院到开发商/地产巨头,从图纸到规划、拿地,良乡、天津等地都留下了他的建筑艺术印记。特别是天津“中海·超塔”——七爷说过一句话:“不是每个建筑师,都能有机会设计300米以上的高楼”,我只在网上看过照片,听七爷说那栋楼里电梯就多达几十部。七爷设计过不少经典楼盘。我忘记具体是哪一个了,听说落成后第二年,全国建筑师都过来学习观摩。其实不止是七爷,我那几年的同学、兄弟们当中厉害的人不少。有时候聚会回来,就跟家里人眉飞色舞地讲起七爷、安大夫、刘院长、书记等诸位的光辉事迹…
6月25日 上午 7:40
其他

PL1=PL2=253W,14900K无限Turbo不变?

Turbo频率是全核运行时可以达到的?我只是实测再证明一下,在Intel规定的253W下跑不到那么高。如果只是跑单线程(单核),我看到手头这台3680工作站能跑到大约是Intel
6月16日 上午 8:30
其他

AI时代进击的CPU们

本文转载自一位技术专家的知乎文章,供大家参考,原文链接见文末。毫无疑问,GPU和AI加速器才是AI时代算力的最大提供者。训练AI模型需要GPU的超大算力,但一块GPU越来越存不下今天的模型,互联多块GPU成了刚需,各种高端的网卡,DPU也诞生了。推理AI模型也需要非常高的算力,同时对存储带宽的要求也越来越高。即便是端侧,这几年移动GPU和NPU的进步,AI的部署也大多从CPU侧迁移到更大算力,更高能效的模块中。一切都在向着异构
6月14日 上午 7:40
其他

Intel正式发布至强6:288个E核、128个P核交相辉映

4的升级版本,专为至强优化增强。IO模块包含PCIe、UPI、CXL等连接总线控制器,以及DSA、IAA、QAT、DLB等加速器引擎。它采用成熟的Intel
6月4日 下午 6:37
其他

PowerEdge R770前瞻:基于Xeon 6 E-Core的CSP云服务器

R770,是6个全高PCIe扩展槽位。在R770服务器前面板的两侧下方,可以看到2个OCP网卡位置;还有VGA、iDRAC管理网口(管理软件应该可选OpenBMC,详见下文);左上角除了USB
5月18日 上午 8:30
其他

AI加速数据中心技术发展 - 2024 OCP EMEA Regional Summit 会议资料

Summit演讲资料网盘分享https://pan.baidu.com/s/16-xJortO22crHVWd91KYbA?pwd=18qd提取码:18qd官网来源
5月7日 上午 7:40
其他

NVIDIA TensorRT Stable Diffusion创作加速指南

Diffusion中测试GPU性能时,通过比较常用且多样的商业应用场景,配合TensorRT扩展,进行加速创作,介绍StableDiffusion
5月3日 下午 3:04
其他

12G显存/Chat with RTX中文语言模型配置及使用体验

交互方式转变,赋予用户释放数据全部潜力的能力。当我们站在这个新时代的起点时,这种技术的意义深远,它不仅承诺提高我们对信息的理解和使用,还将激发我们在数字领域解决问题和抓住机遇方式上的创新。随着
4月20日 上午 8:30
其他

分布式存储性能调优 - sysbench内存带宽测试详解

10顺序读混合顺序读sysbench带宽为88.2GB/s,还不如直接本地顺序读的带宽89.8GB/s,是因为达到了UPI的利用率达到了89%,接近瓶颈导致。#!/bin/bash#
4月8日 上午 7:40
其他

NVIDIA Blackwell 架构技术文档

SpecificationsTable
4月4日 下午 12:11
其他

调整峰值性能70WT解读:4090 D、AI PC真会受限吗?

4090抢购,而工作站A6000相对乐观?》我本来还是不太想蹭这个热点,但这几天陆续有同事问我。查阅资料之后,发现近几天网上看到的新闻可能有误读,所以就把我理解的信息跟大家分享一下。首先是这份
4月3日 上午 9:36
其他

Chiplet Summit 资料分享:展望10年后的GPU和HBM

CCD应该都是台积电N5工艺;这里的4个IOD(含NOC和SRAM)是N6工艺,周围HBM内存一共8颗。右下角的芯片成本Breakdown显示,HBM占比达到53%。我们先记一下几个数字:MI300
3月3日 下午 4:35
其他

三位卖艺老人,不一样的管乐声

大概是由于年少时的经历,我对管弦乐器一直有点向往。这几年在我上班的途中,会经过一个地下过街通道,有时会遇到卖艺人。长笛老人最先吸引我注意的,是一位吹长笛的老人,他的声音可以达到治愈系的水平吧。上面是在2017年用手机录制的,现场效果还要更好一些长笛老人总是自带一个马扎和移动音响,坐在那里,每首曲子都会先播放起伴奏音乐,再认真地吹起来。他吹奏的内容多是世界名曲,手中金属银色的长笛也擦得比较干净。长笛老人的穿着有点知识分子的感觉,夏天看到短袖衫,冬天通常会戴一顶鸭舌帽。有时我会给老人“打赏”一点钱,而他的演奏似乎完全不会受到打扰,继续沉浸在自己的音乐中。长笛老人的吹奏声偶尔也会吸引人停下来驻足,跟他交谈几句。我曾见过一位女士,问老人能否教她的小孩吹长笛?老人回答说如果不是考级的话还可以。有一天我也忍不住要了老人的联系方式,这时我才得知他的眼睛不好,看不清乐谱等。他的长笛不会是年轻时就学会的吧?竹笛老人为了区别于前面的西洋乐器,我在这里把一位吹奏民乐笛子的称为“竹笛老人”。长笛老人多出现在我早晨上班时,而竹笛老人则都是在下班6点以后遇到。笛子本身的特点是声音清脆,节奏有时可以很快。竹笛老人并没有伴奏,他的声音可能并没有像长笛老人那样悠扬,但他的技艺也相当不错,在下班嘈杂的人流中有自己独特的穿透力。竹笛老人都是站着吹奏,他的穿着偏“中式传统”一些,夏天的短袖汗衫总是很整洁,我记得他戴着一副红色边框的眼镜。我也给竹笛老人“打赏”过,由于前些年还用现金,只要达到5-10元,他就会停下来叫住我,从包里拿出自己刻制的“弟子规”等光盘赠给我。竹笛老人除了在这里卖艺之外,还有着更多的追求——那就是传播中华传统文化。当面对这位诚恳的老人时,无论光盘是否对我有用,心里是温暖的。萨克斯老人萨克斯老人的出现似乎不那么规律,白天或者傍晚都有看到过他。相对于前面两位吹奏管乐的老人,他有点衣衫褴褛,或许是生活条件艰苦些吧。黄铜色的萨克斯管声音还好,但也许是陈年或者清洁地不够频繁,看上去有些地方发黑了。这位老人经常是倚着背后的墙,眯缝着眼睛吹,腿脚大概也有点不好。萨克斯老人吹的都是流行了几十年的通俗曲子,比如《莫斯科郊外的晚上》、渴望的主题歌“悠悠岁月…”
2月16日 下午 7:30
其他

《企业存储技术》2023创作历程 & 致谢

先聊段题外话:)昨天下午刚从一个客户处测试完了出来,我又接到一位同事的电话需要远程支持。如果按照原计划骑车回家需要20多分钟,只好就近找个地铁站下去(我没养成去咖啡馆的习惯,加上附近不算熟),打开电脑+微信视频通话。我坐在地铁站厅的椅子上,对面正好有位地铁工作人员——那位姑娘背对着透明的隔离防护栏站着,正好面对着我。大约半小时后,我收拾好拿出的移动硬盘等,一手挎着书包,另一手夹着大衣和测试机,站起来转身正准备乘一趟地铁离开时。背后的姑娘忽然叫住了我,她朝我走来并顺路拾起被我从椅子上掉落忘记的手机,那一刻我心里满是感激:)类似的好心人,今年我已经不止一次遇上了。记得在上初中的时候,有一次我放学了骑车去看牙,在一个宽阔马路的路口处等红灯时,有一辆小轿车靠近停了下来,车上走下两位西装革履的青年才俊。其中一位先生微笑着问我:“你是不是掉了钱?”
1月18日 上午 7:40
其他

DAOS在后傲腾时代的演变

的分享资料,供大家参考。另外,本次分享的录屏视频我已经上传至B站,需要的朋友可以复制下面链接,或者点击文末的
1月8日 上午 7:40
其他

我的不良作息习惯,看看您中了几条

可能是参加工作较早的缘故吧,这两年我时常想写两篇怀旧小文章。但一来没时间,二来发在公众号上还是希望大家看了能有点用。2023年末,简单写一篇关于健康的分享吧。过去一年,我的生活质量有些下降,去医院的次数增加。要命的病倒是没有,就是眼科、骨科、康复科、中医针灸科这些。总结下来主要两大类问题,视疲劳,以及关节损伤。眼睛的问题主要是由用眼过度,以及不够注意休息导致的。我已经开始有一点老花,但还没到需要配花镜的程度。5年前我还能上班时长期对着13寸笔记本屏幕,现在办公室早已长期外接显示器了。我还开始注意家里的照明,把个别老化闪烁的灯换成新的护眼灯,以前有些高色温的LED白光灯,用在看书使用电脑的房间,尽量更换成4000K或较低色温偏黄光一些的灯。对于显示屏,我的建议是眼睛不是特别好的人,尽量不要选择45%
2023年12月31日
其他

分布式存储系统性能调优-PG数量对性能的影响

注:本文内容引用自张洋老师的微博https://weibo.com/thinksoft,他是一位存储研发专家。在分布式存储系统中,一般会对数据进行分区,这些分区被称为PG或者其他类似的名称。一般来讲单个OSD(硬盘)上会承载100~200个PG,整个存储系统的PG数量至少要大于OSD的数量,即每个盘上至少要有一个PG。一旦出现故障,需要迁移数据,可以以PG为单位进行数据迁移,非常灵活。PG的大致含义如上,本文主要结合在实际性能调优工作中遇到的问题,谈谈PG数量对性能的影响。PG数量过少,主要有一个影响,影响IO流量的均衡性。例如:PG数量在OSD上分布不均衡,在线程间分布不均衡,或导致网络流量在线程间不均衡。然而分布式存储系统各个组件和流程间的流程均衡,对性能影响又非常明显。例如:某个CPU核承担了过多的PG,那么该CPU核心便会首先达到瓶颈,出现IO排队的情况,而其他CPU核还很空闲。所以过少的PG数量达不到充分利用软硬件资源的目的。反过来PG数量过多,对性能又会有一些什么影响呢?目前我在性能调优遇到过两大类问题。如下:1)
2023年12月14日
其他

Hot Chips 2023会议资料分享

(PDT)TitlePresenters7:45AM-8:45AMBreakfast/Registration8:45AM-9:00AMOpening
2023年12月9日
其他

开源分布式存储系统PureFlash介绍

S5存储系统是一款高性能,高密度,高带宽的全闪存存储设备,整个系统的IO路径完全由硬件实现,每节点提供800万iops的随机访问性能和640
2023年11月27日
其他

2023 OCP Global Summit会议资料分享

Summit演讲资料网盘分享https://pan.baidu.com/s/1cVRMLMtVKNG0Eqw6XXXQVA?pwd=qkvy提取码:qkvy官网来源
2023年11月6日
其他

SNIA SDC 2023存储开发者会议演讲资料

https://storagedeveloper.org/events/sdc-2023/agenda/tracks(每个演讲页面里还有油管视频链接)会议日程如下Keynote
2023年10月29日
其他

NVIDIA AI性能计算更正:为什么RTX 4090抢购,而工作站A6000相对乐观?

3A090.b范围。但区别就是L40属于数据中心产品,而A6000则不一定?毕竟许多塔式工作站都不放在机柜上使用。NVIDIA
2023年10月20日
其他

GPU禁令限制计算 & NVIDIA A800/H800/L40等替代分析

推理GPU系统设计与H100替代分析》,大家也知道H800与H100差的主要就是NVLink互连的数量和总带宽。显然到了今天,之前规划的内容有些已经价值不大了——因为其中的NVIDIA
2023年10月19日
其他

ODCC 2023开放数据中心会后资料(规范标准、白皮书等)

网站。我就下载并逐一修改好文件名,打包上传到网盘,希望能节省点大家的时间。链接:https://pan.baidu.com/s/1oNtemIa_paR3ybae6YTuGg?pwd=r6fz
2023年10月16日
其他

FMS 2023闪存峰会演讲资料(完整版)

https://pan.baidu.com/s/17bXs5Uhsob2L3OJMbQyPSA?pwd=7se4
2023年9月17日
其他

《冷板液冷工程标准化及技术优化》白皮书解读

GPU功耗:冷板和浸没式液冷哪个更有前途?》《冷板式液冷标准化:PowerEdge
2023年9月15日
其他

HPC存储趋势简析:文件系统 & Linux选择

本文参考的主要是2份资料:https://www.hpcwire.com/2022/11/08/hyperion-paints-a-positive-picture-of-the-hpc-market/https://blocksandfiles.com/wp-content/uploads/2023/08/Full-2023-HPC-SYSPROS-Survey-Results.pdf其实去年我也曾想简单写一点HPC文件系统/Lustre的东西,不过后来犹豫了就没有发。今天仍然只是想给大家一些参考而已,数字可能有不准确之处。注意上图是全球的数字,2022年On-Premises(这个不算公有云服务)HPC存储厂商的份额排名,依次是Dell、IBM、HPE/Cray、联想、DDN、希捷和NetApp。Dell
2023年9月1日
其他

Intel科学计算优化 & 基准测试实战手册

这两天看到一份不错的资料,分享给大家。推荐理由——参看如下目录内容趋势篇应用优化实战篇应用实践中的科学计算平台应用于CAE
2023年8月25日
其他

Linux磁盘乱序问题:RAID卡有另一种解决方案

Drives,这里又不一样了,H35x是按照RAID组创建的顺序来排,而H75x则是按照RAID组创建的逆序——下图是一个示例。这个图表大家一看就清楚,不用我重复赘述。PERC
2023年7月27日
其他

NVMe/TCP 性能对比、部署和自动化

100%写IOPS。MTU设置1500还是9000字节没明显影响。iSCSI性能还是最低;余下4者都能提升50%左右,NVMe/TCP的表现甚至比FC还要略好点。4KB
2023年7月22日
其他

SmartNICs/DPU Summit 2023会议资料分享(共28份ppt+pdf)

这个会议的资料,我在前一段时间就下载了,那时官网上还没有全都放出来,赶上最近忙,就没第一时间分享给大家。等现在全部下载后,我继续延续下图中的目录做了简单的分类整理,然后打包(按照我一直的习惯,原始文档不插广告)。总的来说是些偏Marketing的资料,但我也从中挑了几张还有点意思的片子,截图放在下文中。SmartNICs
2023年7月15日
其他

资料分享:MSST (大规模存储系统与技术) 国际会议

2023会议资料网盘分享https://pan.baidu.com/s/1f5yK5aj3oHNbm1jsKiA9Aw?pwd=d8cc提取码:d8cc官网来源
2023年6月11日
其他

6K显示器 & 新一代接口:DP 2.0、HDMI 2.1、雷电4应用解析

U3224KB:接口齐全、功能丰富的6K显示器近日Dell也发布了自己的第一款6K显示器U3224KB,如上图,在屏幕上方还集成了4K摄像头和音箱(长条形)。U3224KB的分辨率为6144
2023年5月21日
其他

OCP EMEA区域峰会技术资料分享(Prague, Czech)

EMEA区域峰会,4月19-20日,在东欧美丽的历史文化名城——捷克共和国首都布拉格举办。本想简单讨论一两个技术话题,无奈周末事情有点多,还是先把资料发出来吧。2023
2023年5月15日