别裁员!别裁员!别裁员! 一招降低IT数据库成本

德哥 PostgreSQL中文社区 2020-02-27

背景

2020疫情无情，诸多企业因此受挫，特别中小企业，甚至到了要裁员的地步, 但是人才是最宝贵的，裁员一定是下下策，如何渡过这个难关，疫情带给我们什么反思?

开源节流有新方法，通常数据库在企业IT支出中的占比将近一半，降低数据库成本对降低企业IT成本效果明显，但是一般企业没有专业DBA，很难在这方面下手，不过没关系，有了云厂商，一切变得简单。借助阿里云我们找到了可以为企业IT节省至少一倍成本的方法.

到底时什么方法呢? 回顾一下年前做的一系列MySQL+PG联合解决方案的课程.

《阿里云 RDS PostgreSQL+MySQL 联合解决方案课程 - 汇总视频、课件》

在众多数据库中, PG是一个企业级的开源数据库, 各方面的功能与Oracle对齐, 适合范围广, 能处理的数据量庞大. 采用PG的大型企业例如平安，邮储银行，阿里，华为，中兴，人保, 招商, 富士康, 苹果, SAP, saleforce等以及全球财富1000强等众多企业。《外界对PostgreSQL 的评价》

阿里云RDS PG的优势:

· 支持完整生命周期管理,包括高可用, 容灾, 备份, 安全, 审计, 加密, cloud dba等模块, 大幅降低企业的使用和管理成本.

· 专业内核和DBA团队 7*24小时服务.

· 支持并行计算，LLVM，GPU加速，向量计算，分析能力更强。

· PG的优化器强大，应对复杂SQL处理效率更高，适合复杂业务场景, 更适合新零售、制造业、工业、在线教育、游戏、金融、政府、企业ERP等行业或领域。

· 内核扩展, 根据垂直领域的需求定制化。

o Ganos插件, GIS功能更强更专业，支持平面、球面几何，栅格，时空轨迹，点云，拓扑网络模型。

o pase插件, 支持高维向量搜索, 支持精确的图像搜索, 人脸识别, 相似查询.

o roaringbitmap插件, 支持实时大数据用户画像, 精准营销.

o rdkit插件, 支持化学分析, 分子式的相似搜索, 化学机器学习等.

· 多模能力更强，其表现在索引更丰富，除了btree,hash还支持gin,gist,spgist,brin,bloom,rum等索引接口，适合模糊搜索，全文检索，多维任意搜索，时空搜索，高维向量（广泛应用于图像识别、相似特征扩选，时序搜索，用户画像，化学分析，DNA检索等。

· 类型更加丰富，同时支持扩展类型，除了基本类型以外，支持网络、全文检索、数组、xml、JSON、范围、域、树、多维、分子、GIS等类型。支持更丰富的应用场景。

· 支持oss_fdw, 可以将数据库的归档数据存储在oss中, 降低成本, 并且访问方法不变.

本文将对PG和MySQL进行多方位对比, 在某些方面PG的综合性能比MySQL高出一个数量级, PG+MySQL结合使用, 可以大幅降低企业成本.

疫情无情PG有情, 别裁员了, 建立多元化的技术栈, 强化企业IT能力更重要.

环境

阿里云RDS PG 12实例, 8核32G 1500G ESSD

同硬件配置的MySQL 8.0

用户密码:

user123

xxxxxxxx!

库:

db1

连接串:

PG:

export PGPASSWORD=xxxxxxxx! psql -h pgm-bp1z26gbo3gx893a129310.pg.rds.aliyuncs.com -p 1433 -U user123 db1 MySQL:mysql -h rm-bp1wv992ym962k85888370.mysql.rds.aliyuncs.com -P 3306 -u user123 --password=xxxxxx! -D db1

测试用的客户端ecs centos 7.x x64安装mysql, pg客户端

yum install -y mysql-* yum install https://download.postgresql.org/pub/repos/yum/reporpms/EL-7-x86_64/pgdg-redhat-repo-latest.noarch.rpm yum install -y postgresql12

MySQL 8.0测试

测试表

CREATE TABLE employees ( id INT NOT NULL, fname VARCHAR(30), lname VARCHAR(30), birth TIMESTAMP, hired DATE NOT NULL DEFAULT '1970-01-01', separated DATE NOT NULL DEFAULT '9999-12-31', job_code INT NOT NULL, store_id INT NOT NULL);

批量写入存储过程

DROP PROCEDURE IF EXISTS BatchInsert;

delimiter // -- 把界定符改成双斜杠

CREATE PROCEDURE BatchInsert(IN init INT, IN loop_time INT)  -- 第一个参数为初始ID号（可自定义），第二个位生成MySQL记录个数

BEGIN DECLARE Var INT; DECLARE ID INT; SET Var = 0; SET ID = init; WHILE Var < loop_time DO insert into employees (id, fname, lname, birth, hired, separated, job_code, store_id) values (ID, CONCAT('chen', ID), CONCAT('haixiang', ID), Now(), Now(), Now(), 1, ID); SET ID = ID + 1; SET Var = Var + 1; END WHILE; END; // delimiter ; -- 界定符改回分号

批量写入20万条

-- 开启事务插入,否则会很慢

begin;

CALL BatchInsert(1, 200000);

commit;

Query OK, 1 row affected (7.53 sec)

使用insert into继续批量写入