查看原文
其他

惊喜与局限并存,12c Sharding内测报告抢先看!

2017-03-06 唐小丹、周凯 DBAplus社群


来源:三墩IT人 订阅号

作者:唐小丹(浙江移动数据库管理员)

         周   凯(新炬网络数据库工程师)


2017年3月,我们终于迎来了Oracle 12cR2,作为国内首批Beta测试用户,我们在2016年1月应邀进行Oracle 12c Sharding 技术测试,并于去年10月完成了12cR2 Sharding 预研报告。由于受Oracle新技术发布限制,直至今日才发布与各位分享。


一、Oracle 12c Sharding简介


在Oracle 12cR2之前的版本中, Oracle分区表的所有分区都是在一套数据库中,而Sharding技术,则是使用新的分片技术可以将不同的分区部署到不同的数据库(后面称之为分片节点),而这些数据库都是相互独立且没有地理位置的限制。Oracle宣称这种分片架构具有以下特性:


  • 支持数据水平分片,支持数据海量扩展

  • 支持按地理分布、内网部署、公有云或混合云部署方案

  • 支持全面故障隔离

  • 每个分片节点具有独立的硬件资源(CPU、内存、硬盘等)

  • 支持弹性扩展和自动重分布(Auto Rebalancing)

  • 自动部署(Auto deployment)


二、Oracle 12c Sharding体系结构



Oracle sharding技术下的sdb架构(shared database architecture),包括:shard Directors(分片路由器GSM)、shard catalog(分片目录库)、shardgroup(分片组)。


1. shard catalog目录库主要作用

  • 存储sdb的元数据

  • 协调数据库

  • 分片表的元数据定义和复制表存储


2. Shard director分片导向器主要作用

  • 提供从应用层到分片连接请求的路由导向

  • 跨数据库服务故障切换和管理

  • 连接时负载均衡


3. Oracle Routing(两种模式)

  • session-based Routing

所有的事务都只连接到一个单一的shard进行操作。

  • Cross-shard 模式

适用于报表类的查询

事务需要跨多个shard执行操作


4. Sdb模式下oracle的连接请求方式分为两种

  • ucp:带shard key的连接请求,sdb数据库是依据shard key来划分shard的,当我们使用shard key进行操作的时候,连接池会将该链接请求发送到正确的shard库中并建立链接。

  • 如果没有sharding key,sdb会将连接请求交给catalog库,它会将目标sql解析并路由请求到正确的shard库。


三、Oracle 12c Sharding测试环境搭建部署步骤


环境准备:测试环境使用三台虚拟机进行测试,分别为:shard0(GSM和shardcate),shard1(sh1),shard2(sh2)。


软件要求:12.2.0.0.3及以上版本。


1. GSM软件部署


第一步修改环境变量如下:


[oracle@shard0   ~]$ env |grep ORA

ORACLE_BASE=/u01/app/oracle

ORACLE_HOME=/u01/app/oracle/product/12.2.0/gsmhome_1


第二步解压缩GSM.zip包并且执行runInstaller脚本(这里使用了图形化界面)



直接点下一步(检查操作系统是否符合安装条件):



点next下一步:



点击install,这样GSM包就安装完成了。


后续的数据库软件安装就不展开介绍了,选择NO-CDB选项即可。其他均与之前版本没有任何区别。


2. shardcate库上用户及相关权限操作


ssh   shard0

su   – oracle

sqlplus   / as sysdba

alter   user gsmcatuser account unlock; --解锁gsm用户

alter   user gsmcatuser identified by passwd_gsmcatuser; --修改gsm用户密码

create   user mygdsadmin identified by passwd_mygdsadmin; --创建管理用户mygdsadmin

grant   connect, create session to mygdsadmin;--赋权限给mygdsadmin

grant   gsmadmin_role to mygdsadmin;--把gsm管理员角色赋予mygdsadmin

grant   inherit privileges on user SYS to GSMADMIN_INTERNAL;


3. shardcate上配置remote scheduler


ssh   shard0

su   - oralce

sqlplus   / as sysdba

set   echo on

set   termout on

set   time on

spool   /u01/stage/labs/config_remote_scheduler.lst  --设置配置输出的日志

execute   dbms_xdb.sethttpport(8080);--指定scheduler所使用的端口号

Commit;

@?/rdbms/admin/prvtrsch.plb

exec   DBMS_SCHEDULER.SET_AGENT_REGISTRATION_PASS('welcome');  --设置远程shard节点注册到shardcate库所需的密码               

spool   off


4. 分片库信息注册


ssh   shard1

su   – oracle

schagent   –stop --停止shard库上的守护进程

schagent   –start --停止shard库上的守护进程

schagent   –status –查看shard库上的守护进程的状态

echo   welcome |schagent -registerdatabase shard0 8080 –注册到远程shardcate库分别是密码、主机名、端口号

cd   /data/oracle

mkdir   oradata –创建shard库的数据文件存放位置

mkdir   fast_recovery_area --创建shard库的快速恢复区的位置

ssh   shard2

su   – oracle

schagent   -stop

schagent   -start

schagent   -status

echo   welcome |schagent -registerdatabase shard0 8080

cd   /data/oracle

mkdir   oradata

mkdir   fast_recovery_area


5. 配置GSM


ssh   shard0

su   – oracle    --oracle用户

gdsctl    --进入gsm交互界面

create   shardcatalog -database shard0:1521:orcl -chunks 12 -user   mygdsadmin/passwd_mygdsadmin -sdb cust_sdb -region region1

--创建shardcatalog库 –database ip(主机名):监听端口号:实例名 –chunks chunk的数量

-user   用户/密码 –sdb sdb名   –region  主端,备端

add   gsm -gsm sharddirector1 -listener 1571 -pwd passwd_gsmcatuser -catalog   shard0:1521:orcl –region -trace_level 16

--添加gsm –gsm gsm名 –listener 监听端口号 –pwd gsmcatuser用户密码 –catalog catalog库基本信息 ip(主机名):监听端口号:实例名   –region 指定是哪个region –trace_level 指定trace的级别位置LOG_DESTINATION参数控制

start   gsm -gsm sharddirector1 –启动gsm

set   _event 17

modify   catalog -agent_password welcome –修改 catalog库守护进程密码为welcome

add   credential -credential oracle_cred -osaccount oracle -ospassword oracle --   specify the operating system user that the extproc agent impersonates when   running a subprogram stored in the library

ssh   shard0

su   – oracle

gdsctl   –进入gsm命令交互模式

set   gsm -gsm sharddirector1 –设置当前分片目录为sharddirector1

connect   mygdsadmin/passwd_mygdsadmin –建立连接

add   shardgroup -shardgroup shgrp1 -deploy_as primary -region region1 –添加主分片组

add   invitednode shard1

create   shard -shardgroup shgrp1  -destination  shard1 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

add   invitednode shard2

create   shard -shardgroup shgrp2  -destination shard2 -credential   oracle_cred –-不同的shard库添加到不同的分片组里

deploy   一键部署。


此时一套测试的sdb搭建成功,由于环境有限这里没有做容灾,Oracle提供了OGG和ADG两种方式对shard节点做容灾并且也支持一键部署。


四、Sharding适用场景限制


根据Oracle官方对sharding的应用场景介绍描述,Oracle分片技术主要适用以下场景:

  • 面向 OLTP 应用场景

  • 为了优化性能应用程序应该使用分片键

  • 业务场景中 80% 的事务都基于单个分片操作

  • 跨分片操作目前版本支持并不完善


对于已知的分片技术使用场景限制,结合浙江移动的业务特点,最后选择客户中心做为本次的测试模型,由于存储资源有限我们选择了数据量相对较小的湖州地市作为测试地市。


五、Sharding测试模型和测试结果


客户中心业务简介:


1. 客户中心储存的数据来源于原CRM系统中的三户信息和用户订购信息,承载的是客户管理业务;


2. 三户信息的核心是用户信息表,其中用户信息表的业务入口是bbb_id,在获取bbb_id和uuu_id的对应关系后,后续都是以uuu_id为主,查询到相应的uuu_id对应的ccc_id/aaa_id的信息,再根据ccc_id和aaa_id的值去查询对应的客户和帐户信息,而用户的订购信息都是根据uuu_id来查询的;


3. 对所有前台或用户发起的针对单用户的业务中,基本能保证这些业务都是在同一个分片内操作;


4. 用户信息会随着系统承载的用户量的增加有所增长,但这种增长的速度不是海量的扩展速度。


测试结果:所有的业务操作大致可以分为以下这三类:

  • 单分片查询

  • duplicate表查询

  • 跨分片查询


针对基于单分片的分片表查询,相比于传统的数据库查询速度提升不明显,因为uuu_id列本身加了索引查询速度已经够快了。但是当时数据库的压力提升以后,多个分片节点的sdb带来的优势预计会有一定的体现,因为所有的数据库操作被均匀地负载到多台物理主机上面,由于硬件限制我们没有做性能测试,对于duplicate表的查询本身设计就是从catalog库上通过物化视图到各个shard库里,所以对查询的速度提升没有实质的提升作用。


最后的跨分片查询我们在测试过程中发现Oracle不支持where条件用in或者or,我们大部分的应用都会用到这种条件的查询,所以跨分片的查询目前版本支持并不完善。


六、Sharding测试过程中的问题解决


1. 环境部署

  • 软件的版本需要12.2.0.0.3及以上的版本

  • 在配置GSM的时候报错信息不会很直观的展示出来,这对于安装部署有很大阻碍。


2. 数据导入

  • Duplicate表的数据导入是从catalog库导入,分片表的导入可以从各个shard库导入进去(由于环境有限暂时12.2.0.0.3从catalog库导入还未来得及测试)。

  • 12.2.0.0.3版本以前分片表直接从catalog库导入会报ora-600错误,而且这些错误也没有相应的psu修复。

  • 通过dblink用create table as select的方式创建会报不支持的操作类型的错误。


3. 业务测试

跨分片查询在 12.2.0.0.3版本支持并不完善,例如用in或者or 的查询Oracle会直接报错。我们已将改进建议提给Oracle,可能会在正式发布版本中得到解决。


所有的连接都经过catalog库,当连接请求并发上去后catalog将成为瓶颈,需创建多个catalog库分担压力。


同一schema下的各个分片表必须要有主外键关系。

 

精选专题(官网:dbaplus.cn)

◆  近期热文  ◆  

AWS S3误操作,官方故障回顾及专家深度思考

Oracle 12cR2发布,金融行业准备大规模上了

数千台MySQL数据库遭黑客比特币勒索,该怎么破?

细说自动化运维的前世今生

踩坑CBO,解决那些坑爹的SQL优化问题


◆  MVP专栏  ◆  

杨志洪杨建荣邹德裕韩锋欧阳辰

网易腾讯云百度朱祥磊卢钧轶


◆  近期活动  ◆  

北京数据库技术沙龙火热报名中

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存