其他
数据科学与工程学院成果发布介绍
Gingko采用内存计算架构,充分利用高速访问内存的特性,同时在数据处理逻辑的多个层面上通过并行化提高响应速度:充分利用分区并行、流水线并行、操作内并行和独立并行,高并发执行任务;利用LLVM技术编译代码,提高操作运行效率;采用弹性流水线技术,可以根据负载和资源,动态伸缩并行度,充分利用资源提高运行效率;运行时任务调度模块能够感知系统负载,调度合适的任务,高效实现任务之间的独立并行。
Gingko在具备实时查询处理的同时,支持数据源新数据的实时注入。区别于数据流系统,不仅支持对数据的在线处理,而且可将这些数据持久化存储。实时注入基于事务处理控制方式,设计并实现以下一系列功能:针对实时数据注入对应的追加型事务,采用面向元数据的集中式事务处理策略,实现事务性数据注入;非阻塞分布式数据注入框架,将传统的集中式单机数据注入转变为分布式数据注入,充分利用分布式系统的特点,避免单机的单点故障和性能瓶颈;数据注入过程中实现了读写分离和写写分离,有效提高并行处理效率。