首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
上海
2
习近平
3
新疆
4
鄂州父女瓜
5
乌鲁木齐
6
疫情
7
H工口小学生赛高
8
习明泽
9
芊川一笑图包
10
印尼排华
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
bxrf的瓜
童锦程爆阿哲抖音年度!哦嫂猫猫抖音复出开播!北王示爱囧囧丸!
陈泽心疼阿哲,回应大舞台节奏!哲修辰杭州聚会!宇文泡1600万叫价青蛙哥!
向哲学习!可楼扎心一修:哲哥比你年轻比你搞笑!芮甜甜官宣复播!
失信被执行人的孩子上学受影响吗?最高法明确:受限!
大数据开放实验室
筛选:
全部
仅被删
排序:
热门
实时
其他
内存数据库解析与主流产品对比(三)
Page写到磁盘上即可,但是内存数据库Checkpoint要把所有数据全部写到磁盘,数据量无论多大都要全量写一遍,所以内存数据库Checkpoint时写入磁盘的数据远大于基于磁盘的数据库。
大数据开放实验室 -
2020年10月16日
其他
内存数据库解析与主流产品对比(二)
Write机制实现TP和AP混合处理。假设当前系统正在对数据集做事务处理,此时如果出现AP请求,HyPer会通过操作系统的Fork功能对数据集做Snapshot,随后在快照上面做分析。Copy
大数据开放实验室 -
2020年10月14日
其他
内存数据库解析与主流产品对比(一)
Table中,而内存数据库就可以把锁信息和数据存放在一起呢?因为在基于磁盘的DBMS中,数据块是有可能被系统从内存缓冲区中替换到磁盘上,如果锁信息和数据放在一起,一旦数据块被替换出去,Lock
大数据开放实验室 -
2020年9月11日
其他
企业数据质量提升实践的几个关键点
在开始测量数据质量之前,企业必须明确哪些维度对自己重要,并精确的定义这些维度。对于包含多个二级指标的维度来说,哪些维度对哪些数据源要衡量和监控、哪些二级指标是重要的也是需要由企业自己决定并定义的。
大数据开放实验室 -
2020年8月24日
其他
十分钟漫谈容器网络方案01—Flannel
API)负责存储主机和容器子网的映射关系;多种网络转发功能的后端实现。本文主要介绍三种最常见的模式:UDP、VXLAN和Host-gateway(以下简称host-gw)。
大数据开放实验室 -
2020年8月18日
其他
DevOps与SRE在容器时代下的发展与变化
SRE的日常运维工作需要保证系统能够进行正常更新、快速迭代,并进行容量管理。同时,SRE也要对业务有深入了解,能够向公司提出资源分配和规划方案,并确保这些方案的提出有数据支撑,能够解决问题。
大数据开放实验室 -
2020年7月28日
其他
Docker和Kubernetes的前世今生(下)
Node突然宕机,Kubernetes会根据资源和节点工作情况把该Worker上原有Pod重新安排到健康的节点,保证系统正常提供服务。
大数据开放实验室 -
2020年7月10日
其他
Docker与Kubernetes的前世今生(上)
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2020年6月12日
其他
TCOS 2.0 发布 | 面向异构联邦的容器操作系统
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2020年5月26日
其他
TCOS -- 业界首个支持生产级大数据业务的容器操作系统
增加Flannel智能路由模式:在同一个二层网络下直接使用主机网络转发,减少不必要的overlay开销;而在需要跨二层网络的情况下使用vxlan进行overlay封包以打通网络,提升网络传输效率。
大数据开放实验室 -
2018年12月27日
其他
TDH 6.0新版本功能大解析(上)
ORC事务表是Inceptor支持事务操作的关键类型,由于其实现事务的机制,执行事务操作时会产生大量版本文件,需要自动或手动定期合并以提高后续的读写性能,这个行为叫做Compaction。
大数据开放实验室 -
2018年10月31日
其他
TDH 5.2.1与5.2.2版本功能说明
如果服务超过一定的时间没有返回心跳,Guardian将此服务状态设为Offline。当服务处于Offline状态超过一个时间阈值时,Guardian认为该服务已关闭安全,并将该服务从管理组件里删除。
大数据开放实验室 -
2018年8月31日
其他
大数据云的数据交换共享平台架构探索(下)
以上架构针对的是客户已经累积了数据并存放在物理集群的情况。特别地,如果是从无到有直接开始搭建云平台,相比之下就简单得多,此时可以直接使用平台层的数据平台作为数据中心。于是架构图简化为如下所示。
大数据开放实验室 -
2018年7月25日
自由知乎
自由微博
其他
大数据云的数据交换共享平台架构探索(上)
大数据和AI的应用与运维十分昂贵,无论是对于平台建设、团队建设还是业务探索而言都会带来不小的开销。将数据服务化、资产化、在线化,以方便客户、技术开发人员和数据科学家使用,降低技术门槛是当务之急。
大数据开放实验室 -
2018年7月19日
其他
TDC--带来新一代大数据产品形态
拥有丰富数据资源的企业可以利用TDC构建数据服务云,提供包括公共数据、报告、公共模型在内的服务,为合作伙伴提供数据探索和分析服务。企业合作伙伴可以以租户的方式租赁该企业的数据和资源服务,按需计费。
大数据开放实验室 -
2018年5月11日
其他
海量日志分析的集中式解决方案
由于Filebeat专注于“日志收集”一件事情,所以简单高效,同Logstash相比,Filebeat具有轻量、安全的特点,它只占用宿主机很少的资源,而且可以保证很好的性能以及较高的吞吐。
大数据开放实验室 -
2018年3月30日
其他
HBase常见运维工具整理
类似,但会收集和表相关的更细节的统计数据,包括:表的行数、所有行的列族数、所有行的qualifier数、每个列族出现的次数、每个qualifier出现的次数、每个qualifier的版本总数。
大数据开放实验室 -
2018年3月23日
其他
春季跳槽指南--优雅的跳进大数据和云计算圈
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2018年3月16日
其他
用Mirror,搞定用户画像
Hub平台,底层算法结合了星环独有的机器学习算法库和开源机器学习算法库,拥有强大的计算能力和高扩展性,致力于打造金融行业垂直应用平台,让机器学习技术真正在实际业务中发挥作用产生价值。
大数据开放实验室 -
2018年3月9日
其他
行业观察: 云+大数据+AI推动企业数据业务演进
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2018年3月2日
其他
Guardian实现集群互信与安全审计
Guardian通过Kerberos协议进行用户认证,集群开启Kerberos保护后只能对该集群所在域(Realm)的用户进行认证,而不能认证来自其他域的用户,因此其他域的用户便不能访问该域的服务。
大数据开放实验室 -
2018年2月9日
其他
数据挖掘平台Discover解锁Tensorflow
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2018年2月2日
其他
玩转大数据开发套件--下篇
Workflow作为工作流引擎,使工作流的触发与执行被自动化,大幅简化工作流调度设计与管理工作,图形化的设计方式让作业任务之间的逻辑关系更清晰,业务人员可以快速上手。Workflow在Studio
大数据开放实验室 -
2018年1月19日
其他
玩转大数据开发工具--上篇
Pilot充分利用Inceptor分布式引擎加速自助分析,借助列式存储以及OLAP模型对多维分析的加速能力,提供秒级报表生成和语句分析响应速度。帮助业务人员有效把握时间,适应市场的快速变化。
大数据开放实验室 -
2018年1月12日
其他
2017年大数据热点总结与发展趋势预测
综上,大数据技术受4V特征驱动,在多重技术的武装下前进,同时我们认为它的近期发展热点将围绕三个方面:全面支持SQL以推动在传统行业的落地;依靠云服务推动产品的部署与普及;支撑人工智能创造实用价值。
大数据开放实验室 -
2018年1月5日
其他
Slipstream 5.1 -- 实时计算引擎多方面升级
除了示例中的语法,Slipstream还支持如ONEORMORE、NEXT、NOTNEXT、NOTFOLLOWEDBY等其他多种语法功能,用于充分的表达并满足各种业务对复杂模式的需求。
大数据开放实验室 -
2017年12月22日
其他
Inceptor5.1- 批处理分析数据库的进阶
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年12月15日
其他
Transwarp Data Hub 5.1–大数据平台的新升级
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年12月7日
其他
社区版Inceptor常见问题整理
通过返回的报错信息和错误码,查询Transpedia(https://docs.transwarp.io/)的《Inceptor错误代码与信息查询手册》,了解相应的报错原因并获得解决方法。
大数据开放实验室 -
2017年12月1日
其他
社区版TDH常见运维问题总结
/var/lib/transwarp-manager/master/content/resources/services/inceptor1/inceptor-metastore.yaml
大数据开放实验室 -
2017年11月24日
其他
如何在TDH社区版中进行服务升级
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年11月17日
其他
TDH社区版常见安装问题
如果在支持范围内,查看TDH安装包的版本是否与当前OS版本匹配。比如,操作系统是CentOS6.5,安装包是centos-7-transwarp-5.0.0,则不匹配。需要重新下载对应的安装包。
大数据开放实验室 -
2017年11月10日
其他
社区版TDH官方正式发布
Manager为服务提供了滚动升级和快速升级两种方式。滚动升级能够保证服务在升级的过程中依然可用,但是升级速度相对较慢;如果希望以更快的速度升级,可以选择快速升级,但是该服务在升级过程中将不可用。
大数据开放实验室 -
2017年10月30日
其他
Waterdrop的许可证申请
客户商务负责人核实该用户是否合法,是否允许占用其公司商业版Waterdrop使用名额,如果合法则将该用户账号通过邮件发送至waterdrop@transwarp.io,邮件内需提供:
大数据开放实验室 -
2017年10月27日
其他
Discover实现客户流失预警分析
本文将以某机构的用户交易记录作为分析案例,构建流失预警模型的分析思路,探索用户流失原因,建立用户流失预警模型,并预测用户流失的概率,同时讲解如何用Discover提供的函数去实现上述流程。
大数据开放实验室 -
2017年10月20日
其他
Sophon+Slipstream实现流式KMeans聚类预测
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年10月13日
其他
如何用discoverR算法库实现关联推荐
主要的指标包括:支持度support,置信度confidence,提升度lift。对于一个二项规则“A→B”,支持度是指A与B同时出现的概率,即P(A,B);置信度是B关于A的条件概率,即P(B
大数据开放实验室 -
2017年9月30日
其他
Search SQL:用于全文检索的SQL扩展(二)
Search的用户Max收集了一组有关星环科技近期的新闻报道以及相关网页内容标题,现在需要根据一些不同的需求来分析这些内容。由于报道的内容主要为中文长文本数据,所以要通过全文检索来对其内容进行分析。
大数据开放实验室 -
2017年9月22日
其他
Search SQL:用于全文检索的SQL扩展(一)
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年9月15日
其他
Guardian 5.0全新架构解析:大数据安全防御之盾(二)
5.0全新架构解析:大数据安全防御之盾(一))着重介绍了Guardian架构的改变和ARBAC的引入后所带来的优化表现:如实现了统一的授权机制,提升了认证效率;以及引入了Administrative
大数据开放实验室 -
2017年9月8日
其他
Guardian 5.0全新架构解析:大数据安全防御之盾(一)
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年9月1日
其他
Rubik支持的OLAP Cube降维方法(二)
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年8月25日
其他
Rubik支持的OLAP Cube降维方法(一)
因此一个n维的Cube中,共有2^n个可能的维度组合,将对应产生2^n张物化表。当Cube维度变成n+m时,物化表的个数急剧增加到2^(n+m),呈指数级增长。当维度数量较多时,空间资源将趋于爆炸。
大数据开放实验室 -
2017年8月18日
其他
TDH中的高效SQL IDE--Waterdrop
SQL内容助理和提示:编辑SQL语句时,Waterdrop提供对关键字或元数据对象名称自动补全功能。例如,如果当前数据库中存在一张表orc_test_tb,在编辑面板中输入“orc”,按下
大数据开放实验室 -
2017年8月11日
其他
Transwarp Pilot: 让BI分析全面自助化
HDFS浏览器提供了Web界面直观地展示HDFS文件系统的目录及访问权限。用户可以在界面上直接操作HDFS,包括:新建目录、移动或复制目录|文件、更改目录|文件权限、从本地上传文件到HDFS等。
大数据开放实验室 -
2017年8月4日
其他
近实时的ETL工具--Transwarp Transporter
例如,上图所设计的流程可以翻译为,当前有三个数据源:一个JSON文件,Inceptor里数据库中的一张表,一个cvs文件,取三者的并集,再进行过滤,最终将结果保存在Inceptor的某张ORC表中。
大数据开放实验室 -
2017年7月28日
其他
MBO: SQL优化之基于物化视图的优化
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年7月21日
其他
用Slipstream构建复杂事件处理应用
大数据开放实验室由星环信息科技(上海)有限公司运营,专门致力于大数据技术的研究和传播。若转载请在文章开头明显注明“文章来源于微信订阅号——大数据开放实验室”,并保留作者和账号介绍。
大数据开放实验室 -
2017年7月14日
其他
混合负载下的资源调度神器--Inceptor Scheduler
Guardian上还提供配置单个队列、单个连接和单个用户可以向Inceptor提交的最大SQL数,可以在“默认配置”和“用户设置”两栏中配置。在“用户设置”栏中点击“添加配额”添加用户计算配额。
大数据开放实验室 -
2017年7月7日
其他
你应该知道的工作流调度平台——Transwarp Workflow
若当前系统每天都会因交易的产生,新增大量数据,为了做到分析同步,要以天为周期执行上述流程。为了简化任务调度工作减少工作量,需要一种高效的工具,将各个作业关联组织起来,并自动运行这些离线批处理任务。
大数据开放实验室 -
2017年6月30日
{{{deleted_alert}}}
{{classification}}
{{{title}}}
{{{preview}}}
{{nickname}}
{{ct}}
更多