查看原文
其他

大王叫我来巡山,2017德国柏林 KubeCon 热点抢先看

才云 才云Caicloud 2020-02-24


3月29-30日的德国柏林 KubeCon 即将到来,才云(Caicloud)首席大数据科学家郑泽宇受邀 The Linux Foundation 主办的 CloudNativeCon + KubeCon 大会,将于2017年3月30日与才云高级云开源工程师赵慧智在柏林 KubeCon 进行《通过 Kubernetes 搭建可支持 GPU 的 TensorFlow 集群》演讲。



才云在今年2月发布了全球首个 TensorFlow as a Service (TaaS) v1.0 深度学习平台,目前版本更新至 TaaS v1.1,可支持 CPU 和 GPU 的分布式 TensorFlow 模型训练平台和 TensorFlow 模型托管平台。

Caicloud TaaS 的架构设计和研发成功,利用 AI 利器激活企业级云市场,也将重新定义容器云领域服务的技术版图和生态想象空间。

无独有偶,此次 KubeCon 将 AI 融入云上的视角也将出现在 Elon Musk 创立的非营利创业公司 OpenAI 的演讲中。这家据称有10亿美金注资背景的公司,一直以将人工智能红利带给人类社会为使命,也就是李飞飞口中的“AI 民主化”。而才云本次在 AI 领域的技术创新,相信一定可以与 OpenAI 产生非常有趣的交互。



除此之外,此次柏林 KubeCon 值得关注的议题还有哪些呢?


Operators

Kubernetes 原生支持无状态应用,但有些应用本身集群化,比如数据库、存储应用,很难跑在 K8S 上,K8S 对其之上的应用会有一些管理功能,比如重启、修复。但对这些有状态的复杂应用,它们自己会有一套管理机制,所以 K8S 再进行管理可能会导致冲突。Operators 概念由 CoreOS 提出,但使用的机制都是标准 K8S 机制,可以认为是延续 K8S 的 design pattern。Operators 的存在是对前述冲突进行协调,把这些有状态应用自身的一些协议和管理机制融入到 K8S 的层面。


Prometheus

要实现分布式微服务和实现容器编排架构,如何监控和调试各个部件始终是大家的关注焦点。Kubernetes 生态中,Prometheus 作为监控系统指标和异常报警已经是业界常用方案。3月29日,由 Frederic Branczyk, Brian Brazil 和 Fabian Reinartz 等人带来对于 Prometheus 组件 Alertmanager 在高可用方面的延展和对服务请求、错误率等方面追踪需求等都是此次 KubeCon 讨论的议题。



Open Tracing

分布式微服务的监控和调试以及如何在第一时间监控到系统的问题和瓶颈,从 Twitter 的 Zipkin 到目前广泛使用的 Open Tracing。Open Tracing 如何与 Kubernetes 容器编排实现分布式计算架构上相整合,可以关注 Priyanka Sharma 和 Ted Young 带来的关于 Open Tracing 项目的讨论。




Fluentd

如何去做 Kubernetes 容器集群中高可用的可扩展的日志系统,ElasticSearch、Fluentd、Kibana (EFK)常被组合用来收集、处理、分析和展示 Kubernetes 集群中的容器日志。可以关注 Eduardo Silva 带来 Fluentd 近况和生态 (和 ElasticSearchStack) 如何实现 Kubernetes 的集群 Logging。


gRPC 和 linkerd

大规模微服务应用程序的运行场景中不同服务之间的通信流程,此次有来自 Google 的 gRPC(Google 产品经理 Varun Talwar),基于 Twitter 核心库 Finagle 衍生的开源版本 linkerd 的解决方案 (Buoyant CTO, 前 Twitter 底层 staff 工程师 Oliver Gould)。



才云此次梅开二度登陆 KubeCon,关于柏林 KubeCon 更多详情,敬请关注 Caicloud 公众号,才云将第一时间从柏林发回报道~~


了解往期 KubeCon 内容,敬请参考以下链接:

"台风"席卷西雅图:KubeCon 才云宣布开源 CI/CD 平台 Cyclone

视频|才云 CEO 张鑫在西雅图 KubeCon 上精彩演讲

才云四人行,带你去看西雅图 KubeCon


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存