0.0 0人评分
字数:11.0万
点击:1.4万
分类: 互联网
标签:
PySpark实战指南:利用Python和Spark构建数据密集型应用并规模化部署

PySpark实战指南:利用Python和Spark构建数据密集型应用并...【美】托马兹·卓巴斯,【美】丹尼·李,栾云杰,陈瑶,刘旭斌  著

感谢你选择这本书开始PySpark之旅,希望你像我一样兴奋。当Denny Lee第一次告诉我这本新书的时候,我非常高兴。Apache Spark既支持Java、Scala、JVM 世界,又支持Python(以及近来的R)世界,这是它成为一个如此非凡的平台最为重要的原因。
以前很多书籍都集中于核心语言,或者主要关注在JVM语言上,所以很高兴看到由如此有经验的Spark教育工作者来专门为PySpark出书,使PySpark有机会绽放光芒。PySpark通过支持这两个不同的世界,使我们能够成为更高效的数据科学家和数据工程师,同时得以借鉴彼此社区的那些绝佳想法。
很荣幸有机会浏览这本书的早期版本,... [展开] [收起]

作者简介

托马兹·卓巴斯(Tomasz Drabas),微软数据科学家,他拥有超过13年的数据分析经验。托马兹每天都和大数据打交道,解决机器学习问题(如异常检测、流失预测),并使用Spark进行模式识别。;丹尼·李(Denny Lee),微软Azure DocumentDB团队的首席项目经理。他是一个经验丰富的分布式系统和数据科学工程师,拥有超过18年的经验,擅长开发互联网级别基础架构、数据平台和预测分析系统(包括内部部署和云环境)。;栾云杰,暂无译者详情。;陈瑶,暂无作者详情。;刘旭斌,暂无译者详情。

评论0

扫码下载网易云阅读

网易公司版权所有©1997-2017   网络出版服务许可证(总)网出证(粤)字第030号   信息网络传播视听节目许可证号1908260   增值电信业务经营许可证 粤B2-20090191

工业和信息化部备案管理系统网站

Hi,,