8.0 2人评分
字数:17.6万
点击:30.4万
分类: 数据库
标签:
Spark大数据分析实战

Spark大数据分析实战倪亚宇,高彦杰  著

这是一本根据应用场景讲解如何通过Spark进行大数据分析与应用构建的著作,以实战为导向。
作者结合典型应用场景,抽象出通用与简化后的模型,以便于读者能举一反三,直接应用。
本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的大数据场景下的数据分析。
在每个场景中,首先是对场景进行抽象与概括,然后将Spark融入其中构建数据分析算法与应用,最后结合其他开源系统或工具构建更为丰富的数据分析流水线。 [展开] [收起]

作者简介

倪亚宇,清华大学自动化系在读博士研究生,曾于微软亚洲研究院、IBM研究院实习。对大规模的推荐系统和机器学习算法有较为深入的研究和丰富的实践经验。;高彦杰,毕业于中国人民大学,就职于微软亚洲研究院。开源技术爱好者,对Spark及其他开源大数据系统与技术有较为深入的认识和研究,实践经验丰富。较早接触并使用Spark,对Spark应用开发、Spark系统的运维和测试比较熟悉,深度阅读了Spark的源代码,了解Spark的运行机制,擅长Spark的查询优化。


曾著有畅销书《Spark大数据处理:技术、应用与性能优化》。

评论0

扫码下载网易云阅读

网易公司版权所有©1997-2017   网络出版服务许可证(总)网出证(粤)字第030号   信息网络传播视听节目许可证号1908260   增值电信业务经营许可证 粤B2-20090191

Hi,,