0.0 0人评分
字数:13.0万
点击:21.8万
分类: 软件工程
标签:

用户还喜欢

  • R统计应用开发实战

    R统计应用开发实战

    【印度】Prabhanjan Narayanachar Tattar

    本书的前5章是以基础知识和R软件为主体,因此包括了R基本知识、数据可视化、探索性数据分析和统计推断。基础知识部分会使用有趣的例子来加以说明,并且为后5章建立了框架。回归模型、线性和logistic回归被安排在前面,是应用部分最重要的研究热点。这种讨论实质上更普遍,而且这种方法也很容易应用于不同的领域。最后两章受到了Breiman学校的启发,因此详细介绍了分类和回归树的现代方法,并且用实际的数据集进行了说明。

  • 实时分析:流数据的分析与可视化技术

    实时分析:流数据的分析与可视化技术

    【美】拜伦·埃利斯

    本书共11章。第1章介绍常见的流数据的来源、应用以及三个重要特性:持续交付、结构松散和高基数,并阐释对流数据使用基础架构和算法的重要性。第2~6章介绍实时流架构的各组件涉及的软件、框架和方法。第2章概述实时流架构设计涉及的组件、特性、编程语言等。第3章介绍实时流架构的服务配置和协调,重点介绍协调服务器ZooKeeper。第4章阐述实时流架构中数据流程的管理,涉及用来管理数据流程的两个软件包Kafka和Flume。第5章分析流数据的处理,涉及如何用Storm或Samza来处理数据。第6章介绍流数据的存储问题。第7~11章重点关注流数据架构的应用构建问题。第7章讨论从流环境向最终用户的数据交付问题。这是构建仪表板以及其他监控应用所使用的核心机制。第8章涵盖流环境下的聚集计算问题,特别是对多分辨率时间序列数据的聚集计算问题。第9章简要介绍统计学和概率论的基础知识。第10章讨论略图,略图通常具有更快的更新速度和更小的内存占用空间,特别适合流环境。第11章讨论聚集计算之外能够应用于流数据的一些更深入的话题。

  • SQL优化最佳实践:构建高效率Oracle数据库的方法与技巧

    SQL优化最佳实践:构建高效率Oracle数据库的方法与技巧

    韩锋

    本书从多角度阐述了SQL语句优化的方方面面,总体上可分为两大部分。第一部分主要讲解跟SQL优化相关的背景知识和基本原理;第二部分重点讲述了优化器的各种优化手段。

  • 数据库查询优化器的艺术:原理解析与SQL性能优化

    数据库查询优化器的艺术:原理解析与SQL性能优化

    李海翔

    数据库领域泰斗王珊教授亲自作序推荐,PostgreSQL中国社区和中国用户会发起人以及来自Oracle、新浪、网易、华为等企业的数位资深数据库专家联袂推荐。从原理角度深度解读和展示数据库查询优化器的技术细节和全貌;从源码实现角度全方位深入分析MySQL和PostgreSQL两大主流开源数据库查询优化器的实现原理;从工程实践的角度对比了两大数据库的查询优化器的功能异同和实现异同。它是所有数据开发工程师、内核工程师、DBA以及其他数据库相关工作人员值得反复研读的一本书。

  • 中国民间神话精选

    中国民间神话精选

    梓凡

    中国神话故事由于具有极丰富的想象力和可读性,一直被全世界的人民所喜爱。与西方的神话故事相比,中国传统神话故事对善恶的描写更具体,对美德的弘扬更清晰,对心智培养更有利。这本《中国民间神话精选》精选了中国传统神话中的精华,这些神话故事有很多在民间口口流传,此书让我们在了解名族经典文化的同时,增强了自己的民族意识,并使得认知和美德水平得到同时提高!

Spark与Hadoop大数据分析

Spark与Hadoop大数据分析【美】文卡特·安卡姆  著

本书介绍了ApacheSpark和Hadoop的基础知识,并深入探讨了所有Spark组件:SparkCore、SparkSQL、DataFrame、DataSet、普通流、结构化流、MLlib、Graphx,以及Hadoop的核心组件(HDFS、MapReduce和Yarn)等,此外,也讲解了在Spark+Hadoop集群中实现的示例。 [展开] [收起]

作者简介

【美】文卡特·安卡姆(Venkat Ankam),有超过18年的IT经验和5年以上的大数据技术经验,与客户一起设计和开发过可扩展的大数据应用程序。他在利用Hadoop和Spark进行大数据分析方面拥有丰富的经验,与全球很多客户进行了合作。他是Cloudera认证的Hadoop开发者和管理员,也是Databricks认证的Spark开发者。他还是一些全球Hadoop和Spark会议小组的创始人和主持人,热爱与社区分享知识。

评论

为该书打分

    Hi,,