0.0 0人评分
字数:30.4万
点击:8.1万
分类: 数据库
标签:

用户还喜欢

  • 循序渐进学Spark

    循序渐进学Spark

    小象学院;杨磊

    本书以小象学院git项目方式管理。感谢姜冰钰、陈超、冼茂源等每一位内容贡献者,感谢他们花费大量时间,将自己对Spark的理解加上在实际工作、学习过程中的体会,融汇成丰富的内容。与企业不断涌现的对大数据技术的需求相比,大数据人才还存在很大缺口,对大数据技术充满期许的新人正在源源不断地加入这个领域。在小象学院的教学实践过程中,我们发现,一本能完整系统地介绍Spark各模块原理并兼顾使用实战的书,对于初入大数据领域的技术人员至关重要。于是,我们根据日常积累的经验,著成本书。

  • 孙子批注

    孙子批注

    【宋】吉天保

    曹操曰:计者,选将、量敌、度地、料卒、远近、险易,计於庙堂也。李#1筌曰:计者,兵之上也。太一遁甲,先以计神加德宫,以断主客成败。故孙子#2论兵,亦以计为篇首。

  • Android应用性能优化最佳实践

    Android应用性能优化最佳实践

    罗彧成

    本书一共7章,在简单介绍了Android Studio的使用指南后,分别从绘制(UI)、内存、存储、稳定性、耗电以及安装包6个方面进行优化,从系统上深入分析绘制和内存的原理,一步步深入了解导致性能问题的本质原因,同时讲述了多种性能优化工具的使用,通过分析典型案例,得到有效的优化方案,从而实现更高质量的应用。书中所讲述的内容均基于Android 6.0系统。

  • 高性能Linux服务器构建实战:运维监控、性能调优与集群应用

    高性能Linux服务器构建实战:运维监控、性能调优与集群应用

    高俊峰

    本书以构建高性能Linux服务器为核心内容,从Web应用、数据备份与恢复、网络存储应用、运维监控与性能优化、集群高级应用等多个方面深入讲解了如何构建高性能的Linux服务器。全书以实战性为导向,所有内容都来自于作者多年实践经验的总结,同时从社区中收集了大量Linux运维人员遇到的有代表性的疑难问题,并给出了首秀的解决方案,实践指导意义极强。全书分为5个部分。Web应用篇详细介绍了Nginx、Varnish和Memcached这三款Linux服务器上极为常用的Web应用软件的安装、配置、管理、使用方法、工作原理和性能调优技巧。数据备份与恢复篇首先讲述了开源备份软件bacula的使用与管理技巧,并通过实例讲解了在bacula上进行各种备份与恢复操作的具体方法;其次讲解了开源数据镜像备份工具rsync和unison的使用,并通过两个企业级案例演示了这两个工具在生产环境中的使用过程;*后讲解了如何利用ext3grep工具来恢复误删除的数据文件和MySQL数据库的方法。网络存储应用篇首先系统地讲解了网络存储技术iSCSI的配置和使用,然后讲解了分布式存储系统MFS的使用和维护。运维监控与性能优化篇通过理论与实践相结合的方法讲解了如何利用Nagios进行性能监控,以及Linux服务器的性能分析原则和优化方法。集群高级应用篇是前面内容的综合,也是本书的核心,主要讲述了如何通过LVS+heartbeat、piranha、LVS+Keepalived来构建高可用的负载均衡集群,其次讲解了红帽集群套件RHCS的配置、管理、维护和监控。

  • 构建最高可用Oracle数据库系统:Oracle 11gR2 RAC管理、维护与性能优化

    构建最高可用Oracle数据库系统:Oracle 11gR2 RAC管理、维护与性能优化

    刘炳林

    本书从硬件和软件两个维度系统且全面地讲解了Oracle 11gR2 RAC的架构、工作原理、管理及维护的系统理论和方法,以及性能优化的技巧和最佳实践。

Hadoop与大数据挖掘

Hadoop与大数据挖掘张良均;樊哲等  著

本书提供了大数据相关技术的简介、原理、实践、企业应用等,针对大数据相关技术,如Hadoop、HBase、Hive、Spark等,都有专业章节进行介绍,并且针对每一模块都有相应的动手实践,能有效加深读者对大数据相关技术原理、技术实践的理解。
书中的挖掘实践篇涉及企业在大数据应用中的所有环节,如数据采集、数据预处理、数据挖掘等,通过案例对整个系统的架构进行了详细分析,对读者有一定实践指导作用。对于学习大数据相关技术的高校师生来说,本书不仅提供了大数据相关技术的基础讲解及原理、架构分析,还针对这些原理,配备有对应的动手实践章节,帮助读者加深对原理、架构的认识。
同时,在每个模块结束后,书中会有一... [展开] [收起]

作者简介

张良均,资深数据挖掘专家和模式识别专家,有近10年的数据挖掘应用与咨询经验,8年多的数据仓库系统管理与实施经验,超过10年的系统开发与设计经验。


为电信、电力、零售、农业、银行、电力、生物、化工、医药等多个行业上百家大型企业提供过数据挖掘应用与咨询服务,实践经验非常丰富。此外,他精通Java EE企业级应用开发,是广东工业大学和华南师范大学客座教授,著有《神经网络实用教程》一书。


樊哲,精通Mahout相关算法的二次开发,专注数据挖掘领域。

评论

为该书打分

    Hi,,