0.0 0人评分
字数:6.4万
点击:2.8万
分类: 程序编程
标签:

用户还喜欢

  • Apache Spark机器学习

    Apache Spark机器学习

    【美】刘永川

    《Apache Spark机器学习》包装了一系列项目“蓝图”,展示了Spark可以帮你解决的一些有趣挑战,读者在将理论知识实践于一些实际项目之前,会了解到如何使用Spark notebook,以及如何访问、清洗和连接不同的数据集,你将在其中了解Spark机器学习如何帮助你完成从欺诈检测到分析客户流失等各种工作。你还将了解如何使用Spark的并行计算能力构建推荐引擎。

  • 深入理解ElasticSearch

    深入理解ElasticSearch

    【美】拉斐尔·酷奇;【美】罗马雷克·罗戈任斯基

    第1章介绍ApacheLucene的工作方式、ElasticSearch的基本概念。第2章描述Lucene评分机制、如何进行查询重写,另外还介绍ElasticSearch的批处理API及如何使用过滤器来优化查询。第3章描述如何修改Lucene评分,如何使用不同的倒排索引格式来改变索引字段的结构。第4章阐述如何选择恰当的索引分片、路由工作机制、索引分片机制。第5章介绍如何为具体应用选择正确的目录实现,同时阐述发现、网关、恢复模块及其配置方式,以及调优ElasticSearch的缓存机制。第6章介绍JVM垃圾收集的工作原理、重要性以及如何调优,还介绍如何控制ElasticSearch的I/O操作数量和如何诊断ElasticSearch中的问题。第7章介绍帮助修正查询中的拼写错误以及构建高效的自动完成机制——查询建议,还通过实际的案例展示如何通过使用不同查询类型和ElasticSearch的其他功能来提高查询相关性。第8章重点阐释ElasticSearch的JAVAAPI。第9章通过演示如何开发你自己的河流和语言处理插件来介绍ElasticSearch的插件开发。

  • 实时分析:流数据的分析与可视化技术

    实时分析:流数据的分析与可视化技术

    【美】拜伦·埃利斯

    本书共11章。第1章介绍常见的流数据的来源、应用以及三个重要特性:持续交付、结构松散和高基数,并阐释对流数据使用基础架构和算法的重要性。第2~6章介绍实时流架构的各组件涉及的软件、框架和方法。第2章概述实时流架构设计涉及的组件、特性、编程语言等。第3章介绍实时流架构的服务配置和协调,重点介绍协调服务器ZooKeeper。第4章阐述实时流架构中数据流程的管理,涉及用来管理数据流程的两个软件包Kafka和Flume。第5章分析流数据的处理,涉及如何用Storm或Samza来处理数据。第6章介绍流数据的存储问题。第7~11章重点关注流数据架构的应用构建问题。第7章讨论从流环境向最终用户的数据交付问题。这是构建仪表板以及其他监控应用所使用的核心机制。第8章涵盖流环境下的聚集计算问题,特别是对多分辨率时间序列数据的聚集计算问题。第9章简要介绍统计学和概率论的基础知识。第10章讨论略图,略图通常具有更快的更新速度和更小的内存占用空间,特别适合流环境。第11章讨论聚集计算之外能够应用于流数据的一些更深入的话题。

  • Ceph分布式存储实战

    Ceph分布式存储实战

    Ceph中国社区

    Ceph是目前开源世界在存储领域的里程碑式项目,它所带来的分布式、无中心化设计是目前众多商用分布式存储模仿和学习的对象。Ceph社区经过十多年发展已经成为近几年参与度增长最快的开源社区之一,而Ceph中国社区正是背后的驱动力之一。

  • Oracle 12c PLSQL程序设计终极指南

    Oracle 12c PLSQL程序设计终极指南

    孙风栋,郭晓惠,王澜

    基础篇介绍PL/SQL程序设计的基础知识,包括PL/SQL概述、PL/SQL开发工具、PL/SQL基础、PL/SQL控制语句、数据查询、数据操纵与事务处理、内置SQL函数、PL/SQL中的静态SQL语句、记录以及错误处理等。开发篇主要介绍PL/SQL命名对象的开发,包括PL/SQL子程序、PL/SQL包、子程序依赖性与权限管理、触发器、集合、动态SQL、批绑定等,是PL/SQL程序设计的核心部分。高级篇主要介绍Oracle数据库中的对象及其特性、大对象的存储与操作、任务调度管理、PL/SQL性能优化、常用的Oracle内置包等。

Flume日志收集与MapReduce模式

Flume日志收集与MapReduce模式【美】史蒂夫·霍夫曼;【美】斯里纳特·佩雷拉  著

本书分为上下两篇,其中上篇介绍了HDFS以及流式数据/日志的问题,同时还谈到了Flume是如何解决这些问题的。本书展示了Flume的架构,包括将数据移动到数据库中以及从数据库中获取数据、NoSQL数据存储和性能调优。对于各个架构组件(源、通道、接收器、通道处理器、接收器组等),都提供了详尽的各种实现以及配置选项,你可以借此根据自己的需要来定制Flume。 [展开] [收起]

作者简介

史蒂夫·霍夫曼,作家,编著《Flume日志收集与MapReduce模式》。


斯里纳特·佩雷拉,作家,编著《Flume日志收集与MapReduce模式》。

评论

为该书打分

    Hi,,