0.0 0人评分
字数:9.4万
点击:11.0万
分类: 互联网
标签:

用户还喜欢

  • Flume日志收集与MapReduce模式

    Flume日志收集与MapReduce模式

    【美】史蒂夫·霍夫曼;【美】斯里纳特·佩雷拉

    本书分为上下两篇,其中上篇介绍了HDFS以及流式数据/日志的问题,同时还谈到了Flume是如何解决这些问题的。本书展示了Flume的架构,包括将数据移动到数据库中以及从数据库中获取数据、NoSQL数据存储和性能调优。对于各个架构组件(源、通道、接收器、通道处理器、接收器组等),都提供了详尽的各种实现以及配置选项,你可以借此根据自己的需要来定制Flume。

  • Oracle 12c PLSQL程序设计终极指南

    Oracle 12c PLSQL程序设计终极指南

    孙风栋,郭晓惠,王澜

    基础篇介绍PL/SQL程序设计的基础知识,包括PL/SQL概述、PL/SQL开发工具、PL/SQL基础、PL/SQL控制语句、数据查询、数据操纵与事务处理、内置SQL函数、PL/SQL中的静态SQL语句、记录以及错误处理等。开发篇主要介绍PL/SQL命名对象的开发,包括PL/SQL子程序、PL/SQL包、子程序依赖性与权限管理、触发器、集合、动态SQL、批绑定等,是PL/SQL程序设计的核心部分。高级篇主要介绍Oracle数据库中的对象及其特性、大对象的存储与操作、任务调度管理、PL/SQL性能优化、常用的Oracle内置包等。

  • Ceph分布式存储实战

    Ceph分布式存储实战

    Ceph中国社区

    Ceph是目前开源世界在存储领域的里程碑式项目,它所带来的分布式、无中心化设计是目前众多商用分布式存储模仿和学习的对象。Ceph社区经过十多年发展已经成为近几年参与度增长最快的开源社区之一,而Ceph中国社区正是背后的驱动力之一。

  • Apache Spark机器学习

    Apache Spark机器学习

    【美】刘永川

    《Apache Spark机器学习》包装了一系列项目“蓝图”,展示了Spark可以帮你解决的一些有趣挑战,读者在将理论知识实践于一些实际项目之前,会了解到如何使用Spark notebook,以及如何访问、清洗和连接不同的数据集,你将在其中了解Spark机器学习如何帮助你完成从欺诈检测到分析客户流失等各种工作。你还将了解如何使用Spark的并行计算能力构建推荐引擎。

  • R与Hadoop大数据分析实战

    R与Hadoop大数据分析实战

    【印】Vignesh Prajapati

    《R与Hadoop大数据分析实战》全面而系统地讲解了如何将R语言与Hadoop技术结合并应用于大数据分析,不仅系统且深入地阐释了R与Hadoop集成技术的工具、方法、原则和最佳实践,而且通过大量实践案例深入剖析各种常见问题,能为用户高效利用R语言与Hadoop技术进行大数据分析提供翔实指导。

Scala机器学习

Scala机器学习【美】亚历克斯·科兹洛夫  著

这是一本关于机器学习的书,它以Scala为重点,介绍了函数式编程方法以及如何在Spark上处理大数据。本书后面将介绍关于Hadoop的内容。最初它能在廉价硬件上处理大量的信息,因为当时传统的关系数据库不能处理这样的信息(或能处理,但是代价过高)。大数据这个话题太大了,而Spark才是本书的重点,它是Hadoop MapReduce的另一个实现,Spark提高了磁盘上持久化保存数据的效率。通常认为使用Spark有点贵,因为它消耗更多的内存,要求硬件必须更可靠,但它也更具交互性。此外,Spark使用Scala工作(也可以使用Java和Python等),但Scala是主要的API语言。因此Spark... [展开] [收起]

作者简介

【美】亚历克斯·科兹洛夫,主编《Scala机器学习》。

评论

为该书打分

    Hi,,