0.0 0人评分
字数:11.1万
点击:5.5万
分类: 程序编程
标签:

用户还喜欢

  • Spark核心技术与高级应用

    Spark核心技术与高级应用

    于俊等

    从技术层面上,Spark作为一个快速、通用的大规模数据处理引擎,凭借其可伸缩、基于内存计算等特点,以及可以直接读写HDFS上数据的优势,实现了批处理时更加高效、延迟更低,已然成为轻量级大数据快速处理的统一平台。Spark集成Spark SQL、Spark Streaming、MLlib、GraphX、SparkR等子框架,并且提供了全新的大数据处理方式,让从业者的工作变得越来越便捷。本书从基础讲起,针对性地给出了实战场景;并围绕DataFrame,兼顾在Spark SQL和Spark ML的应用。

  • Mahout实践指南

    Mahout实践指南

    【美】Piero Giacomelli

    软件开发专家数十年行业经验的结晶,深入浅出地论述如何使用Mahout进行数据分类、聚类和预测,涉及Mahout开发环境、序列文件使用方式、整合Mahout和外部资源、实现朴素贝叶斯分类器、股市预测、顶棚聚类、频谱预测、K—均值聚类等。

  • 软件架构

    软件架构

    【法】穆拉德·沙巴纳·奥萨拉赫(Mourad Chabane Oussalah)

    架构(即架构元素的组织)是复杂软件系统设计与开发中的关键问题之一。本书介绍了基于对象、组件、服务和模型的架构范式,以及各种架构技术及方法,包括架构质量分析、架构模板、风格表示模型、正规化、验证和测试,最后还介绍了处理这些一致、自治元素的工程方法。本书适合项目经理、项目负责人、架构师、设计人员、开发人员和软件架构用户以及工程专业学生及教师阅读。

  • Spark大数据分析实战

    Spark大数据分析实战

    倪亚宇; 高彦杰

    本书一共11章:其中第1~3章,主要介绍了Spark的基本概念、编程模型、开发与部署的方法;第4~11章,详细详解了热点新闻分析系统、基于云平台的日志数据分析、情感分析系统、搜索引擎链接分析系统等的应用与算法等核心知识点。

  • 分布式实时处理系统:原理、架构与实现

    分布式实时处理系统:原理、架构与实现

    卢誉声

    本书是一本由浅入深并详细讲解编写一套全新的基于C/C++的实时处理系统的编程实战书。本书从基础知识开始,到实时数据系统的架构设计,到代码的实际编写,逐步实现一个完整的实时数据处理系统。本书把这套全新的高性能分布式实时处理系统命名为Hurricane,该单词与Storm涵义类似,但略有不同,其中维基百科对Hurricane的解释是“A storm that has very strong fast winds and that moves over water”,即“在水面高速移动的飓风(storm)”。同时,为了支持高性能的实时处理系统,我们必须提供高性能的网络层,能够支持大量的并发,因此本书设计实现了一套跨平台的网络库Meshy,并将其作为Hurricane实时处理系统的传输层。

Apache Spark机器学习

Apache Spark机器学习【美】刘永川  著

《Apache Spark机器学习》包装了一系列项目“蓝图”,展示了Spark可以帮你解决的一些有趣挑战,读者在将理论知识实践于一些实际项目之前,会了解到如何使用Spark notebook,以及如何访问、清洗和连接不同的数据集,你将在其中了解Spark机器学习如何帮助你完成从欺诈检测到分析客户流失等各种工作。
你还将了解如何使用Spark的并行计算能力构建推荐引擎。 [展开] [收起]

作者简介

【美】刘永川编著《Apache Spark机器学习》等。

评论

为该书打分

    Hi,,