搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
出版时间 :
Spark权威指南
0.00     定价 ¥ 128.00
浙江图书馆
  • ISBN:
    9787519840099
  • 作      者:
    Bill,Chambers,Matei,Zaharia
  • 出 版 社 :
    中国电力出版社
  • 出版日期:
    2020-04-01
收藏
编辑推荐

通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。本书由Spark的创始人所撰写,重点介绍Spark新版本的新功能和新特点。本书将Spark功能分解为若干独立主题来进行全面介绍。

 

你将接触到Spark的基本操作和常用函数,还包括一种全新的构建端到端流数据应用的结构化流处理API。开发人员和系统管理员将了解到Spark的监控、调优,以及调试的原则和方法,并通过使用Spark提供的可扩展机器学习库Mllib来了解机器学习算法的实现技术。

 


展开
作者简介

作者介绍

 

Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。

Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。

 

译者介绍

 

张岩峰,东北大学教授,在国内外从事大数据分布式处理研究工作10余年,中国计算机学会数据库专委会委员,大数据专委会通讯委员,研究设计了iMapReduce、Maiter等大数据迭代计算分布式框架,承担和参与国家自然科学基金、国家重点研发计划等多项课题,在SIGMOD、VLDB、ICDE、PPoPP、TPDS、TKDE等顶D级国际会议和期刊上发表论文10余篇,曾获云计算国际会议ACM SOCC 2011优秀论文奖及多项国内外奖励和荣誉。


展开
内容介绍

主要内容

·大数据技术和Spark概述。

·通过实例学习DataFrame、SQL、Dataset等Spark的核心API。

·了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。

·了解Spark如何在集群上运行。

·Spark集群和应用程序的调试、监控、和调优。

·学习Spark强大的流处理引擎——结构化流处理。

·学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。

 


展开
精彩书评

“这本书是所有Spark开发人员的必读书籍,介绍了许多别处无法学到的使用技巧。”

——Ion Stoica

美国加州大学伯克利分校

RISE实验室主任

 


展开
目录


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

温馨提示:请使用浙江图书馆的读者帐号和密码进行登录

点击获取验证码
登录