
会员
Spark大数据实时计算:基于Scala开发实战
更新时间:2022-12-20 18:07:23 最新章节:11.4 本章习题
书籍简介
本书从大数据实时计算框架Spark的编程语言Scala入手,第1~4章重点介绍函数式编程语言Scala的基础语法、面向对象编程以及函数式编程等,再通过编程训练案例介绍Scala这门语言的实际开发应用,为读者后面学习Spark框架打下牢固的编程基础。第5~10章重点介绍Spark的安装部署、SparkCore编程、SparkSQL结构化数据处理以及SparkStreaming实时数据处理等,对它们进行详细的剖析和解读。最后,在第11章中通过网站运营指标统计和IP经纬度热力图分析两个实战开发项目,让读者充分掌握Spark大数据实时计算框架技术的应用与实操方法。本书适合所有对大数据技术感兴趣的读者。
品牌:人邮图书
上架时间:2022-10-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
最新上架
- 会员本书内容分为五篇。第一篇从数据要素的基本概念和发展历程入手,帮助读者建立对数据要素的初步认知,并在此基础上探索与数据要素相关的政策导向和环境,了解数据在当今社会中的地位和影响。第二篇详细阐述如何实现数据要素价值化,具体包括数据资产管理、数据治理与确权、数据资产评估与定价等多个方面,还介绍了数据资源入表,数据监管、合规与安全,数据资产的交易等知识。第三篇重点介绍公共数据要素基本知识和公共数据要素价值计算机20.8万字
- 会员本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。第3章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第4计算机20.2万字
- 会员本书共5篇,分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇(第1-3章),主要针对初学者,从零开始,系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇(第4-6章),介绍了PowerBI数据的整理操作、表格中行/列数据的管理,以及PowerBI数据的高级处理、M函数的使计算机0字
- 会员数据挖掘算法为大数据与人工智能的核心,掌握数据挖掘各算法的编程实现,有助于提升大数据的实践运用能力。本书详细阐述了数据挖掘常用算法与编程实现,同时,本书以多个经典的数据挖掘赛题为案例,详细论述了数据预处理、特征选择、可视化、算法选择等全流程数据挖掘过程的编程实现,有助于提升读者面对实际数据问题时灵活运用各类算法能力。计算机4.7万字
- 会员本书分为6篇,共14章。从OLAP核心概念出发,以Presto为例,从整体执行流程到不同SQL的执行原理,力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识(第1章和第2章)介绍OLAP的基础知识和Presto相关的背景知识,并给出了后续贯穿全书的SQL代码;第二篇核心原理(第3章和第4章)非常详细地串讲了SQL执行流程,介绍了执行计划的生成和优化;第三篇经典SQL(第5计算机19.7万字
- 会员本书较全面地介绍了MySQL数据库的基础知识及其应用。本书共11章,包括数据库基础,MySQL的安装与配置,数据库的基本操作,数据表的基本操作,表数据的增、改、删操作,数据查询,视图,索引,存储过程与触发器,事务,数据安全等内容。本书采用案例教学方式,每章以应用实例的方式阐述知识要点,再通过实训项目分析综合应用,最后辅以思考与练习巩固所学知识。应用实例、实训项目、思考与练习这3个部分分别采用3个不计算机7.8万字