详解Spark SQL实验

SQL Server实验详解

详细解读了SQL Server 2005实验的操作流程，包括数据库的创建、表的设计以及数据的管理。首先介绍了使用CREATE DATABASE语句创建名为studb的数据库，然后通过ALTER DATABASE语句配置数据库文件，包括文件大小、增长率等设置。接着，讲解了创建的三个重要表：student_info、curriculum和grade，每个表的结构设计和字段说明。通过可以深入理解SQL Server实验的关键步骤和操作要点。

SQLServer 8 2024-10-18

Spark SQL详解.xmind.zip

《Spark SQL详细解析》在大数据处理领域，Spark SQL凭借其高效且灵活的特性脱颖而出，成为数据工程师和数据科学家的重要工具。本资料集是大数据课程笔记的一部分，涵盖了从Hadoop基础知识到Spark SQL的全面应用，帮助学习者深入理解大数据处理流程。我们需了解Hadoop的基础，它是大数据处理的基石。Hadoop是一个开源框架，主要用于存储和处理大规模数据集。它由两个主要组件构成：HDFS（Hadoop Distributed File System）和MapReduce。HDFS提供了分布式文件系统，能够将大文件分割并在多台服务器上存储，确保高可用性和容错性。MapReduce

spark 14 2024-07-13

简易版Spark实验指南

这是一本简单易懂的Spark实验手册，无需课堂指导，只需按照手册逐步操作，即可完成Spark的安装、部署和基础开发。

spark 14 2024-07-22

大数据实验实验六：Spark初级编程实践

Spark是一个大数据处理的开源cluster computing框架，具有高效、灵活、可扩展等特点。本实验报告通过Spark初级编程实践，掌握Spark的基本使用和编程方法。一、安装Hadoop和Spark 在Windows 10上安装Oracle VM VirtualBox虚拟机，安装CentOS 7操作系统，并配置Hadoop 3.3环境。选择支持Hadoop 3.3版本的Spark安装包，解压后配置spark-env.sh文件，成功启动Spark。二、Spark读取文件系统的数据 Spark可以读取Linux系统本地文件和HDFS系统文件。首先，在spark-shell中读取Lin

spark 17 2024-07-12

Spark理论详解

这本书是目前国内唯一的中文资源，对学习Kettle的朋友和研究ETL的专家都有很高的参考价值。

spark 13 2024-07-13

实验5_SQL数据更新操作详解

中山大学计算机学院《数据库系统原理实验》中的实验5-SQL语言：数据更新操作，让学生掌握SQL中的数据修改功能。1. 数据插入操作：涉及向jxgl数据库中的student和sc表插入新数据。2. 数据更新操作：- 5.2.1：为IS系学生添加7号课程的选课记录，成绩为空，使用INSERT INTO...SELECT语句。- 5.2.2：找出所有每门课均不及格的学生，并存储到新表ts中。- 5.2.3：更新学号为2005001的学生姓名为“李华”，并增加1岁。- 5.2.4：将选修“数据库系统”课程但成绩不及格的学生成绩设为NULL。- 5.2.5：若王林在3号课程作弊，其成绩设为NULL。-

MySQL 8 2024-11-01

SQL Server 2005数据库实验详解

在SQL Server 2005上进行的数据库实验涵盖多个关键知识点，对理解和掌握关系型数据库管理系统至关重要。实验可能包括基本SQL语句（如SELECT、INSERT、UPDATE、DELETE）的使用，数据库创建与管理（包括CREATE DATABASE和CREATE TABLE命令），表操作（如添加、修改和删除列，设置约束），复杂查询技巧（如JOIN操作和子查询），视图的创建与使用，索引的管理，数据备份与恢复，存储过程与触发器的编写，安全性与权限管理，以及数据导入导出的应用。

SQLServer 16 2024-08-05

Spark RDD 算子详解

RDD 分区调整：- repartition()- coalesce()聚合函数：- reduce()- aggregate()关联函数：- join()- cogroup()

spark 19 2024-04-30

Spark Shell启动详解

详细介绍了Spark的shell启动命令及其具体细节，帮助读者深入了解。

spark 13 2024-09-13