MySQL命令速查表
MySQL命令速查表包括mysql客户端工具的使用、数据库管理、用户和权限管理、表管理、索引、查询语句、DML语句、事务控制、视图、存储过程和触发器、备份恢复等内容。
MySQL
0
2024-08-29
SQL 语句速查表
涵盖常用 SQL 语法的全面指南,包括数据操作、查询和数据管理。
SQLServer
1
2024-05-31
SQL语言速查表
Oracle SQL语言开发指南是一个详细的SQL学习资源,涵盖了Oracle数据库中SQL语言的关键概念和用法。它适合那些希望快速掌握SQL编程基础的学习者。
Oracle
0
2024-08-09
Informix 配置文件速查表
此速查表包含 Informix 配置文件的基本信息。
Informix
4
2024-05-12
Python基础数据类型速查表
适用于新手,源自北京理工大学嵩天老师的《Python语言基础编程》课程。
算法与数据结构
5
2024-05-19
Spark Transformation与Action算子详解速查表
Apache Spark 是一个开源的数据处理框架,支持分布式数据计算。在 Spark 中,数据通常被以 RDD(弹性分布式数据集) 的形式存储,通过 Transformation(转换)算子 和 Action(行动)算子 进行处理。
Transformation算子
这些算子用于创建新的 RDD,操作是惰性计算,仅在后续 Action 算子调用时执行。1. map(func):对每个元素应用一个函数,返回应用后的结果集。2. filter(func):过滤满足条件的元素。3. flatMap(func):允许每个元素映射到多个输出元素。4. mapPartitions(func):对每个分区应用一个函数,返回一个迭代器。5. mapPartitionsWithIndex(func):类似 mapPartitions,增加了分区索引。6. mapWith(func):对分区中的元素进行处理,接收分区索引的函数。7. flatMapWith(func):类似 flatMap,包含分区索引。8. mapValues(func):应用于键值对中值,保持原键。9. flatMapValues(func):映射每个值到多个输出。10. sample(withReplacement, fraction, seed):按照比例随机采样。11. union(otherDataset):返回当前 RDD 与另一个 RDD 的并集。12. intersection(otherDataset):返回两个 RDD 的交集。13. distinct([numTasks]):去重处理。14. groupByKey([numTasks]):对键值对的值进行分组。
Action算子
通过触发实际计算并返回最终结果。1. reduce(func):合并 RDD 中的元素。2. collect():将 RDD 中的元素拉回到本地。3. count():计算 RDD 中的元素数量。4. first():返回第一个元素。5. take(n):获取前 n 个元素。6. takeSample(withReplacement, n, seed):返回一个随机采样。7. takeOrdered(n, key=None):返回排序后的前 n 个元素。8. saveAsTextFile(path):将 RDD 保存到文件。9. saveAsSequenceFile(path):将 RDD 存储为序列文件。10. saveAsObjectFile(path):保存为对象文件。11. countByKey():统计每个键的数量。12. foreach(func):对每个元素应用一个函数。
以上操作使得 Spark RDD 提供了灵活而强大的数据处理方式。通过合理使用 Transformation 和 Action 算子,可以实现高效的分布式数据处理。
spark
0
2024-10-28
Redis命令行详解离线工具速查
随着Redis技术的不断发展,其命令行操作已经成为许多开发者不可或缺的工具。通过使用命令PUBLISH channel message,用户可以将信息message发送到指定的频道channel。在版本2.0.0及以上,其时间复杂度为O(N+M),其中N是频道的订阅者数量,而M是使用模式订阅的客户端数量。返回值为接收到信息message的订阅者数量。如果频道没有订阅者,返回值为0。例如,向无订阅者的频道bad_channel发送信息时,返回值为0;向有一个订阅者的频道msg发送信息时,返回值为1;向有多个订阅者的频道chat_room发送信息时,返回值为3。
Redis
3
2024-07-13