Apache Spark 备忘单

Apache Spark 已成为提升 Apache Hadoop 环境的各种功能的引擎。对于大数据，Apache Spark 满足了许多需求，并本机运行在 Apache Hadoop 的 YARN 上。通过在 Apache Hadoop 环境中运行 Apache Spark，您可以获得该平台固有的所有安全、治理和可扩展性。Apache Spark 还与 Apache Hive 非常好地集成，并且利用集成安全功能可以访问所有 Apache Hadoop 表。