百度云PALO是一款PB级别的大规模并行处理(MPP)数据仓库服务产品,专为百度云平台设计。PALO主打高性能分析和报表查询功能,在成本上具有显著优势。与商业数据仓库系统如Greenplum、Vertica、Exadata以及云服务产品如Amazon RedShift、Google BigQuery功能定位相近,PALO分为云端和前端两部分。前端提供与云端交互的工具,如数据上传到百度云对象存储服务(BOS)、集群管理和SQL语句提交等功能。PALO支持从百度BOS导入数据,也可以通过HDFS或本地文件使用bulkload命令导入数据。集群管理界面简便易用,支持集群申请、节点管理和SQL操作,JDBC和ODBC连接URL可在界面查看。核心引擎PaloCore包括LeaderNode和ComputeNode两种角色,分别负责元数据维护和计算任务执行。PALO支持多种数据类型和广泛的SQL语法,适合用户进行复杂数据处理和分析任务。