本系列展示大数据领域的新研究和应用,以及当前正在开发的计算工具和技术。鼓励包含具体的示例和应用。该系列的范围包括社交网络、传感器网络、数据中心计算、天文学、基因组学、医疗数据分析、大规模电子商务等领域的题目,还包括其他潜在贡献者提出的相关主题。
大数据的高性能计算
相关推荐
面向大数据的 高性能计算:方法与应用
面向大数据的 高性能计算:方法与应用
本书探讨了面向数据密集型应用的新兴高性能架构、提升数据处理效率的新型分析策略,以及机器学习、生命科学、神经网络和神经形态工程等多个领域的前沿应用。
全书结构分为两大部分。第一部分涵盖大数据架构,包括云计算系统和异构加速器,并介绍了面向内存架构和设备的新兴 3D IC 设计原则。第二部分展示了大数据在多个领域的新兴应用案例,包括生物信息学、深度学习和神经形态工程。
主要内容包括:
涵盖 Hadoop/Spark 等分布式系统在内的各种大数据架构
面向大数据应用的基于加速器的解决方案,例如基于 GPU 的加速技术
面向内存架构和设备的新兴 3D IC 设计原则
大数据在生物信息学、深度学习和神经形态工程等领域的应用案例
算法与数据结构
2
2024-05-23
Ignite 高性能内存计算
Apache Ignite 提供高性能内存计算。
算法与数据结构
5
2024-04-30
GPU加速高性能数据并行计算
数据库技术的进步、数据挖掘应用的兴起、生物基因技术的不断发展以及历史数据规模的爆炸式增长, 都对高性能计算提出了更高的要求。虽然分布式系统可以部分解决大型计算问题, 但是其通信开销大、故障率高、数据存取结构复杂且开销大、数据安全性和保密性难以控制等问题依然存在。而计算机处理器, 特别是GPU技术的快速发展, 为高性能数据并行计算提供了新的解决方案。
数据挖掘
2
2024-05-19
高性能大数据数据库GridDB介绍
GridDB是一种高性能、高可扩展性和高可靠性的大型数据数据库,其数据模型类似于KVS(键值存储),特别适合存储时序数据,如传感器数据。它设计灵活,能够轻松应对大量传感器的数据存储需求。系统具备高可靠性,采用了先进的节点结构。
NoSQL
0
2024-09-13
高性能计算课程OpenCL程序构建与优化
本课程教授如何使用简单方法隔离现有程序部分,并将其移至内核以提高GPU性能。学习通过AWS探索远程GPU实例来优化OpenCL程序,并检查消除性能瓶颈。课程不培养GPU专家,但将帮助您熟悉创建和执行OpenCL内核所需的基本技能。
Matlab
0
2024-08-24
MySQL数据库的高性能优化
MySQL在过去几年间,随着MariaDB和Percona/XtraDB等分支的出现,MySQL的生态圈发生了显著变化,这些竞争推动了MySQL在性能和功能上的不断改进。例如,InnoDB的改进如XtraDB,在优化器和集群方面的进步,如MariaDB的优化器改进以及MySQL/Oracle在5.6版本后的Server层优化。尽管经历了收购事件,MySQL和MariaDB在竞争压力下依然保持快速发展。最新的《High Performance MySQL》第三版引入了分区、视图、存储过程的改进,优化了高可用性、集群和复制功能,增强了优化器和全文索引的性能,同时适配了SSD和多核CPU,提供了在线备份和恢复工具,是数据库领域值得阅读的重要著作。
MySQL
0
2024-08-25
MongoDB: 高性能、灵活的文档数据库
MongoDB, 使用 C++ 编写, 作为一款面向文档的 NoSQL 数据库, 凭借其可扩展性、高性能以及模式自由的特点, 为 Web 应用提供着强大的数据存储解决方案。其分布式文件存储架构, 是其性能优势的关键。
MongoDB
3
2024-05-19
MySQL数据库的高性能优化策略
MySQL数据库的性能优化是保证系统高效运行的关键。通过调整配置和优化查询,可以显著提升MySQL数据库的响应速度和并发处理能力。
MySQL
2
2024-07-13
Spark:大数据计算的利刃
Spark,如同Hadoop生态系统中的MapReduce、Hive和Storm,是一种通用的 大数据计算框架。它集成了多种计算框架:Spark Core用于离线计算,Spark SQL用于交互式查询,Spark Streaming用于实时流式计算,Spark MLlib用于机器学习,Spark GraphX用于图计算,涵盖了大数据领域的各种计算需求。
Spark专注于大数据的计算,而Hadoop则更侧重于大数据的存储(例如HDFS、Hive、HBase)以及资源调度(Yarn)。 Spark与Hadoop的结合,被视为大数据领域最具潜力和前景的组合。
spark
6
2024-05-12