非结构化数据的巨大规模与增长速度比结构化数据快10到50倍,占据总数据量的80~90%。这种数据的异构性和多样性显著,包括文本、图像、视频和机器生成数据,具有不明显的模式和不连贯的语法。未来趋势和模式的预测分析需借助深度复杂分析如机器学习和人工智能,以实现实时而非批量式的数据处理和分析。大数据的4V特征:“大量化、多样化、快速化、价值密度低”,这些特征定义了大数据的本质。