有人认为Python和R语言之间的区别显而易见,将R视为统计分析工具,Python则更多用于程序设计,然而这种观点未必全面。尽管2012年时R语言在学术界占主导地位,但如今Python正逐渐取代其在学术领域的地位,或许这是大数据时代的必然结果。Python相比R语言具有更快的处理速度,能够直接应对大规模数据;而R语言在处理大数据时需要先通过数据库将其转换为小数据集,再进行分析,因此无法直接处理详细的原始数据,只能处理统计结果。因此有人形象地称Python为“R加SQL/Hive”,这种说法也并非毫无道理。此外,Python的另一明显优势在于其作为胶水语言的特性,许多书籍也多次提及这一点,即使是底层用C编写的高效算法,在Python包中封装后性能依然非常出色。然而,事物往往没有绝对之分,如果R语言能够有效地实现向量化编程(虽然这有一定难度),其速度和程序长度均能显著提升。