Skip to content

4.1 引言

INFO

译者:Mancuoj

来源:4.1 Introduction

现代计算机可以处理大量的关于世界各个方面的数据。通过这些大数据集,我们可以以前所未有的方式了解人类的行为:语言的使用方式、拍摄的照片、讨论的主题以及人们如何与周围环境互动。为了高效处理大型数据集,程序被组织成一系列对顺序数据流进行操作的管道(pipelines)。在本章中,我们将思考一套技术来有效地处理和操作连续的数据流。

在第二章中,我们介绍了一种序列接口(sequence interface),由内置的 Python 数据类型如 listrange 实现。在本章中,我们会将顺序数据的概念扩展到包括无界(unbounded)甚至无限大小的集合。无限序列的两个数学例子是正整数和斐波那契数列。无限长度的连续数据集也会出现在其他计算域中。例如,通过手机信号塔发送的电话呼叫序列、计算机用户的鼠标移动序列以及飞机传感器测量的加速度序列都会随着世界的演变而不断增长。

基于 MIT 许可发布