查看原文
其他

掌握 JavaScript 中的迭代器和生成器

CUGGZ 前端充电宝 2023-03-28
本文约 6200 字,预计阅读需要 20 分钟。

迭代器和生成器是 ES6 中引入的特性。迭代器通过一次消费一个项目列表来提高效率,类似于数据流。生成器是一种能够暂停执行的特殊函数。调用生成器允许以块的形式(一次一个)生成数据,而无需先将其存储在列表中。下面就来深入理解 JavaScript 中的迭代器和生成器,看看它们是如何使用的,又有何妙用!

迭代器

JavaScript 中的迭代器可以分别两种:同步迭代器异步迭代器

1. 同步迭代器

(1)迭代器和可迭代对象

在 JavaScript 中有很多方法可以遍历数据结构。例如,使用 for 循环或使用 while 循环。迭代器具有类似的功能,但有显着差异。

迭代器只需要知道集合中的当前位置,而其他循环则需要预先加载整个集合才能循环遍历它。迭代器使用 next() 方法访问集合中的下一个元素。但是,为了使用迭代器,值或数据结构应该是可迭代的。数组、字符串、映射、集合是 JavaScript 中的可迭代对象。普通对象是不可迭代的。

(2)定义迭代器

下面来看看集合不可迭代的场景:

const favouriteMovies = {
  a'哈利波特',
  b'指环王',
  c'尖峰时刻',
  d'星际穿越',
  e'速度与激情',
}

这个对象是不可迭代的。如果使用普通的 for 循环遍历它,就会抛出错误。随着 ES6 中迭代器的引入,可以将其转换为可迭代对象以便遍历它。这些称为自定义迭代器。下面看看如何实现对象的遍历并打印出来:

favouriteMovies[Symbol.iterator] = function() {
  const ordered = Object.values(this).sort((a, b) => a - b);
  let i = 0;
  return {
    next() => ({
      done: i >= ordered.length,
      value: ordered[i++]
    })
  }
}

for (const v of favouriteMovies) {
  console.log(v);
}

输出结果如下:

哈利波特
指环王
尖峰时刻
星际穿越
速度与激情

这里使用 Symbol.iterator() 来定义迭代器。任何具有 Symbol.iterator 键的结构都是可迭代的。

可迭代对象具有以下行为:

  1. for..of 循环开始时,它首先查找错误。如果未找到,则它会访问方法和定义该方法的对象。
  2. for..of 循环方式迭代该对象。
  3. 使用该输出对象的 next() 方法来获取要返回的下一个值。
  4. 返回的值的格式为 done:boolean, value: any。返回 done:true 时循环结束。

下面来创建一个 LeapYear 对象,该对象返回范围为 (start, end) 的闰年列表,并在后续闰年之间设置间隔。

class LeapYear {
  constructor(start = 2020, end = 2040, interval = 4) {
    this.start = start;
    this.end = end;
    this.interval = interval;
  }
  [Symbol.iterator]() {
    let nextLeapYear = this.start;
    return {
      next() => {
        if (nextLeapYear <= this.end) {
          let result = { value: nextLeapYear, donefalse };
          nextLeapYear += this.interval;
          return result;
        }
        return { valueundefineddonetrue };
      },
    };
  }
}

在上面的代码中,为自定义类型 LeapYear 实现了 Symbol.iterator() 方法。分别在 this.startthis.end 字段中有迭代的起点和终点。使用 this.interval来跟踪迭代的第一个元素和下一个元素之间的间隔。

现在,可以在自定义类型上调用 for...of 循环,并查看其行为和输出值,就像默认数组类型一样:

let leapYears = new LeapYear();
for (const leapYear of leapYears) {
    console.log(leapYear);
}

输出结果如下:

2020
2024
2028
2032
2036
2040

这里的 LeapYear 通过 Symbol.iterator() 变成了可迭代对象。

在一些情况下,迭代器会比普通迭代更好。例如,在没有随机访问的有序集合(如数组)中,迭代器的性能会更好,因为它可以直接根据当前位置检索元素。但是,对于无序集合,由于没有顺序,就不会体验到性能上的重大差异。

使用普通循环算法,例如 for 循环或 while 循环,您只能循环遍历允许迭代的集合:

const favourtieMovies = [
  '哈利波特',
  '指环王',
  '尖峰时刻'
  '星际穿越',
  '速度与激情',
];

for (let i=0; i < favourtieMovies.length; i++) {
  console.log(favouriteMovies[i]);
}

let i = 0;
while (i < favourtieMovies.length) {
  console.log(favourtieMovies[i]);
  i++;
}

由于数组是可迭代的,因此可以使用 for 循环遍历。我们也可以为上面实现一个迭代器,这将允许更好地访问基于当前位置的元素,而无需加载整个集合。代码如下:

const iterator = favourtieMovies[Symbol.iterator]();
 
iterator.next();  // { value: '哈利波特', done: false }
iterator.next();  // { value: '指环王', done: false }
iterator.next();  // { value: '尖峰时刻', done: false }
iterator.next();  // { value: '星际穿越', done: false }
iterator.next();  // { value: '速度与激情', done: false }
iterator.next();  // { value: undefined, done: true }

next() 方法将返回迭代器的结果。它包括两个值;集合中的元素完成状态。可以看到,当遍历完成后,即使访问数组外的元素,也不会抛出错误。它只会返回一个具有 undefined 值和完成状态为 true 的对象。

(3)使用场景

那为什么向自定义对象中添加迭代器呢?我们也可以编写自定义函数来遍历对象以完成同样的事情。

实际上,迭代器是一种标准化自定义对象的优雅实现方式,它为自定义数据结构提供了一种在更大的 JS 环境中很好地工作的方法。因此,提供自定义数据结构的库经常会使用迭代器。例如,  Immutable.JS 库就使用迭代器为其自定义对象(如Map)。所以,如果需要为封装良好的自定义数据结构提供原生迭代功能,就考虑使用迭代器。

2. 异步迭代器

JavaScript 中的异步迭代对象是实现 Symbol.asyncIterator 的对象:

const asyncIterable = {
  [Symbol.asyncIterator]: function() {
 
  }
};

我们可以将一个函数分配给 [Symbol.asyncIterator] 以返回一个迭代器对象。迭代器对象应符合带有 next() 方法的迭代器协议(类似于同步迭代器)。

下面来添加迭代器:

const asyncIterable = {
  [Symbol.asyncIterator]: function() {
    let count = 0;

    return {
      next() {
        count++;
        if (count <= 3) {
          return Promise.resolve({ value: count, donefalse });
        }

        return Promise.resolve({ value: count, donetrue });
      }
    };
  }
};

这里用 Promise.resolve 包装了返回的对象。下面来执行 next() 方法:

const go = asyncIterable[Symbol.asyncIterator]();

go.next().then(iterator => console.log(iterator.value));
go.next().then(iterator => console.log(iterator.value));

输出结果如下:

1
2

也可以使用 for await...of 来对异步迭代对象进行迭代:

async function consumer() {
  for await (const asyncIterableElement of asyncIterable) {
    console.log(asyncIterableElement);
  }
}

consumer();

异步迭代器和迭代器是异步生成器的基础,后面会介绍异步生成器。

生成器

JavaScript 中的生成器可以分别两种:同步生成器异步生成器

1. 同步生成器

(1)基本概念

生成器是一个可以暂停恢复并可以产生多个值的过程。JavaScript 中的生成器由一个生成器函数组成,它返回一个可迭代 Generator 对象。

生成器是对 JavaScript 的强大补充。它们可以维护状态,提供一种制作迭代器的有效方法,并且能够处理无限数据流,可用于在前端实现无限滚动等。此外,当与 Promises 一起使用时,生成器可以模拟 async/await 功能,这使我们能够以更直接和可读的方式处理异步代码。尽管 async/await 是处理常见、简单的异步用例(例如从 API 获取数据)的一种更普遍的方式,但生成器具有更高级的功能。

生成器函数是返回生成器对象的函数,由 function 关键字后面跟星号 (*) 定义,如下所示:

function* generatorFunction() {}

有时,我们可能会在函数名称旁边看到星号,而不是 function 关键字,例如 function *generatorFunction(),它的工作原理是相同的,但 function* 是一种更广泛接受的语法。

生成器函数也可以在表达式中定义,就像常规函数一样:

const generatorFunction = function* () {}

生成器甚至可以是对象或类的方法

// 生成器作为对象的方法
const generatorObj = {
  *generatorMethod() {},
}

// 生成器作为类的方法
class GeneratorClass {
  *generatorMethod() {}
}

下面的例子都将使用生成器函数声明得语法。

注意:与常规函数不同,生成器不能使用 new 关键字构造,也不能与箭头函数结合使用。

现在我们知道了如何声明生成器函数,下面来看看生成器返回的可迭代生成器对象。

(2)生成器对象

传统的 JavaScript 函数会在遇到return 关键字时返回一个值。如果省略 return 关键字,函数将隐式返回 undefined

例如,在下面的代码中,我们声明了一个 sum() 函数,它返回一个值,该值是两个整数参数的和:

function sum(a, b) {
  return a + b
}

调用该函数会返回一个值,该值是参数的总和:

const value = sum(56// 11

而生成器函数不会立即返回值,而是返回一个可迭代的生成器对象。在下面的例子中,我们声明了一个函数并给它一个单一的返回值,就像一个标准的函数:

function* generatorFunction() {
  return 'Hello, Generator!'
}

当调用生成器函数时,它将返回生成器对象,我们可以将其分配给一个变量:

const generator = generatorFunction()

如果这是一个常规函数,我们希望生成器为我们提供函数中返回的字符串。然而,我们实际得到的是一个处于挂起状态的对象。因此,调用生成器将提供类似于以下内容的输出:

generatorFunction {<suspended>}
  [[GeneratorLocation]]: VM335:1
  [[Prototype]]: Generator
  [[GeneratorState]]: "suspended"
  [[GeneratorFunction]]: ƒ* generatorFunction()
  [[GeneratorReceiver]]: Window

函数返回的生成器对象是一个迭代器。迭代器是一个具有可用的 next() 方法的对象,该方法用于迭代一系列值。next() 方法返回一个对象,其包含两个属性:

  • value:当前步骤的值;
  • done:布尔值,指示生成器中是否有更多值。

next() 方法必须遵循以下规则:

  • 返回一个带有 done: false 的对象来继续迭代;
  • 返回一个带有 done: true 的对象来停止迭代。

下面就来在生成器上调用 next() 并获取迭代器的当前值和状态:

generator.next()

这将得到以下输出结果:

{value"Hello, Generator!"donetrue}

调用 next() 时的返回值为 Hello, Generator!,并且 done 的状态为 true,因为该值来自关闭迭代器的返回值。由于迭代器完成,生成器函数的状态将从挂起变为关闭。这时再次调用生成器将输出以下内容:

generatorFunction {<closed>}

除此之外,生成器函数也有区别于普通函数的独特特征。下面我们就来了解一下 yield 运算符并看看生成器如何暂停和恢复执行。

(3)yield 运算符

生成器为 JavaScript 引入了一个新的关键字:yield**yield**** 可以暂停生成器函数并返回 **yield** 之后的值,从而提供一种轻量级的方法来遍历值。**

在下面的例子中,我们将使用不同的值暂停生成器函数三次,并在最后返回一个值。然后将生成器对象分配给 generator 变量。

function* generatorFunction() {
  yield 'One'
  yield 'Two'
  yield 'Three'

  return 'Hello, Generator!'
}

const generator = generatorFunction()

现在,当我们在生成器函数上调用 next() 时,它会在每次遇到 yield 时暂停。done 会在每次 yield 后设置为 false,表示生成器还没有结束。一旦遇到 return,或者函数中没有更多的 yield 时,done 就会变为 true,生成器函数就结束了。

连续四次调用 next() 方法:

generator.next()
generator.next()
generator.next()
generator.next()

这些将按顺序得到以下结果:

{value"One"donefalse}
{value"Two"donefalse}
{value"Three"donefalse}
{value"Hello, Generator!"donetrue}

next() 非常适合从迭代器对象中提取有限数据。

注意,生成器不需要 return;如果省略,最后一次迭代将返回 {value: undefined, done: true},生成器完成后对 next() 的任何后续调用也是如此。

(4)遍历生成器

使用 next() 方法可以遍历生成器对象,接收完整对象的所有 valuedone 属性。不过,就像 Array、Map 和 Set 一样,Generator 遵循迭代协议,并且可以使用 for...of 进行迭代:

function* generatorFunction() {
  yield 'One'
  yield 'Two'
  yield 'Three'

  return 'Hello, Generator!'
}

const generator = generatorFunction()

for (const value of generator) {
  console.log(value)
}

输出结果如下:

One
Two
Three

扩展运算符也可用于将生成器的值分配给数组:

const values = [...generator]

console.log(values)

输出结果如下:

 ['One''Two''Three']

可以看到,扩展运算符和 for...of 都不会将 return 的值计入 value

注意:虽然这两种方法对于有限生成器都是有效的,但如果生成器正在处理无限数据流,则无法在不创建无限循环的情况下直接使用扩展运算符或 for...of

我们还可以从迭代结果中解构值:

const [a, b, c]= generator;
console.log(a);
console.log(b);
console.log(c);

输出结果如下:

One
Two
Three

(5)关闭生成器

如我们所见,生成器可以通过遍历其所有值将其 done 属性设置为 true 并将其状态设置为 closed 。除此之外,还有两种方法可以立即关闭生成器:使用 return() 方法和使用 throw() 方法。

使用 return(),生成器可以在任何时候终止,就像在函数体中的 return 语句一样。可以将参数传递给 return(),或将其留空以表示未定义的值。

下面来创建一个具有 yield 值但在函数定义中没有 return 的生成器:

function* generatorFunction() {
  yield 'One'
  yield 'Two'
  yield 'Three'
}

const generator = generatorFunction()

第一个 next() 将返回“One”,并将 done 设置为 false。如果在那之后立即在生成器对象上调用 return() 方法,将获得传递的值并将 done 设置为 true。对 next() 的任何额外调用都会给出默认的已完成生成器响应,其中包含一个 undefined 值。

generator.next()
generator.return('Return!')
generator.next()

输出结果如下:

{value"Neo"donefalse}
{value"Return!"donetrue}
{valueundefineddonetrue}

return() 方法会强制生成器对象完成并忽略任何其他 yield 关键字。当需要使函数可取消时,这在异步编程中特别有用,例如当用户想要执行不同的操作时中断数据请求,因为无法直接取消 Promise。

如果生成器函数的主体有捕获和处理错误的方法,则可以使用 throw() 方法将错误抛出到生成器中。这将启动生成器,抛出错误并终止生成器。

下面来在生成器函数体内放一个 try...catch 并在发现错误时记录错误:

function* generatorFunction() {
  try {
    yield 'One'
   yield 'Two'
  } catch (error) {
    console.log(error)
  }
}

const generator = generatorFunction()

现在来运行 next() 方法,然后运行 throw() 方法:

generator.next()
generator.throw(new Error('Error!'))

输出结果如下:

{value"One"donefalse}
ErrorError
{valueundefineddonetrue}

使用 throw() 可以将错误注入到生成器中,该错误被 try...catch 捕获并记录到控制台。

(6)生成器对象方法和状态

下面是生成器对象的方法

  • next():返回生成器中的后面的值;
  • return():在生成器中返回一个值并结束生成器;
  • throw():抛出错误并结束生成器。

下面是生成器对象的状态

  • suspended:生成器已停止执行但尚未终止。
  • closed:生成器因遇到错误、返回或遍历所有值而终止。

(7)yield 委托

除了常规的 yield 运算符之外,生成器还可以使用 yield* 表达式将更多值委托给另一个生成器。当在生成器中遇到 yield* 时,它将进入委托生成器并开始遍历所有 yield 直到该生成器关闭。这可以用于分离不同的生成器函数以在语义上组织代码,同时仍然让它们的所有 **yield** 都可以按正确的顺序迭代。

下面来创建两个生成器函数,其中一个将对另一个进行 yield* 操作:

function* delegate() {
  yield 3
  yield 4
}

function* begin() {
  yield 1
  yield 2
  yield* delegate()
}

接下来,遍历 begin() 生成器函数:

const generator = begin()

for (const value of generator) {
  console.log(value)
}

输出结果如下:

1
2
3
4

外部的生成器(begin)生成值 1 和 2,然后使用 yield* 委托给另一个生成器(delegate),返回 3 和 4。

yield* 还可以委托给任何可迭代的对象,例如 Array 或 Map。yield 委托有助于组织代码,因为生成器中任何想要使用 yield 的函数也必须是一个生成器。

(8)在生成器中传递值

上面的例子中,我们使用生成器作为迭代器,并且在每次迭代中产生值。除了产生值之外,生成器还可以使用 next() 中的值。在这种情况下,yield 将包含一个值。

需要注意,调用的第一个 next() 不会传递值,而只会启动生成器。为了证明这一点,可以记录 yield 的值并使用一些值调用 next() 几次。

function* generatorFunction() {
  console.log(yield)
  console.log(yield)

  return 'End'
}

const generator = generatorFunction()

generator.next()
generator.next(100)
generator.next(200)

输出结果如下:

100
200
{value"End"donetrue}

除此之外,也可以为生成器提供初始值。下面来创建一个 for 循环并将每个值传递给 next() 方法,同时将一个参数传递给 inital 函数:

function* generatorFunction(value) {
  while (true) {
    value = yield value * 10
  }
}

const generator = generatorFunction(0)

for (let i = 0; i < 5; i++) {
  console.log(generator.next(i).value)
}

这将从 next() 中检索值并为下一次迭代生成一个新值,该值是前一个值乘以 10。输出结果如下:

0
10
20
30
40

处理启动生成器的另一种方法是将生成器包装在一个函数中,该函数将会在执行任何其他操作之前调用 next() 一次。

(9)async/await

async/await 使处理异步数据更简单、更容易理解。生成器具有比异步函数更广泛的功能,但能够复制类似的行为。以这种方式实现异步编程可以增加代码的灵活性。

下面来构建一个异步函数,它使用 Fetch API 获取数据并将响应记录到控制台。

首先定义一个名为 getUsers 的异步函数,该函数从 API 获取数据并返回一个对象数组,然后调用 getUsers

const getUsers = async function () {
  const response = await fetch('https://jsonplaceholder.typicode.com/users')
  const json = await response.json()

  return json
}

getUsers().then((response) => console.log(response))

输出结果如下:

使用生成器可以创建几乎相同但不使用 async/await 关键字的效果。相反,它将使用我们创建的新函数,并产生值而不是等待 Promise。

const getUsers = asyncAlt(function* () {
  const response = yield fetch('https://jsonplaceholder.typicode.com/users')
  const json = yield response.json()

  return json
})

getUsers().then((response) => console.log(response))

如我们所见,它看起来与 async/await 实现几乎相同,除了有一个生成器函数被传入以产生值。

现在可以创建一个类似于异步函数的 asyncAlt 函数。asyncAlt 有一个 generatorFunction 参数,它是产生 fetch 返回的 Promise 的函数。asyncAlt 返回函数本身,并 resolve 它得到的每个 Promise,直到最后一个:

function asyncAlt(generatorFunction) {
  return function () {
    // 创建并分配生成器对象
    const generator = generatorFunction()

    // 定义一个接受生成器下一次迭代的函数
    function resolve(next) {
      // 如果生成器关闭并且没有更多的值可以生成,则解析最后一个值
      if (next.done) {
        return Promise.resolve(next.value)
      }

      // 如果仍有值可以产生,那么它们就是Promise,必须 resolved。
      return Promise.resolve(next.value).then((response) => {
        return resolve(generator.next(response))
      })
    }

    // 开始 resolve Promise
    return resolve(generator.next())
  }
}

这样就会得到和async/await一样的结果:

尽管这个方法可以为代码增加灵活性,但通常 async/await 是更好的选择,因为它抽象了实现细节并让开发者专注于编写高效代码。

(10)使用场景

很多开发人员认为生成器函数视为一种奇特的 JavaScript 功能,在现实中几乎没有应用。在大多数情况下,确实用不到生成器。

生成器的优点:

  • 惰性求值:除非需要,否则不计算值。它提供按需计算。只有需要它时,value 才会存在。
  • 内存效率高:由于惰性求值,生成器的内存效率非常高,因为它不会为预先生成的未使用值分配不必要的内存位置。
  • 更简洁的代码:生成器提供更简洁的代码,尤其是在异步行为中。

生成器在对性能要求高的场景中有很大的用处。特别是,它们适用于以下场景:

  • 处理大文件和数据集。
  • 生成无限的数据序列。
  • 按需计算昂贵的逻辑。

Redux sagas 就是实践中使用的生成器的一个很好的例子。它是一个用于管理redux应用异步操作的中间件,redux-saga 通过创建 sagas 将所有异步操作逻辑收集在一个地方集中处理,可以用来代替 redux-thunk 中间件。

2. 异步生成器

ECMAScript 2018 中引入了异步生成器的概念,它是一种特殊类型的异步函数,可以随意停止和恢复其执行。

同步生成器函数和异步生成器函数的区别在于,后者从迭代器对象返回一个异步的、基于 Promise 的结果。

要想创建异步生成器函数,需要声明一个带有星号 * 的生成器函数,前缀为 async

async function* asyncGenerator() {

}

一旦进入函数,就可以使用 yield 来暂停执行:

async function* asyncGenerator() {
  yield 'One'
  yield 'Two'
}

这里 yield 会暂停执行并返回一个迭代器对象给调用者。这个对象既是可迭代对象,又是迭代器。

异步生成器函数不会像常规函数那样在一步中计算出所有结果。相反,它会逐步提取值。我们可以使用两种方法从异步生成器解析 Promise:

  • 在迭代器对象上调用 next()
  • 使用 for await...of 异步迭代。

对于上面的例子,可以这样做:

async function* asyncGenerator() {
  yield 'One';
  yield 'Two';
}

const go = asyncGenerator();

go.next().then(iterator => console.log(iterator.value));
go.next().then(iterator => console.log(iterator.value));

输出结果如下:

'One';
'Two'

另一种方法使用异步迭代 for await...of。要使用异步迭代,需要用 async 函数包装它:

async function* asyncGenerator() {
  yield 'One';
  yield 'Two';
}

async function consumer() {
  for await (const value of asyncGenerator()) {
    console.log(value);
  }
}

consumer();

for await...of 非常适合提取非有限数据流。

往期推荐

超有趣的 Vue 开源实战项目

2023 年的 React 生态

2023年最新最全 VSCode 插件推荐!

前端框架的未来:useSignal()

前端应该会的32个Linux常用命令

2023 年 8 大 Web 开发趋势预测!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存