У меня возникли проблемы с пониманием полезности функций-генераторов в JavaScript. Хотя я понимаю, что их можно использовать для перебора пользовательских типов данных, я не уверен, что они дают значительное преимущество перед традиционными методами итерации.
Для массивов мы можем использовать цикл forEach
:
const numbers = [1, 2, 3, 4, 5];
numbers.forEach(number => {
console.info(number);
});
А для объектов цикл for...in
работает хорошо:
const person = {
name: 'Alice',
age: 30,
city: 'New York'
};
for (let key in person) {
console.info(key, person[key]);
}
Я также читал, что функции-генераторы полезны для создания бесконечных потоков данных, таких как последовательность Фибоначчи. Однако я могу добиться того же результата, используя цикл while
и две переменные:
function* fibonacci() {
let a = 0, b = 1;
while (true) {
yield a;
const next = a + b;
a = b;
b = next;
}
}
Может ли кто-нибудь подробно рассказать о конкретных преимуществах функций-генераторов и привести примеры, в которых они дают явное преимущество перед традиционными методами итерации?
В вашем последнем примере используется yield
. Это оператор, позволяющий приостановить функцию генератора. Это неверный синтаксис в общей функции.
«Хотя я понимаю, что их можно использовать для перебора пользовательских типов данных», однако на самом деле это не цель. Он предназначен для обобщения любой итерации, включая бесконечные потоки данных. Те, которые вы не можете for
перебрать. Не без реализации вашего собственного способа сделать это. Итак, если у вас есть три разных источника, у вас может получиться три разных протокола их перебора. Вот тут-то и может пригодиться генератор (ну и протоколы итераций). В частности, функции-генераторы — это сопрограммы, которые уже хорошо известны за пределами JS.
В любом случае последовательность Фибоначчи, которую вы генерируете в обычной функции, никогда не закончится. Итак, вы можете сделать это с помощью цикла while. Однако это более чем бесполезно, поскольку при вызове процесс зависает и, вероятно, перезапускается (если это возможно) или требует ручного вмешательства, чтобы завершить его. Функция генератора, которую вы можете воспроизвести и приостановить в любой момент. Вы можете использовать результат частями или один за другим. Что вы хотите. Вам нужно иметь несколько разных реализаций обычной функции, чтобы обрабатывать одно и то же.
Также стоит отметить, что при деструктуризации массива используются итераторы. Удалите итераторы (потому что они «бесполезны»), и вам придется заново реализовывать всю функцию с нуля. Сейчас над итераторами очень тонкий слой. const [x] = foo
просто делает foo[Symbol.iterator]().next().value
(с некоторыми гарантиями для нулей и тому подобного, но, по сути, это все). Теперь попробуйте сделать это без присутствия итератора. Обратите внимание, что foo
не обязательно является массивом.
Когда вам это нужно, вы это знаете. Вы можете выполнить итерацию чего-либо с помощью цикла, поддерживающего протокол итератора (for..of), не создавая при этом массив. В некоторых местах, таких как Фибоначчи, ген был бы удобен. В некоторых нет замены, кроме воссоздания генератора с нуля без простого в использовании синтаксиса. Как уже упоминалось, gens используются для сопрограмм. async/await ранее реализовывался через gens и raw Promises, а в настоящее время это происходит «под капотом». Я бы предложил проверить и написать что-то вроде github.com/tj/co в качестве упражнения для лучшего понимания.
Хм, я думаю, что причина, основанная на мнении, здесь использована неправильно. Я буду голосовать за возобновление работы. На этот вопрос есть конкретные ответы, как показывают комментарии.
Генераторы — это подкатегория итераторов в JavaScript1.
Итераторы в JavaScript тесно связаны с генераторами. Генераторы реализуют итеративный протокол простым в использовании способом. Но сам JS уже использует итерации различными способами, что делает генераторы применимыми напрямую.
В общем, итераторы обобщают перечисление вещей. Это может быть массив, и в этом случае разница минимальна:
const arr = [1, 2, 3, 4, 5];
for(let i = 0; i < arr.length; i++) {
const item = arr[i];
console.info(`do something with ${item}`);
}
const arr = [1, 2, 3, 4, 5];
for(let it = arr[Symbol.iterator](), current = it.next(); !current.done; current = it.next()) {
const item = current.value;
console.info(`do something with ${item}`);
}
Это немного запутанный способ сделать это, но это наглядный пример для непосредственного сравнения с обычным циклом for
. В действительности вы бы использовали цикл for..of, который обрабатывает итерацию гораздо более удобным способом, если объект реализует итерируемый протокол:
const arr = [1, 2, 3, 4, 5];
for(const item of arr) {
console.info(`do something with ${item}`);
}
Однако протокол итерации позволяет перебирать произвольные данные. Например, мы можем создать связанный список (минимальный пример), который предоставляет итератор2. Тогда для его просмотра можно использовать тот же for (const item of iterable)
, не разбираясь в реализации списка:
class Node {
constructor (value, next = null) {
this.value = value;
this.next = next;
}
}
class LinkedList {
constructor(head) {
this.head = head;
}
[Symbol.iterator]() {
let next = this.head;
return {
next() {
const current = next;
next = current?.next;
return {
value: current?.value,
done: current === null
}
}
}
}
}
const links =
new Node(1,
new Node(2,
new Node(3,
new Node(4,
new Node(5)))));
const list = new LinkedList(links);
for(const item of list) {
console.info(`do something with ${item}`);
}
То же самое можно сделать с другими реализациями списков или с деревьями, картами, множествами и т. д. Все они обрабатываются единообразно. В противном случае для каждого понадобится совершенно другая for
петля.
Протокол итератора используется не только для циклического выполнения. Они также необходимы для так называемой деструктуризации массива. Он не только работает с массивами, но и использует итерируемый протокол для разрешения идентификаторов. Итак, вы можете использовать его с массивами:
const arr = [1, 2, 3, 4, 5];
const [a, b, ...rest] = arr;
console.info(a, b, rest);
или списки:
class Node {
constructor (value, next = null) {
this.value = value;
this.next = next;
}
}
class LinkedList {
constructor(head) {
this.head = head;
}
[Symbol.iterator]() {
let next = this.head;
return {
next() {
const current = next;
next = current?.next;
return {
value: current?.value,
done: current === null
}
}
}
}
}
const links =
new Node(1,
new Node(2,
new Node(3,
new Node(4,
new Node(5)))));
const list = new LinkedList(links);
const [a, b, ...rest] = list;
console.info(a, b, rest);
и так далее.
То же самое можно сказать и о синтаксисе распространения3. Он также опирается на итерации:
распространение массива в качестве аргументов:
function doMath(a, b, c, d, e) {
return a + b + c + d + e;
}
const arr = [1, 2, 3, 4, 5];
console.info(doMath(...arr));
распространение списка в качестве аргументов:
class Node {
constructor (value, next = null) {
this.value = value;
this.next = next;
}
}
class LinkedList {
constructor(head) {
this.head = head;
}
[Symbol.iterator]() {
let next = this.head;
return {
next() {
const current = next;
next = current?.next;
return {
value: current?.value,
done: current === null
}
}
}
}
}
const links =
new Node(1,
new Node(2,
new Node(3,
new Node(4,
new Node(5)))));
const list = new LinkedList(links);
function doMath(a, b, c, d, e) {
return a + b + c + d + e;
}
console.info(doMath(...list));
и так далее.
Итерации широко используются в JavaScript. Они поддерживают множество (на данный момент) базовых функций языка.
Однако, что еще более важно, они допускают различные способы итерации, которые могут даже обрабатывать бесконечные источники данных (например, чтение потока данных) или, возможно, даже читать очень большой набор данных (например, файл размером в гигабайты), требующий всего этого. сразу (например, взять чанк -> обработать -> взять другой чанк и т. д.).
Это можно сделать без итераторов. Однако не без необходимости каждый раз заново изобретать что-то близкое к итерируемому протоколу.
Генераторы в JavaScript создают итерации. Это делает их полезными для работы со всем, что обрабатывает итерируемый протокол. Например, генератор значительно упрощает создание итерируемого списка. От:
[Symbol.iterator]() {
let next = this.head;
return {
next() {
const current = next;
next = current?.next;
return {
value: current?.value,
done: current === null
}
}
}
}
к гораздо более удобоваримому:
*[Symbol.iterator]() {
let current = this.head;
while(current !== null) {
yield current.value;
current = current.next;
}
}
class Node {
constructor (value, next = null) {
this.value = value;
this.next = next;
}
}
class LinkedList {
constructor(head) {
this.head = head;
}
*[Symbol.iterator]() {
let current = this.head;
while(current !== null) {
yield current.value;
current = current.next;
}
}
}
const links =
new Node(1,
new Node(2,
new Node(3,
new Node(4,
new Node(5)))));
const list = new LinkedList(links);
for(const item of list) {
console.info(`do something with ${item}`);
}
Но более того, генераторы могут напрямую подключаться к любому существующему использованию итераций в JavaScript:
Перечисление:
function *generator() {
yield 1;
yield 2;
yield 3;
yield 4;
yield 5;
}
for(const item of generator()) {
console.info(`do something with ${item}`);
}
Задание на деструктуризацию:
function *generator() {
yield 1;
yield 2;
yield 3;
yield 4;
yield 5;
}
const [a, b, ...rest] = generator();
console.info(a, b, rest);
Синтаксис распространения:
function doMath(a, b, c, d, e) {
return a + b + c + d + e;
}
function *generator() {
yield 1;
yield 2;
yield 3;
yield 4;
yield 5;
}
console.info(doMath(...generator()));
Помимо прямого подключения к JavaScript, генераторы также являются сопрограммами, позволяющими приостанавливать и продолжать выполнение функций. Для этого есть два огромных преимущества:
Я также читал, что функции-генераторы полезны для создания бесконечных потоков данных, таких как последовательность Фибоначчи. Однако я могу добиться того же результата, используя цикл while и две переменные.
Вы можете сделать это легко
function fibonacci() {
let a = 0, b = 1;
const result = [];
result.push(a);
result.push(b);
while (true) {
const next = a + b;
result.push(next);
a = b;
b = next;
}
return result;
}
Проблема в том, что это бесполезная функция. Если его вызвать, это приведет к бесконечному выполнению. Хотя показанная функция генератора не будет4:
function* fibonacci() {
let a = 0, b = 1;
while (true) {
yield a;
const next = a + b;
a = b;
b = next;
}
}
const fib = fibonacci();
console.info(fib.next().value);
console.info(fib.next().value);
console.info(fib.next().value);
console.info(fib.next().value);
console.info(fib.next().value);
console.info(fib.next().value);
Вариант без генератора необходимо будет изменить, чтобы он завершился, чтобы быть полезным. Но даже с этой модификацией существует несколько вариантов использования, каждое из которых потребует отдельной модификации:
Реализованный генератором Фибоначчи не нужно изменять, чтобы справиться с ними. С помощью пары помощников5 мы можем получить любое значение, которое нам действительно нужно:
function* skip(n, iterator) {
for (let i = 0; i < n; i++) //skip n
iterator.next();
yield* iterator; //return the rest
}
function* take(n, iterator) {
for (let i = 0; i < n; i++)
yield iterator.next().value;
}
function* fibonacci() {
let a = 0, b = 1;
while (true) {
yield a;
const next = a + b;
a = b;
b = next;
}
}
const fib = fibonacci();
//skip the first 10, take the next 5
const it = take(5,
skip(10, fib)
);
for(const item of it) {
console.info(`do something with ${item}`);
}
Те же skip
и take
можно использовать в любой итерации. У нас могла бы быть какая-то функция генерации идентификаторов:
function* skip(n, iterator) {
for (let i = 0; i < n; i++) //skip n
iterator.next();
yield* iterator; //return the rest
}
function* take(n, iterator) {
for (let i = 0; i < n; i++)
yield iterator.next().value;
}
function* idGenerator() {
let i = 1;
while (true) {
yield `Some_random_id_${i}`;
++i;
}
}
const idGen = idGenerator();
//skip the first 10, take the next 5
const it = take(5,
skip(10, idGen)
);
for(const item of it) {
console.info(`do something with ${item}`);
}
Или даже объекты, реализующие iterable6 и другие итерируемые структуры:
function* skip(n, iterator) {
for (let i = 0; i < n; i++) //skip n
iterator.next();
yield* iterator; //return the rest
}
function* take(n, iterator) {
for (let i = 0; i < n; i++)
yield iterator.next().value;
}
const arr = ["a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m",
"n", "o", "p", "q", "r", "s", "t", "u", "v", "w", "x", "y", "z"];
const arrayIterator = arr[Symbol.iterator]();
//skip the first 10, take the next 5
const it = take(5,
skip(10, arrayIterator)
);
for(const item of it) {
console.info(`do something with ${item}`);
}
Существует множество очень универсальных помощников, которые можно использовать для любой итерации, а реализовать их в качестве генераторов очень просто5:
function* skip(n, iterator) {
for (let i = 0; i < n; i++) //skip n
iterator.next();
yield* iterator; //return the rest
}
function* take(n, iterator) {
for (let i = 0; i < n; i++)
yield iterator.next().value;
}
function* map(mappingFn, iterator) {
for (value of iterator)
yield mappingFn(value);
}
function* filter(predicate, iterator) {
for (value of iterator)
if (predicate(value))
yield value;
}
function* generator() {
let i = 1;
while (true) {
yield i;
++i;
}
}
const gen = generator();
//square the 2001th to 2006th even number
const it = map(x => x*x,
take(10,
skip(2000,
filter(x => x % 2 === 0, gen)
)
)
);
for(const item of it) {
console.info(`do something with ${item}`);
}
Можете ли вы сделать то же самое с циклом? Конечно. Но вам придется переопределять его снова и снова для использования различных источников данных — массивов, карт, наборов, чтения файлов, получения значений из базы данных и т. д. Рассмотрим, например, случай попытки использования большого файла CSV: если вы хотите читать и обрабатывать построчно (загружая весь файл в память) можно. Но если он реализован как генератор, то его можно легко использовать с помощью чего-либо еще, использующего итераторы/генераторы:
//take 10 records that fulfil some criteria.
//A CSV line has to be read and processed to calculate the data to filter on:
const data = take(10,
filter(
record => record.someCalculatedField === 42,
map(
line => convertToRecord(line),
readCsvGeneratorFunction("some_file.csv")
)
);
Это тривиально, учитывая существующую инфраструктуру для обработки любых итераций/генераторов.
Самостоятельная реализация помощников вскоре вообще отпадет, поскольку помощники-итераторы скоро будут включены в основной язык. При использовании браузером эквивалентом будет следующее:
//square the 2001th to 2006th even number
const it = gen
.filter(x => x % 2 === 0)
.skip(2000)
.take(10)
.map(x => x*x);
//take 10 records that fulfil some criteria.
//A CSV line has to be read and processed to calculate the data to filter on:
const data = readCsvGeneratorFunction("some_file.csv")
.map(line => convertToRecord(line))
.filter(record => record.someCalculatedField === 42)
.take(10);
Однако в особых случаях все же может потребоваться введение нестандартного (для JavaScript, но, возможно, полезного для данного проекта) помощника-итератора.
async
/await
Это может показаться удивительным, но async/await и генераторы неразрывно связаны:
Чтобы реализовать любой из них, вам, по сути, нужно реализовать оба. Основное требование — возможность приостанавливать и возобновлять выполнение функции.
Фактически, асинхронные функции можно реализовать как генераторы. Когда был выпущен ES2015 (ES6), генераторы были включены, но await
был выпущен как часть ES2017. Между тем, обычным способом решения этой проблемы была транспиляция кода. Данный код типа:
async function foo() {
await doAsyncStuff();
}
Если транспилировать с помощью TypeScript против ES2015, результат будет следующим:
"use strict";
var __awaiter = (this && this.__awaiter) || function (thisArg, _arguments, P, generator) {
function adopt(value) { return value instanceof P ? value : new P(function (resolve) { resolve(value); }); }
return new (P || (P = Promise))(function (resolve, reject) {
function fulfilled(value) { try { step(generator.next(value)); } catch (e) { reject(e); } }
function rejected(value) { try { step(generator["throw"](value)); } catch (e) { reject(e); } }
function step(result) { result.done ? resolve(result.value) : adopt(result.value).then(fulfilled, rejected); }
step((generator = generator.apply(thisArg, _arguments || [])).next());
});
};
function foo() {
return __awaiter(this, void 0, void 0, function* () {
yield doAsyncStuff();
});
}
в то время как Бабель производит:
function asyncGeneratorStep(n, t, e, r, o, a, c) { try { var i = n[a](c), u = i.value; } catch (n) { return void e(n); } i.done ? t(u) : Promise.resolve(u).then(r, o); }
function _asyncToGenerator(n) { return function () { var t = this, e = arguments; return new Promise(function (r, o) { var a = n.apply(t, e); function _next(n) { asyncGeneratorStep(a, r, o, _next, _throw, "next", n); } function _throw(n) { asyncGeneratorStep(a, r, o, _next, _throw, "throw", n); } _next(void 0); }); }; }
function foo() {
return _foo.apply(this, arguments);
}
function _foo() {
_foo = _asyncToGenerator(function* () {
yield doAsyncStuff();
});
return _foo.apply(this, arguments);
}
Оба опираются на генераторы, чтобы добиться того же, что и async/await.
1 Также важные, но не связанные напрямую с генераторами: Протоколы итераций.
2 Реализация намеренно немного многословна.
3 Когда не используется в литералах объектов, например, foo = { a: 1, ...bar }
.
4 Если только код не попытается использовать все сразу. Что можно предотвратить. Это не для функции, не являющейся генератором, без изменения ее работы.
5Реализация намеренно упрощена. На самом деле им также следует проверять, не исчерпан ли итератор на каждом шаге. Это немного, но суть логики – это то, что важно. Поиск правильной реализации оставлен читателю в качестве упражнения. сравнить и сопоставить с полной реализацией без использования функций генератора.
6 Здесь для наглядности используется массив. Хотя arr.slice(n, n+m)
можно использовать вместо take(m, skip(n, arr)
, первый все равно должен возвращать массив, который может быть огромным для больших значений m
. При этом последнему не обязательно материализовать всю коллекцию сразу.