Apache Pig — это платформа для анализа больших наборов данных, состоящая из языка высокого уровня для выражения программ анализа данных, в сочетании с инфраструктурой для оценки этих программ. Важным свойством программ Pig является то, что их структура поддается существенному распараллеливанию, что позволяет им обрабатывать очень большие наборы данных.