Apache Airflow | |
---|---|
![]() | |
Тип | проект Фонда Apache[вд] и Python-библиотека[вд] |
Разработчик | Apache Software Foundation |
Написана на | Python |
Последняя версия | 2.9.0 (24 апреля 2024) |
Репозиторий | github.com/apache/airflow |
Лицензия | Apache License 2.0[1] и лицензия Apache |
Сайт | airflow.apache.org (англ.) |
![]() |
Apache Airflow — открытое программное обеспечение для создания, выполнения, мониторинга и оркестровки потоков операций по обработке данных.
Изначально разработан в Airbnb в октябре 2014 году[2][3]. В марте 2016 года стал проектом Apache Incubator, в январе 2019 года — проектом верхнего уровня Apache Software Foundation в январе 2019 года.
Написан на Python, потоки операций и зависимости между ними кодируются также на Python по принципу «конфигурация как код» (в отличие от таких систем, как Oozie и Azkaban, использующих файлы конфигурации[4]). Для оркестровки потоков операций используется представление в виде направленного ациклического графа (DAG); собранная в граф группа операций может запускаться либо по определённому расписанию (например, ежечасно или ежедневно), либо по событию (например, появлению файла в Hive[5]).
Airflow по подписке предоставляется многими публично-облачными провайдерами, в том числе Google Cloud Platform (Cloud Composer)[6], Amazon Web Services (с ноября 2020 года)[7] и Yandex Cloud (с сентября 2023 года)[8].