[Airflow] Release Notes - 2.6.x
안녕하세요 마개입니다.
2023년 04월 30일에 적용된 Airflow 2.6 버전에서의 변경사항은 무엇이 있었는지 공식 홈페이지를 통해 알아봅니다. 메이저한 변경사항에 대해만 알아보고 버그 수정 부분은 생략합니다. 자세한 것은 공식 홈페이지를 통해 확인합니다.
- 참고 URL : 공식 홈페이지
메인 변경사항
1. file task 로그 디렉토리에 대한 디폴트 권한이 “owner + group”가 수정가능하도록 변경됩니다. (2.6.0)
- 기존 디폴트 값은 다른 사람들도 수정할 수 있었고 유저는 선택해야 했습니다.
2. SLA 콜백은 더 이상 DAG 프로세서 매니저의 큐에 파일을 추가하지 않습니다. (2.6.0)
- DAG processor 매니저가 바쁜 것을 방지하기 위해 SLA 콜백을 이용하지 않습니다.
3. “scheduler.tasks.running” 게이지는 더 이상 존재하지 않습니다. (2.6.0)
- 이 게이지는 작동한적이 없고 항상 값이 0이었습니다. 이 메트릭의 정확한 값을 갖는 것은 복잡했기에 제거했습니다.
4. run_id로 사용할 수 있는 패턴이 ^[A-Za-z0-9_.~:+-]+$
로 변경되었습니다. (2.6.3)
- 기존에는
run_id
에 대한 특별한 validation이 없었는데scheduler
섹션에allowed_run_id_pattern
을 이용하여 validation 을 구성할 수 있습니다.
기능 개선
1. 실행중인 속성은 오직 속성 뷰에서만 볼 수 있습니다. (2.6.0)
- 이전에는 기본 속성이 상단에 표기되었지만 기본 속성이 오버라이드되는지 아닌지 확실치 않았습니다.
기타 개선
1. next_run_calculation 백오프 시 OverflowError를 처리합니다. (2.6.0)
- 최대 Task 재시도 지연 값은 기본 값이 24시간 (86,400초)로 설정되어 있습니다.
core.max_task_retry_delay
파라미터를 이용해서 변경할 수 있습니다.
2. Hive 매크로를 provider로 이동 (2.6.0)
- Hive Provider가 설치되어 있을 때만 Hive 매크로 (
hive.max_partition
,hive.closest_ds_partition
)을 이용할 수 있습니다.
3. FIPS v2에 대한 캐싱 해시 방법을 지원하도록 앱이 업데이트되었습니다. (2.6.0)
- Python 3.9 이상으로 실행되는 Airflow를 사용할 때 FIPS를 준수할 수 있도록 업데이트되었습니다. 이는 신규 옵션인
caching_hash_method
를 지원합니다.