卓越飞翔博客卓越飞翔博客

卓越飞翔 - 您值得收藏的技术分享站
技术文章34433本站已运行393

在 Cloud Composer 中将同一运算符作为多个任务执行

在 cloud composer 中将同一运算符作为多个任务执行

问题内容

我在 airflow 中有一个使用 cloud composer 执行的 pythonoperator:

with DAG(
    dag_id = config['dag_id'],
    schedule_interval = config['schedule_interval'],
    default_args = default_args
    ) as dag:
    
    generate_data_task = PythonOperator(
        task_id = 'generate_dummy_data',
        python_callable = generate_data,
        dag = dag
    )

generate_data() 函数将随机生成的唯一命名的 csv 文件写入包含一些数据的存储桶中。按原样执行效果很好,但我想并行多次执行同一任务。如果我指定并行执行 10 次,我预计会在存储桶中写入 10 个文件。我尝试过并发和task_concurrency,但得到了相同的结果。

这可以在 cloud composer 之上使用 airflow 实现吗?


正确答案


使用动态任务映射:

generate_data_task = PythonOperator.partial(
        task_id = 'generate_dummy_data',
        python_callable = generate_data,
        dag = dag
    ).expand(op_args=[[]] * 10)
卓越飞翔博客
上一篇: 实例化接口
下一篇: 返回列表
留言与评论(共有 0 条评论)
   
验证码:
隐藏边栏