Closed RotaercAH closed 4 weeks ago
你好,运行任务的Pod不是完全独立的,Pod的生命周期和运行的任务紧密相关。根据你的需求,在delete pod以后,此时任务也执行失败了,此时需要重新启动任务。
你好,运行任务的Pod不是完全独立的,Pod的生命周期和运行的任务紧密相关。根据你的需求,在delete pod以后,此时任务也执行失败了,此时需要重新启动任务。
我delete掉kuscia-autonomy-alice pod 也会影响secretflow-task 的pod运行吗? 那是否意味着如果我在创建 Deployment的时候如果启动多个(例如两个)kuscia-autonomy-alice pod就可以避免出现单点故障的问题。 具体来说,例如我启动了两个kuscia-autonomy-alice pod,然后启动了一个任务,任务在集群中拉起了一个secretflow-task pod。此时我delete掉其中一个kuscia-autonomy-alice pod,任务仍然可以在另一个没有被delete掉的kuscia-autonomy-alice pod的控制下完成。
你好,运行任务的Pod不是完全独立的,Pod的生命周期和运行的任务紧密相关。根据你的需求,在delete pod以后,此时任务也执行失败了,此时需要重新启动任务。
经过测试发现即使启动了两个kuscia-autonomy-alice pod,delete掉发起任务的kuscia-autonomy-alice pod,任务还是会运行失败 通过设置多个pod replicas启动多个pod的目的是为了避免单点故障,有没有办法可以使得在有多个kuscia-autonomy-alice pod的条件下,即使kuscia-autonomy-alice pod挂掉一个,跑任务的secretflow-task pod仍然不受影响,可以把作业执行完成呢?
Stale issue message. Please comment to remove stale tag. Otherwise this issue will be closed soon.
Issue Type
Feature
Search for existing issues similar to yours
Yes
Kuscia Version
kuscia v0.10.0b0
Link to Relevant Documentation
No response
Question Details