volcano ECS开机逻辑修改记录

修改ECS开机逻辑问题记录 修改原因 之前的ECS开机在enqueue阶段实现。逻辑为:如果作业是pending状态,并且作业所需的资源大于集群的空闲资源。这个时候就为该任务开启一台ECS节点。 假设作业所需的资源为R1,目前集群的空闲资源为R2,在之前的逻辑中会选择一个资源为R3的ECS节点,使得R3 + R2 >= R1。这样就出现了一个问题,我们的想法是使得作业能在新开启的节点上运行的(目前只考虑单机作业), 即新开启的ECS必须满足R3 >= R1, 这样看来,之前的开机逻辑是存在问题的,在实际中我们也碰到了这种情况。 所以我们需要将ECS开机逻辑进行更改。 ...

October 10, 2020 · 1 min · 126 words · eonh1u