Skip to content

对910b4-1的单卡虚拟化之后,无法对vnpu进行回收,无法继续切分和调度该卡。 #43

@ZhanNicky

Description

@ZhanNicky

对一张卡切分完所有显存之后,出现无法再分配资源的情况,初步排查怀疑是切分之后,vnpu中的进程没有停止,出现了阻塞。

Image

其中vnpu也出现了奇怪的状态,status一直是1,containerID 也是fffffffffff:

Image

排查对应的进程,出现了dev_sq_task这样的D进程:

Image

以及出现该单卡也无法使用。这个该如何解决?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions