Troubleshooting

การตรวจสอบสถานะของ Container

$ sudo docker ps
สำหรับดูสถานะการใช้งานของ Docker Container ว่ามี container ไหนกำลังทำงานอยู่

การตรวจสอบสถานะของ Server

$ sudo htop
สำหรับดูสถานะการทำงานของ CPU และ RAM ของ Server ว่า CPU และ RAM มีการใช้งานเท่าไหร่

การดูสถานะการใช้งานของ GPU

$ sudo nvidia-smi
สำหรับการทำงาน GPU และ RAM ของ GPU ที่กำลังใช้งาน

การ Restart container

$ sudo docker restart [container name]
เพื่อการ Restart Container
Warnings
    1.
    ไม่ควรลบ Container เนื่องจากจะทำให้ License เดิมที่ติดตั้งอยู่ไม่สามารถใช้งานได้และจำเป็นต้อง Activate License ใหม่อีกครั้ง
    2.
    Version ของ CUDA ควรเป็น Version 11 เนื่องจาก Version ที่ใหม่กว่าจะเกิดปัญหา Backward Compatibility
    3.
    ควรทำการ Restart Container ทุกๆ 7 วัน
    4.
    ถ้าหากมีการ Deploy Application ที่ใช้งาน GPU อื่นๆเพิ่มขึ้นมาภายในภายหลังจะเกิดปัญหาการจัดสรร Memory ของ GPU ได้
    5.
    ควรปิดการ Update ของ OS เพื่อป้องการ Update แล้วจะทำให้การทำงานของ Container ผิดพลาด
Last modified 22d ago