Proxmox: come terminare un backup bloccato causa NFS

| |

Lo storage NFS connesso al tuo Proxmox smette di rispondere e, durante l’operazione di backup delle macchine e dei container, questo si traduce in backup completamente bloccato e nodo che risponde in tempi non più adeguati perché impegnato a fare altro che non riuscirà a terminare, un vicolo cieco.
Dovrebbe succedere? No. Succede? , talvolta. Il forum di Proxmox (e non solo) è pieno di discussioni del genere. Tutte le discussioni hanno spesso in comune un dettaglio non trascurabile: sembra che nessuno sia in grado di terminare l’operazione e liberare il sistema tenuto in ostaggio.

Proxmox: come bloccare un backup bloccato causa NFS

Respira. La cosa è fattibile ma bisogna fare tutto con attenzione e rispettando un ordine preciso.

Per prima cosa, fai in maniera tale da rimettere in piedi lo storage NFS. Riavvia i servizi necessari affinché questo torni a rispondere correttamente e funzionare. In alcuni casi (rari secondo alcuni amministratori Proxmox, pari a zero per l’esperienza pregressa del sottoscritto), questa semplice operazione permette al task di backup di completare il suo lavoro e quindi permettere al nodo di tornare all’operatività normale, senza ulteriori intoppi.

Puoi essere certo del fatto che la colpa sia attribuibile allo storage NFS nel momento in cui, andando a lanciare un semplice ls -la di /mnt/pve, otterrai una risposta ovviamente errata in corrispondenza del mountpoint che utilizzi come destinazione dei tuoi backup. Agevolo screenshot preso dalla mia configurazione, dove “groot” è la casa dei backup del mio nodo Proxmox casalingo:

Proxmox: come un backup bloccato causa NFS

Se il riavvio dei servizi NFS, però, come sospetto, non dovesse bastare, allora ti toccherà andarci giù un pelo più pesante, ma senza riavviare in maniera forzata il nodo (come spesso ho visto consigliare sul forum di Proxmox).

  • Individua l’ID della VM (o del container LXC) che l’operazione di backup stava provando a portare al sicuro. Farlo è semplice: apri l’interfaccia web di Proxmox e fai doppio clic sul task di backup in corso che hai nella parte bassa della finestra (Backup Job), ti si aprirà il log, a quel punto individua la riga relativa all’ID macchina. Ti faccio un esempio pratico: INFO: Starting Backup of VM 100 (qemu).
  • Se la macchina, come spero, ha a bordo l’agente QEMU, da terminale lancia l’unlock per sbloccarla: qm unlock 100.
  • Cerca il PID assegnato al processo di backup e terminalo: ps aux | grep vzdump e, ottenuto il suo PID, kill -9 000000.
  • Termina la connessione NFS in maniera forzata e ferma il processo di backup, sempre da terminale: umount -f -l /mnt/pve/groot && vzdump --stop (ovviamente, al posto di groot dovrai mettere il nome del tuo mountpoint).

Porta pazienza, potrebbe servire un minutino circa affinché l’operazione venga eseguita e il processo di backup venga finalmente terminato, restituendoti il tuo nodo e i tempi di risposta nettamente più rapidi ai quali sei abituato.

In caso di dubbi, come al solito, hai l’area commenti a tua disposizione.

#KeepItSimple


Credits:
forum.proxmox.com/threads/cannot-kill-vzdump-process.55038
forum.proxmox.com/threads/backup-job-is-stuck-and-i-cannot-stop-it-or-even-kill-it.120835/page-2
forum.proxmox.com/threads/cant-kill-backup-process.43174/#post-356086
Immagine di copertina: benjamin lehman on Unsplash.

Correzioni, suggerimenti? Lascia un commento nell'apposita area qui di seguito o contattami privatamente.
Ti è piaciuto l'articolo? Offrimi un caffè! ☕ :-)

Subscribe
Notify of
guest

This site uses Akismet to reduce spam. Learn how your comment data is processed.

0 Commenti
Oldest
Newest Most Voted
Inline Feedbacks
View all comments