停電復旧作業
今年の停電は短く、昨日一日で終わったらしいので復旧作業をしに行ってきました。
とはいっても研究室の普及作業自体はなまずんがやってくれていたので、個人ノードとか僕が管理してる機械学習ノードの復旧作業とかやってました。
個人ノードは特に問題なく立ち上がりました。
機械学習ノードに関してはなぜかnvidia-dockerが壊れました。nvidia-dockerのボリューム周りの権限がおかしくなってて、コンテナが立ち上がらなくなってしまいました。停電作業時にコンテナを終了せずに、ホストノードを殺してしまったのがよくなかったかもしれないです。
nvidia-dockerの復旧方法を調べながら色々やっていたのですが、途中複数のサイトを参考に作業してしまった影響で取り返しがつかなくなってきてしまったのであきらめてOS自体を再インストールして対応することにしました。
これは結局終わらんかったので明日引き続きやります。
研究室のラック間のハブを新しくした影響で、ハブが余ったので僕の使っていたくっそ古びたハブを交換したら9倍くらい速度が出るようになりました。
僕の使ってたハブが100Mbpsだったというオチなので、ハブはちゃんと1Gbps対応してるかどうか確認しような