マイニング中にマイナーが停止する原因と前兆と対応方法
この記事で紹介していること
正常動作していたマイナーが停止!!その原因は?
昨日までちゃんと動いていたのに
- PCが再起動を繰り返している
- GPUを認識しない
- 再起動のたびに認識するGPUの数が変わる
こんな経験ありませんか?
私もここ2年ほどマイニングをしていますが、2月に一度のペースでこの現象にあいました。
動作していたということは、機器的にはマイニングできる状態のはず、ということでソフトウェアを疑いがち。
でも、私の経験ではそうではありませんでした。
マイニングで一番大切なのは電源管理
マイナーが動作しないときの原因第1位はズバリ 電源 です。
電源が不足していたり、供給が不安定ですと、マイナーは不安定になったり、停止します。
そう思ったあなた!
ホントはわかってますよね? 考えたくないだけじゃないですか?
さぁ!現実に目を向けましょう!
電源不調の前兆
私は Phoenix Miner を利用していますが、Phoenix Miner は定期的にGPUの温度を報告してくれますが、以下のようにおかしな数値を報告することがあります。
こんなとき、私のマイナーは再起動を繰り返しました。
511℃!!!! すでに燃えててもいい温度です。
明らかに温度検知機能に障害が発生しています。
電源の接合部を見てみましょう
こんなときはだいたいは電源の接合部が不良です。
単なる接触不良かもしれませんが、私の経験上、100%次の状態です。
しかも、私の経験上 100% ATX電源側のプラグが焼けてます。
GOLD認証の電源なら焼けたりしない?
そんなことありません。前記までで紹介した電源は CORSAIR RM1000x (80PLUS GOLD認証) です。
ケーブルは純正だし、1つのケーブルから接続する機器は2つまでにしています。
それでも焼けます。
焼けてるケーブルを見つけたときの対応
黙って交換しましょう。
ATX電源本体側のプラグもイカれてますので、別のプラグをに差しましょう。
運が良ければ電源供給できるかもしれませんが、一度焼けたプラグは新品当時とはコンディションが異なります。
焼けたプラスチックがこびりついているかもしれませんし、しっかり差し込めないかもしれません。
熱をもって再度焼ける、あるいは発火の可能性もあるので、自己責任で。。。。
焼けないようにしたほうがいいこと
私がやっていることを紹介します。
- 電源接合部にはファンがないので、扇風機などで常時冷やす(気休め程度です)
- 隣接するコネクタを利用しない(1個ずつ間隔をあける)
- 電源の機器や、1つのケーブルから接続するGPUなどの機器は電源出力とGPUや接続機器の消費電力を確認して適切に。(ご指摘をいただき、修正しました)
- サージを使う(落雷停電で給電不良となったとき、過電流になる恐れあり、いただいたコメントを参照ください)
- 乾燥させる(これで対策しています)
- ホコリは定期的に取り除く(これで週一実施)
特に、ブレーカーが落ちたり、掃除のために電源を切ったりするなど、電源の状態が大きく変わるタイミングで焼けのリスクがあります。
OSの再起動程度ではあまり発生しませんが、電源OFFを伴うと、焼けてた、ということを多く経験しています。
適切な電力とは(ご指摘をいただいて項目追加)
この記事でコメントをいただきました。
電圧・電流について、配慮が至らなかったので、啓発のため記載を追加することにしました。
対策 | 理由 |
---|---|
GPUの消費電量に対し、電源の出力は少し余裕をもったものを利用する | 停電時など給電状況の変化で、過電流になって許容オーバーになり、ケーブル焼けや機器故障につながる恐れあり |
まとめ
マイニングは電源管理が一番大切です。
それは、GPUに十分な電力を供給するだけでなく、外的要因への対応も含む言葉だと痛感しました。
電源管理とは、「十分な電力」を「安全」にかつ「継続的」に供給することだと気付けました。
そのためには部品の劣化対応やメンテなどが大切です。
また、コメントでご指摘をいただき、電源の出力とGPUなどの接続機器の消費電力をちゃんと確認しなければならないことも、勉強になりました。
これを意識しないのが一番の落ち度だったと思いました。
こんなのちょっと考えればわかるんですけどね。
これから日本は夏になります。
連日の雷雨で、農作物に打撃とのニュースも聞きますが、マイナーにも打撃があるようです。
マイナーの皆さん。どうぞご安全に・・・・
「マイニングがおかしいときは、100%コネクタが焼けてます・・・」って、なんすかそれ?
あなた何か根本的に間違ってません? 電気の知識とか、少しも無いのですか?
>電源接合部にはファンがないので、扇風機などで常時冷やす
扇風機で冷やさなければあの頑丈なMolexコネクタが焼けたり溶けたりしてしまうって、明らかな過電流か、そうでなければ、コネクタがきちんと奥まで差し込まれていない状態で使っていたとか、そんな感じじゃないのですか?
>隣接するコネクタを利用しない(1個ずつ間隔をあける)
電源メーカー側では定格電流内であれば問題無いようにコネクタ配置しているはずですから、ここが問題ではないですよ。
>1つのケーブルから接続するGPUなどの機器は2つまで
「1つ」とか「2つ」とか、数の問題じゃないですよ。
GTX1660とRTX3090とでは4倍も5倍も流れる電流が違いますよ。
電源供給ラインを分岐するのであれば、使用しているGPUが消費する電力、分岐前と後での電流の分散や集合をきちんと考えて配線してください。
数で決めているから毎回こういう事になっちゃうんですよ。
>サージを使う(落雷停電のときに焼けてたことがあります)
全然違うでしょ。
それともあなたの家は実は落雷多発地帯で、雷の電力でいつもコネクタが焼けているとか?
>乾燥させる(これでも十分です)
いや、十分じゃないでしょ。
焼けたり溶けるするのに湿度はほとんど関係ありません。
>ホコリは定期的に取り除く(これで週一実施)
あなたの焼け落ち対策の中で間違っていないのはこれくらいでしょうか?
水分を含有できるほど大量の綿ぼこりがコネクタ近辺や部品に付着していると、そこで信号が漏電してハイインピーダンス受けの部品が誤動作する事はよくあります。
こういう無知な方が無理にマイニングして火災をおこしたり、更に無知な人達を集めてに危険な嘘を教えていると思うと、とてもおっかないです。
ご指摘ありがとうございます。
確かに、電気に関する知識はあまりないですね。ごもっともなご意見だと思います。
数で決めているからこうなる、は確かにその通りですね。
数で決めるというのは、知識のない人にとってはわかりやすく、効果的な方法だと思ったのですが、電力を意識せず単純に数で決めるのは、確かに危険性があるケースもありますね。
説明する上で、電源側の出力と、GPUの消費電力を意識すべきなのは、記事に反映しようと思います。
落雷については、マイニングにせよ他の機器にせよ、事実として経験したことなので、間違ってないかなと思っています。
もちろん検証はしていませんし、検証できませんが、一般的な対策としては間違っていないと思っています。
乾燥・ホコリについては相関関係があると思っています。
乾燥だけで十分というのは確かに誤解のある説明ですね。改善しますね。
記事にしてこうやってご指摘をいただくと、私も勉強になります。
ありがとうございました。
だいぶ理解して頂けたようで少し安心しました。
落雷については、
「家に雷が落ちて雷の電力そのもので機器が壊れた、焼けた」
というのはまず考えなくて良いでしょう。
自宅の避雷針以外の部分に雷が落ちて機器が壊れる確率より、宝くじで三億円あたる確率の方が高いと思います。
実際に落雷で機器が壊れてしまうのは、
1) 近所に落雷→電線焼失や送電施設の安全装置によって近隣が停電
ここはわかりますよね?
2) 停電の瞬間から、PC電源の PCIe 12V の電圧は、12V から 0V に向かってゆっくり落ちてくる
(電源ラインは大きなコンデンサが入っていますので、こういう動作になります)
3) 停電前、例えばグラボは200W消費していたとします。電源は12Vですから、この時に電源ラインには約16.7A流れています。
停電直後のある瞬間、グラボから見ると、供給されている電源電圧が12Vから(例えば)10Vに落ちてしまう瞬間があります。
するとグラボはそれでも200Wの仕事をするために、10Vの電源から20Aの電流を流して200Wで仕事を続けようとします。
これが5Vとか1Vとかにまで落ちてしまえばもう動作できませんけど、例えば10V以上12V未満の間で電圧が不安定な期間は、電圧が低いほど、電源ラインには通常よりも大きな電流が流れてしまうのです。
(電線やコネクタで発生する熱量は素直に流れる電流に比例します。電圧そのものは影響しません)
元々ギリギリでなんとか溶けずに動いている状態ですと、この瞬間にコネクタピンが熱に負けて溶けてしまうという事も考えられます。
あともっと怖いのは停電した後にすぐに通電再開した時です。
瞬間的な停電が1秒もあれば、PCならばシャットダウンされて再稼働しませんけど、じゃぁこの瞬断が0.5秒なら? 0.1秒なら・・と考えていくと、瞬断時間が短ければシャットダウンされずに動き続けてしまう可能性があります。
先ほどのように、例えば停電の直後に10Vまで電源電圧が下がってしまっていてGPUが20A消費している時、ここで急に通電が再開して一瞬で電源電圧が12Vに戻った場合、GPUのレギュレータによる電流絞り込みが時間的に追い付かない場合も出て来ます。
すると10V 20A で動作しているところに急に12Vかかっちゃいますから、今度は瞬間的に24Aくらい流れてしまう事があります。
何も無ければPCIe電源線には16.7Aまでしか流れないところに、停電や瞬断が発生すると、20Aとか24A流れてしまう可能性がある訳です。
コンデンサ容量やレギュレータの特性によっては、もっと流れてしまう事もあるでしょう。
落雷停電で部品やコネクタが焼ける原因の大半は、こういった一連の動作が原因です。
落雷しなくても、負荷が高い時にいきなり電源切ったり、ブレーカー落ちたりすると、同じような事が起きます。
なので雷サージ防止コンセントってのはただの気休めです。
(昔、PCをモデムでアナログの電話線に繋いでいた時代は、電話線に落ちた雷によってモデムやPCまで高電圧が流れて壊れるという事故があって話題になり、それで雷サージ防止付き電源タップが流行し始めました)
厳しいご指摘から、再度閲覧に来てくれるなんて感激です!!
ありがとうございます。
さらに、詳しい内容の記載まで、ありがとうございます。
なるほど、ケーブルが焼けるメカニズムがよくわかりました。
同時に勉強不足だったことを自覚しました。
特に「電力を考えて」の一言で済ますのではなく、電源の瞬断などを考慮して、機器を保全するアドバイスが、この記事でできれば、さらに有益ですね。
いただいた内容から、もう一度記事をブラッシュアップしたいと思います。
今後ともよろしくお願いします!