東証「システムダウンの原因がわかりました メモリーが故障してました 再起動したら直った」


1:  2020/10/01(木) 18:18:07.35 ID:RdbLwPPQ0● BE:403084634-2BP(2000)
システム障害の原因については「ディスク装置のメモリー故障が発生した」と述べ、 外部からの不正アクセスではなく、機器の不具合だったと説明。

https://www.sankei.com/politics/news/201001/plt2010010024-n1.html


2:  2020/10/01(木) 18:18:40.96 ID:du7b4f8T0
なーんじゃそれ


3:  2020/10/01(木) 18:19:07.67 ID:cKSx2aw60
だからたまにはカバー外して中の埃掃除しなさいって言ってるでしょ!


122:  2020/10/01(木) 18:35:54.35 ID:AJLGTkDr0
>>3
虫入ってたりするからな

COBOLのおばちゃまがバグの起源となったから虫を見つけたそうな


659:  2020/10/01(木) 21:20:52.50 ID:0kqVqN070
だから組み立て時には静電気には十分に気を付けて
全裸で組むようにってあれ程言ったでしょうが…(´・ω・`)


4:  2020/10/01(木) 18:19:14.76 ID:yRXl8xVw0
しょぼい。というか冗長構成になってないのか。


6:  2020/10/01(木) 18:19:56.33 ID:mGBVhaw+0
>>4
バックアップもあったけど、繋がらなかったらしい


413:  2020/10/01(木) 19:30:50.91 ID:+vPhHUKj0
>>6
そっちの方がほんとの不具合だな。うまく切り替わっていれば全く問題なく動いてたはずだからな。
故障した方は後から交換すれば解決。


50:  2020/10/01(木) 18:25:20.58 ID:jU29/Vvv0
>>4
おれ調子悪いから代わりに宜しくね、って信号出さないと他のマシンが仕事を引き継がない冗長システムかもしれない。


128:  2020/10/01(木) 18:36:27.55 ID:fISEMRiC0
>>50
リソースが足りないからリソースが足りないという信号を出せないみたいな


132: 2020/10/01(木) 18:36:57.74 ID:IQO//gZh0
>>4
ディスクが死んだらフェイルオーバーするんだけど
メモリだけだと生殺しになってそのままになったんだとw


7: 2020/10/01(木) 18:20:00.90 ID:XK8/FlWw0
どこ製のメモリだよ


10:  2020/10/01(木) 18:20:18.11 ID:gHsJ+vEX0
メモリの相性保証付けないからこうなる


13:  2020/10/01(木) 18:20:36.51 ID:JWEBTr8d0
再起動って一番最初に試す事じゃないのか


31:  2020/10/01(木) 18:22:10.95 ID:dFIOwQI10
>>13
そう簡単に出来るかよ。


184:  2020/10/01(木) 18:45:34.31 ID:LGvLLcsr0
>>13
テメーんちの家電動かしてんのとは違うんだぞ


642:  2020/10/01(木) 21:11:10.63 ID:hFLwKKv90
>>13
サーバー再起動なんてそう簡単にやれるもんじゃない

本来ならば数時間続く障害ならば冗長性担保してるDR機に運用を移して業務の長時間停止はさけた上でメイン側調査を行う話


14:  2020/10/01(木) 18:20:39.95 ID:h8xtaxsw0
重要設備のくせに
貧弱すぎてわろたw


17:  2020/10/01(木) 18:20:45.43 ID:tT/TmlTO0
誤魔化すな
主従系統の切り替えに人的トラブルがあったんだろう

メモリの故障だとしたら再起動で動作したとしても危なくて遠洋に堪えない


23:  2020/10/01(木) 18:21:16.91 ID:XwYwOa/00
RAIDアレイの内蔵メモリの不都合ってことか?
省略が多すぎてわけがわからんな


24:  2020/10/01(木) 18:21:20.50 ID:nrV8s2V/0
まさかハード的問題とは
孫請けブラック企業が残してた脆弱性だとみんな思ってたのに


25:  2020/10/01(木) 18:21:21.85 ID:8nnYgPsU0
原因はわからんけど再起動したら直ったはあるある


419:  2020/10/01(木) 19:33:14.85 ID:+vPhHUKj0
>>25
それだけで動いてしまったらいつまた同じトラブル起きるかわからないからかえって不安になる。


33:  2020/10/01(木) 18:22:24.45 ID:6EUl297P0
再発防止策はないんかよ


35:  2020/10/01(木) 18:22:31.65 ID:E6FA3tV70
夜間再起動ジョブ入れてないの?


254:  2020/10/01(木) 18:58:11.25 ID:ev6h5JbB0
>>35
月初だからそれ、避けてたんじゃね?


37:  2020/10/01(木) 18:22:52.61 ID:eJ7uwcYt0
マジかいな
家庭のゲーム機レベルの解決方法
しかし結構大切なんだな


104:  2020/10/01(木) 18:33:59.28 ID:8dzD210V0
ちゃんとメモリ外して、フーフーしてから入れ直したんだろうな。


44:  2020/10/01(木) 18:23:56.21 ID:6ZFTtvLH0
再起動するとなんでまた普通に動きだすのか
造った我々にも分からんのです


48:  2020/10/01(木) 18:24:49.63 ID:F6y1/WSE0
処分に戦々恐々として、はわわしてるドジっ子はいなかったか。今日一番良いニュースだ


51:  2020/10/01(木) 18:25:23.69 ID:TihzzAlL0
そのメモリーも、もう一度調べろよ。
外部の怪しげなメーカーとすり替えられている可能性もあるぞ。
こういう大規模障害の時って、某国が絡んでくるから気をつけろ。


53:  2020/10/01(木) 18:25:31.66 ID:vRSMOFx50
再起動したら直ったからヨシ!


65:  2020/10/01(木) 18:27:33.68 ID:vg6Bhnct0
このすきになんか余計なもん取り付けたりされないかね


80:  2020/10/01(木) 18:30:27.01 ID:VLTGtigm0
今日一日取引できなかった損失っていくらくらいになるの?


93:  2020/10/01(木) 18:32:23.71 ID:t4+aZ/RM0
ホットスタンバイ
とかの冗長性はなぜ機能しなかったのか
そもそもまともに実装してないのか?


95: 2020/10/01(木) 18:32:51.71 ID:MOWnAKTy0
ディスク装置のメモリー故障って何だろうな?
ストレージシステムのDRAMが故障したのか、SSDやHDDとかのメモリー(SSDならNANDも含む)が故障したのか?


106:  2020/10/01(木) 18:34:09.99 ID:gBtIMUFi0
直ったなんて書いてねーだろ


121:  2020/10/01(木) 18:35:52.68 ID:pS26hY7r0
>>106
システムを再び立ち上げることで、2日は市場を再開すると強調した。って言ってるけど
直ったのか希望的観測か


120:  2020/10/01(木) 18:35:51.10 ID:3YGnonul0
なんか知らんけど中途半端にハードが壊れてて、それでも一見ハードは動いてるっていうのが結構あるんよ

ハードの性能向上のせいでそうなってしまっているのか
ハードの処理能力が限界に達した結果なのか、それが分からない


129:  2020/10/01(木) 18:36:28.14 ID:Z2GvNwBJ0
東証、システム障害で謝罪 詳細な経緯説明、当面は「人的監視」で対応
https://www.itmedia.co.jp/news/articles/2010/01/news156.html

午前7時4分ごろ、「arrowhead」(アローヘッド)と呼ばれる株式売買システムの内部に
2台あるストレージシステム「共有ディスク装置」の1号機に異常が発生したと説明する。
異常の原因は装置のメモリ故障という。

通常であれば1号機に異常が発生しても2号機に自動的に切り替わる設定になっている
はずだったが、何らかの理由で切り替わらなかったとしている。この結果として、
arrowheadの情報配信処理や売買監視システムに異常が発生したことから、
午前8時54分にネットワークを遮断し、取引を停止したとしている。


203:  2020/10/01(木) 18:48:48.38 ID:g3h35e3n0
>>129
共有ディスク装置ってことはETERNUSなのか?
常識的には富士通の方のやつっぽいが…


210:  2020/10/01(木) 18:49:45.07 ID:GdGP/tk10
>>203
まぁそれだろう
NetAppの可能性もなくないけど


227:  2020/10/01(木) 18:53:15.40 ID:g3h35e3n0
>>210
どっちも使ってたことあるけどコントローラの故障なんてお目にかかったことないな
ディスクはしょっちゅう壊れるから上位機種の選別品は壊れなくていいなあと常々思ってたのにw


131:  2020/10/01(木) 18:36:51.55 ID:ZGO2cPTQ0
何のための冗長化だ
肝心な時に機能しないんじゃ契約不履行だろう


169:  2020/10/01(木) 18:41:57.05 ID:KCpNXBes0
詫び株はよ


158:  2020/10/01(木) 18:39:24.79 ID:dTQ+UXuI0
そもそも何で壊れたの?経年劣化?


176:  2020/10/01(木) 18:44:10.88 ID:XAXVeIdk0
>>158
月が変わったのが関係してるかもな。エアコンの設定が変わったとか、
微妙に温度ではなくて湿度が許容範囲内で大きく動いたとかで
メモリ接点のホコリが導通不良を引き起こしたのかも知れない
マシン組むのに熟達した人に、今回問題起こしたサーバーを点検させたらおそらくおかしい箇所が片手じゃ済まないくらい出てくると思う。
つまりそれほどいい加減に組まれたマシンが世の中に出回っているということだ。


211:  2020/10/01(木) 18:49:51.55 ID:dTQ+UXuI0
こんだけ重要なシステムなんだから金に糸目付けずにやって欲しいよね


310:  2020/10/01(木) 19:11:05.02 ID:VXC3HUgW0
んでフェールオーバーが動作しなかった原因は


335:  2020/10/01(木) 19:14:59.37 ID:yK2r64nw0
>>310
恐らくは取引情報以外の非主要部分のデータストアの障害で、監視系はそこを含めてなかったんだろ。
データストアはメンテ用やバッチ処理用の少量のデータを扱う部分だったので、そこまで重要視してなかったしテストも十分でなかったんだろう。


312:  2020/10/01(木) 19:11:29.43 ID:ta1/njUD0
メモリの故障が再起動で直るってどういうことだよ
新品に差し替えて再起動だろ?


336:  2020/10/01(木) 19:15:23.82 ID:Q5sa2isf0
>>312
揮発メモリのビットが運用中に何らかの理由で書き換わって、システムが異常動作することならままある


580:  2020/10/01(木) 20:34:48.07 ID:pgcB/qeh0
記者会見だと二号機に自動的に切り替わるはずが切り替わらかった。
強制的に切り替える方法もあったが、それだと再起動しないとダメだから危険で出来なかった。
でも結局再起動で治したんでしょ?w


315:  2020/10/01(木) 19:11:53.05 ID:7ZgbMpfx0
昼頃のニュースでは「バックアップも作動しなかった」と言ってたが真相はいかに


384: 2020/10/01(木) 19:25:06.89 ID:YWhurs0A0
こういう時一番心配なのってDBの中身だよね直接いじる作業とか絶対やりたくない


457:  2020/10/01(木) 19:43:29.63 ID:zVLr6ZDe0
>>384
無数の上書きデータがメインデータテーブルに散在…
((((;゚Д゚)))))))


499:  2020/10/01(木) 19:54:54.97 ID:rwbU+DYv0
>>384
取引系の検証とか絶対したくないな


265:  2020/10/01(木) 19:02:38.57 ID:w7nZ1zql0
インフラやってた身からすると、顔面蒼白を通り越してると思う。


295: 2020/10/01(木) 19:08:35.03 ID:hZZFe51E0
>>265
ある程度の原因がわかるまで生きた心地がしないよな
ただそこで冷静になれるかが経験の差だな


306:  2020/10/01(木) 19:10:40.77 ID:SlZoROjI0
>>265
しばらく眠れないだろうな
寝つきが悪くなるとかさ
体調に気をつけて欲しいわ


619:  2020/10/01(木) 20:57:12.32 ID:MkBop3dR0
>>265
最近は「べつにおれが賠償するわけでも殴られる訳でもねーし」って修羅場での危機感無くなったわ
淡々と仕事するだけ


316 :  2020/10/01(木) 19:12:00.24 ID:iUf3kan20
徹夜で復旧作業かご苦労さまだねっと


442:  2020/10/01(木) 19:40:18.16 ID:k3VWdXY50
ガチのハックかと思ったわ


452:  2020/10/01(木) 19:43:07.54 ID:a+bhhoww0
切り替え失敗してるのはどうなってんの
故障箇所特定までかなり時間かかったみたいだけど


456:  2020/10/01(木) 19:43:28.26 ID:Hjrx/sfH0
切替できなかったのはやばいね
めちゃ怒られそうw担当者胃に穴開くな
俺なら逃げる


527:  2020/10/01(木) 20:05:52.53 ID:Klk6Y/BK0
冗長化してないわけないからソフトが原因かと思ってたら…


554: 2020/10/01(木) 20:19:06.42 ID:n4PRy/dk0
windows meかよw


605:  2020/10/01(木) 20:50:20.33 ID:nvp625Wd0
   

【速報】石原さとみ結婚
https://hayabusa9.5ch.net/test/read.cgi/news/1601544118/

624 晴男くん(神奈川県) [US] sage ▼ 2020/10/01(木) 20:11:44.50 ID:gBgXovz20 [1回目]
堀北真希ショック -895円
木村沙織ショック -298円
福山雅治ショック -714円
釈由美子ショック -203円
北川景子ショック -479円
優香ショック -582円
押切もえショック-307円
小倉優子ショック(再婚)-1010円

石原さとみショック - (東証物理破壊)←New

729 ニッセンレンジャー(東京都) [US] ▼ 2020/10/01(木) 20:47:28.75 ID:HT2GpPAq0 [2回目]
>>624
wwww
   


606:  2020/10/01(木) 20:50:22.38 ID:UDYcygRi0
あやしい。なぜ切り替えができなかったか説明になっていない。真の原因が隠蔽されているのか、分からないのかどっち?いずれにしてもも信頼性の無いことは証明された。どうするの?このまま使うのは怖すぎるだよ。


569:  2020/10/01(木) 20:28:37.22 ID:zaCdZKfB0
とりあえず同じような不具合を起こさないようしっかり対策しろよ?


582:  2020/10/01(木) 20:37:44.38 ID:grdlWz1t0
よくわからんけど、直ったんならええんちゃうかー


656: 2020/10/01(木) 21:19:48.79 ID:5zt26KjT0
ほんとぉ?🥺



ブログランキング・にほんブログ村へ 人気ブログランキング
    このエントリーをはてなブックマークに追加
人気記事PICK UP

コメント

  1. 1 名無しさん@お財布いっぱい 2020/10/02 07:17 id:Bo2IWTtO0
    SSDだな。HDDみたいに分かりやすく壊れてくれないから。
  2. 2 名無しさん@お財布いっぱい 2020/10/02 16:20 id:36kbYn690
    水曜 取引終了間際にドコモ株を大量に買ったやつを隠すために
    システムダウンさせてまで 守ったのだよ

コメントする

コメントフォーム
評価する
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット
  • 1
  • 2
  • 3
  • 4
  • 5
  • リセット