カルロ・カッツァーニガ
, クリス・フロストPDF取得 要約: AMD UltraScale+ XCZU9EG システムは、マルチプロセッサ システム オンです。多くのエッジ (自動車や航空宇宙など) で優れたプログラマブル コモン センス (PL) が組み込まれたチップ (MPSoC) ics) とクラウド (ナレッジ センターなど) 地上の選択。 ただし、大量の SRAM セルが含まれているため、システムは Neutron が原因のシングル トーナメント アップセット (NSEU) や、その他の場合にはソフト エラーのリスクにさらされます。 半導体販売業者は、ユーティリティ出力に伝播してエラーに変化する前に、記憶の混乱 (つまり、障害) をより適切に発見するためのソフト エラー軽減メカニズムを組み込んでいます。 しかし、MPSoC の緩和スキームはどの程度高品質なのでしょうか? 彼らは、さまざまなワークロードの下で、過度の高度または巨大なスケールの選択で、より良い番狂わせを首尾よく発見できるでしょうか? この記事では、加速中性子放射の試行と信頼性評価を伴う実際の調査を通じて、上記の分析の質問に答えます。 ワークロードの有用な変動でシステムを調べ、姿勢推定と天気予報に影響を受けやすいマルチスレッド システム、または AMD Deep Finding out Processing で動作するシステム/ハードウェア (SW/HW) 共同作成画像分類ユーティリティを愛用しています。ユニット (DPU)。 Unusual York City (NYC) の 1 ノード MPSoC システムが 40 十分な距離にあると仮定すると、テストされたすべてのシステム選択は 148 か月を超える平均故障時間 (MTTF) を達成し、MPSoC の処理システムでアップセットが正常に回復されることがわかります。 . ただし、40 十分なフィートにある同一の 1 ノード システムの SW/HW コメイク (つまり、DPU) は、PL アクセラレータの過度の故障率に起因する MTTF=4 か月です。おそらく、単に追加の NSEU 緩和スキームが必要になることもあります。 ただし、許容エラーの失敗率を無視すると、DPU の MTTF はオーバーヘッドなしで 87 か月に拡大できることを指摘します。
要約: AMD UltraScale+ XCZU9EG システムは、マルチプロセッサ システム オンです。多くのエッジ (自動車や航空宇宙など) で優れたプログラマブル コモン センス (PL) が組み込まれたチップ (MPSoC) ics) とクラウド (ナレッジ センターなど) 地上の選択。 ただし、大量の SRAM セルが含まれているため、システムは Neutron が原因のシングル トーナメント アップセット (NSEU) や、その他の場合にはソフト エラーのリスクにさらされます。 半導体販売業者は、ユーティリティ出力に伝播してエラーに変化する前に、記憶の混乱 (つまり、障害) をより適切に発見するためのソフト エラー軽減メカニズムを組み込んでいます。 しかし、MPSoC の緩和スキームはどの程度高品質なのでしょうか? 彼らは、さまざまなワークロードの下で、過度の高度または巨大なスケールの選択で、より良い番狂わせを首尾よく発見できるでしょうか? この記事では、加速中性子放射の試行と信頼性評価を伴う実際の調査を通じて、上記の分析の質問に答えます。 ワークロードの有用な変動でシステムを調べ、姿勢推定と天気予報に影響を受けやすいマルチスレッド システム、または AMD Deep Finding out Processing で動作するシステム/ハードウェア (SW/HW) 共同作成画像分類ユーティリティを愛用しています。ユニット (DPU)。 Unusual York City (NYC) の 1 ノード MPSoC システムが 40 十分な距離にあると仮定すると、テストされたすべてのシステム選択は 148 か月を超える平均故障時間 (MTTF) を達成し、MPSoC の処理システムでアップセットが正常に回復されることがわかります。 . ただし、40 十分なフィートにある同一の 1 ノード システムの SW/HW コメイク (つまり、DPU) は、PL アクセラレータの過度の故障率に起因する MTTF=4 か月です。おそらく、単に追加の NSEU 緩和スキームが必要になることもあります。 ただし、許容エラーの失敗率を無視すると、DPU の MTTF はオーバーヘッドなしで 87 か月に拡大できることを指摘します。
[v1]
%%item_read_more_button %%