Cluster GPU Instance

TOP 500というスーパーコンピュータのリストに231位で乗ったEC2のCluster Computing Instanceだが、さらにもう一手打ってきた。GPUだ。これは、おそらく、今日から米国ニューオリンズで行われる SC 10という国際会議に合わせてのアナウンスだろう。

ようするにCluster Computing InstanceでGPUがつかえるようになるもので、1ノードあたり2つの NVIDIA Tesla “Fermi” M2050 GPUが利用出来る。ちょっと目を引くのは、23Gだったメモリが22Gになってること。Fermiに1G取られてる?おねだんは1時間あたり2.10ドル。GPU代は1時間50セントということになる。

TOP 500について

TOP500での231位は、予想されたことだけど、ちょっとショッキング。完全にオープンでだれでもおかねを出せばつかえるサービスがこのリストに乗ったことってあったんだろうか?今後の業界の方向性を占う上で、重要な分水嶺になるのかもしれない。

性能を見るとネットワーク速度が足を引っ張ってるのがわかる。せっかく10Gのイーサを使ってるのに、1Gを使ってるシステムとあまり効率が変わらない。このあたりの最適化が今後の鍵になってくるだろう。おそらくGPUインスタンスですべてのノードを置き換えてもネットワークがボトルネックになって性能がこれ以上上がらないんじゃないだろうか。

もちろんTOP500で使われているLINPACKはある種のアプリケーションを代表するだけで、現状の性能で十分なあアプリケーションはたくさんあるので、別にTOP500をそれほど気にする必要はないのだけど。

追記

こちらに面白い資料があった。13ページ目にトップ500における10G, 1G, infiniband の別と、実行効率をプロットしてある。それぞれのインターフェイスの効率はだいたい同じレンジにあることがわかる。この図で10Gの一つが他のものよりもかなり低効率になっている。これがEC2のCluster Computing Instance だ。仮想化レイヤに足を引っ張られて、1G並の効率になっていることがよくわかる。