ProfMatsuoka

Satoshi Matsuoka

ProfMatsuoka

ツイートの並び順 : 新→古 | 古→新

表示するツイート : 全て | Replyを除く | Mentionを除く

2012年05月19日(土) 18 tweets

ソース取得:

(Jensenもそうだけど、米国のエンジニア出身の社長は自社の技術的な部分もちゃんとエンジニアとして掌握していて、矢面に出てきて技術的な質問にテキパキと答えられるのがいつも凄い。ここで日本だと社長がお辞儀して謝って、質問になると裏に控えた「若い人」が答えるところだが。。。)

posted at 19:58:29

社長「アボートしたのは第5エンジンの燃焼チャンバーの圧力が異常に高まったからであるが、その原因は燃料供給が十分でなかったからである可能性がある。ただ燃料バルブの開閉をチェックしたが大丈夫だったようなので、より詳細な解析が必要。最悪もう一台あるLVの第5エンジンを取り外し交換。」

posted at 19:47:32

NASA TVでSpaceXとNASAの記者会見中。。。

posted at 19:39:09

そういえばこんなTopGearの打ち上げ失敗もあったな。。。http://t.co/PepepOha

posted at 18:51:59

Falcon9のエンジンは9機のクラスタだが、5番エンジン(真ん中?)の燃焼圧が基準より高かったとの第一報が。もっとも今までも何回かあったことではあるようだ。やはり液体燃料エンジンは安全である。今回はランデブーの為の打上げのウィンドウは一秒!しかなかったので、今日は打ち上げ中止。

posted at 18:03:17

LVのセーフモードの確保中。エンジンは点火したが、Falcon9はフル推進になるまで一秒間かかり、何か障害がなければコンピュータがLVをリリース・発射する設計である。つまりこの一秒の間に発射条件が満たされなくてコンピュータが発射アボートを判断し、エンジンをシャットダウンした。

posted at 17:59:42

T-30秒・10..9..8..7..6..5..4..3..2..1.. 0 発射、とおもったらエンジンは開始するもアボート!

posted at 17:56:18

T-4分半。電源を内部バッテリーに切り替え。T-3分色々なシーケンスが忙しくなる。T-2分半 打ち上げゴー。T-2分、T-1分半 ヘリウム最終注入、T-1分。。。

posted at 17:54:45

管制室の音声ループが入るようになった。Chris Kraftらが作り上げたNASAのMOCの伝統が受け継がれており、フライトディレクターがそれぞれの部門にgo/nogoを逐次確認。ECOMとかGNCとか用語もほぼ同じである。 T-10分で、自動シーケンス開始。。。

posted at 17:46:13

現在Dragonの7人乗りの有人版の開発が急ピッチで進められている。もともとDragonはそれを前提に設計されており、今回ドッキングしても気密の荷物室から数百キログラムのペイロードを出し入れする予定だそうだ。

posted at 17:37:11

おっ、いよいよライブキャストはじまった。NASAと比べるとずっと雰囲気がカジュアルである。打ち上げサイトはCape Canaveralで過去にTitan等を打ち上げてた40番発射台をSpaceXが買い取って改造したものである。管制室もヒューストンでなくSpaceX社本社。

posted at 17:23:59

勿論NASAのロケットや宇宙船も民間への受託開発をしていた。例えばサターンの一段目はボーイングだし、CSMはNorth Americanである。しかし基本的には国の予算でNASAの技術者が主導して基本から研究設計開発していたものであり、今回のように純粋に民間は初めてである。

posted at 17:21:33

いよいよ歴史的なSpaceXの宇宙ステーション行きの補給ミッションが始まる。既に日本もHTV3で補給技術はあるが、Falcon9/Dragonは初の純粋な民間開発LVであるだけでなく、将来の有人飛行のために大気圏突入・回収も可能なことだ。http://t.co/j9JnZFTR

posted at 17:17:42

いよいよだ! QT NASAKennedy The Falcon 9 & Dragon spacecraft on the pad this morning after fueling. LOX tanks venting. http://t.co/M4GeWwnC

posted at 17:12:55

Kepler2の白書である。興味のある人は是非通読をおススメする:insideHPC New Whitepaper: NVIDIA’s Next-Gen CUDA Compute Architecture - Kepler GK110 http://t.co/rXWuWQtH

posted at 03:35:10

米国では学生がPCを買うとタダでXBox360を貰えるように:engadget Microsoft encourages students to buy a PC, gives them a free Xbox 360 in return http://t.co/NPYxCIoF

posted at 03:11:18

ようやくシカゴ⇔サンノゼ間の4時間近い会議が終わった。数名同士だとiPadでビデオSkype会議するのが本当に便利である。シカゴ往復せずに済んだ。PCでも良いのだがキーボードやファンの音がノイズとなって会話が聞きにくくなるし、別カメラでないとカメラアングルが全員をカバーできない。

posted at 02:56:06

7時に起きてずっとSC13/SC14の準備テレビ会議。。。

posted at 02:02:00

2012年05月18日(金) 9 tweets

ソース取得:

再びトランジスタ数に戻るが、主なスパコンに使われているCPUとしては、Power7:12億、BG/Q:15億、SPARCIX fx:19億、Sandy-Bridge EP:23億、GF110: 30億、GK110: 71億であり、Kepler2が圧倒的に多いのがわかる。

posted at 05:17:36

(承前)後者の意味は、CUDAの共有メモリ等のスレッドブロックのコンテクストが、launchされた子供には継承されない(逆にforkならば継承される)ことを意味する。まあ確かにCUDAではそのほうが良いであろうが。

posted at 05:07:58

で、Jones氏の講演後の質問に聞き言ってて面白かったのはCrayのコンパイラチームの人との議論で、後者曰く「動的並列性機能でOpenMPに関するMICとの差は以下だけだ:Kepler2はCPUへのコールバックがないのと、Fork-joinでなくLaunch-joinである。」

posted at 05:05:22

注目すべきは、Fermi GF110(40nm)=>Kepler2 GK110(28nm)で、ダイサイズはほぼ不変でトランジスタ数がプロセス技術の差である2倍以上の2.4倍になったことだ。CUDAコア数が相対的に増えたことによると思われるがそれにしても効率が良い。

posted at 04:59:16

ちなみに400GFというのは2090のDGEMMの値。また構成図からも単精度:倍精度が3:1だということも明らかになった。単精度は4TF以上だから、単精度や混合精度演算を使う有利性が高まる。例えばORNL Titanは単精度マシンとしては~60PFとなり、BG/Qや京を圧倒する。

posted at 04:47:18

後藤氏によるKepler2の詳報。一か所だけ間違いがあり、倍精度演算が2090 Fermiと比べて3倍なのはDGEMM実行比であり、ピーク性能比ではない。よって倍精度ピーク2TF よりは低い(でもFermiは約400GFだったわけで…) http://t.co/vA9jHy2C

posted at 04:42:29

おー Quicksort のような並列再帰プログラムもCUDA5/Kepler2で簡単に書けるぞ!

posted at 02:39:23

次はNVIDIAのAndrew JonesでKepler2の目玉の一つの動的な並列スレッド生成。これは本当に重要で、今までは高速化が大変だったFMMとかAMRとかが非常に簡便に書け、かつ効率が上がる。日本のFMMの一人者のKAUSTの横田さんも大変期待しているとのこと。

posted at 02:19:49

Nvidia GTC 三日目。皆様CCOE賞受賞のお祝いの言葉有難う御座います。午前中は以前松岡研究室でインターンをやってたMark Silbersteinの話で、GPU/CUDAにPOSIXに近い、CPUと共通バッファキャッシュを持つI/O API。まだプロトだがグーで高速。

posted at 02:13:55

2012年05月17日(木) 9 tweets

ソース取得:

東工大Tsubame2がNVIDIA CCOE賞をゲット!!!他国のCCOEセンター間の投票で決まったので格別である。写真は立役者の二人。 http://t.co/7hGVYx2T

posted at 12:27:02

CUDA CoE プレゼン終わった。時間が足りなかったなあ。まあ今回作った紹介コンテンツはまた別な機会に使おう。

posted at 10:05:08

これからCUDA Center of Excellenceのコンペである。準備の為にリブートしたらなんとPPTが壊れていた。(゚Д゚;) 幸い前のバージョンを保存してた直後だったので軽微な編集で回復。フー。#gtc12

posted at 09:28:23

うーむ、#gtc12 の性能のセッション「GPU Performance Analysis and Optimization」、一般向けだが相当為になる。後日ビデオかスライドをもう一度見なくてては。。。

posted at 08:45:46

次はGPUの性能やその測定に関する詳説のセッション。

posted at 07:50:39

ところでKepler2から個々のスレッド内から動的に直接カーネル起動ができるようになり、細粒度並列性で大幅に汎用性・柔軟性が増す。逆に注意しないとfork() bombの凶悪版を簡単に書けてあっという間にGPUの資源を食い尽くす。OpenACCの場合は良いがCUDAでは要注意。

posted at 07:13:59

Kepler2の詳細の白書は明日の現地時間の10:30にWebで公開されるそうだ。

posted at 07:03:51

GTCセッション「Inside Kepler」。特に新型GPGPUのGK110の詳細な解説である。例えばこれはアトミック命令の2ー10倍の改善で、最内ループで使えるようになった。この手の細かい改善が多々ある。千人会場が立ち見状態だ。 http://t.co/s9sfzudD

posted at 06:47:25

ORNLのJeff Vetter, NVIDIA Tesla CTOのSteve Scottらとの「エクサスケールへの道」のパネル終了。なかなか上手くいった。Exascale Reportでビデオ撮っていたので公開されるかもしれない;されたらURLをポストします。

posted at 03:10:36

2012年05月16日(水) 14 tweets

ソース取得:

今度トロと共演することになった。。。

posted at 19:01:19

さあ明日は朝からパネル登壇を含め一日中忙しいのでもう就寝します。皆様明日もまたGTCレポートをお届けしますのでご期待を。

posted at 18:02:54

これはつまりKeplerの方がSandy Bridge比較でトランジスタ密度が倍はあるということであり、32nm 対 28nmというプロセスの1.3倍の密度の違いを加味しても、余りにも違いすぎるわけだ。Kepler2は70億トランジスタという噂もあり、性能差は明らかだ。

posted at 17:52:37

その証として「Intelはプロセッサに多大な(トランジスタ数増加に有利な)キャッシュがあるのに、実際はKeplerと比べるとトランジスタ数が大変少ない」確かにSandy Bridge EP-8は435 mm^2 で23億トランジスタに対し、Kepler1は293mm^2で35億。

posted at 17:48:38

面白かったのは、JensenやDallyにTSMCのプロセスの話があった際に、彼らは「仮に使えてもインテルのプロセスは使わない」との言明があったことである。理由はトランジスタは優れているが、配線層の密度が荒すぎかつ消費電力が高すぎ、細粒度大規模並列メニーコアには向かないとのこと。

posted at 17:40:34

これらによって一部の疎行列系の実アプリの性能とプログラミングは劇的に改善されるであろう。キーノートにあった30万粒子の銀河系とアンドロメダ衝突の「リアルタイム」FMMシミュは、既存コードからの移植は技術者が週末に一人で出来てしまったそうだ。Fermiではとても無理だったろう。

posted at 17:35:30

特にKeplerでは、従来Fermiではプログラミングが大変だったFMMや構造格子AMR、更にOpenMP的ネスト並列などの、動的な並列性の起動や調整が必要な並列プログラミングが劇的に容易になる。非構造格子系もかなり改善されるだろう。ようやく長年求めてた真の細粒度アーキが到来だ。

posted at 17:32:16

重要な事は、Keplerは単にFermi比で2-3倍の性能を発揮するだけではなく、今回発表されたHyper-Qや動的並列性やGPU Direct 3、さらに未発表の幾つかの機能によって、その性能をCUDAやOpenACCで出すプログラミングが従来より容易になることである。

posted at 17:28:03

つーかNVIDIA Kepler1&2に関して、今まで知っていたことで、特に色々怪情報が流れてても訂正できなかったフラストレーションが一部解消された。でもまだ細かいパラメタはリリースされていないが。。。

posted at 17:21:46

GTC12初日が終わった。印象としては、Keplerはグラフィックス/ゲーム、HPC、および新たな要素としてクラウドに対して、今まで普通の人たちが思っていたよりずっと大きなインパクトを持ちそうだということである。是非Jensenのキーノートのビデオを観ることをお勧めする。

posted at 17:17:49

Jensenと挨拶。「素晴らしいキーノートだったよ。これでXeon並にハイエンドが売れるね。作らなきゃいかんけど。」に対し笑って「頑張って作るよ。でも本質的に需要を喚起する方が難しい。だから今Keplerの我々の想像を遥かに超えた需要が供給を上回ってるのは嬉しい事だ。」

posted at 10:12:56

GTC ジェンンソン登場。 http://t.co/wOMJRkVa

posted at 05:05:51

GTCキーノート開始。ライター安藤・後藤氏らと歓談。会場は満杯で3000人はいるだろう。 http://t.co/6qIT4spx

posted at 05:05:42

Jensen「僅か数年でHPCの民主化を達成。HadoopやOpenMPの同時期の論文数を加算してもCUDAの論文数(2.2万)に届かない。SCの展示でも過半数がCUDAと関係ある。さてケプラーの今まで公開していなかった話をしよう。」

posted at 02:56:18

last update 05/28 09:31

ツイート検索

«2012年5月 
 123456
78910111213
14151617181920
21222324252627
28293031   

Recent

Archives

» more...

Friends

» 全てのFriendsを見る...

Hashtags

» 全てのHashtagsを見る...

Stats・Feed