CPUアーキテクチャについて語れ 8
- 1 名前:Socket774 :2007/05/03(木) 06:15:50 ID:C7PZYiLL
- お前らいい加減、無能なAMD房・Intel房・GKに振りまわされず、
エンコ時間がどうとかPIがどうとかPS3がどうとかじゃなく、
CPUコアのアーキテクチャについて語りましょう。
x86/RISC/CISC/スーパースカラ/VLIW/MIMD/SIMD
等について語ってもよし、
フリップフロップ回路が小さいPentium Mマンセー、
CISCなのに内部はRISCなPentium 4マンセー、
x86なのに32/64bitコンパチなOpteronマンセー、
昔々8086の時代は(以下略・・・等もよし。
さあ、不毛な争いを止めてCPUアーキテクチャについて語ろう!
前スレ
CPUアーキテクチャについて語れ 7
http://pc11.2ch.net/test/read.cgi/jisaku/1172923824/
【過去スレ】
Part 1 http://pc5.2ch.net/test/read.cgi/jisaku/1082357989/
Part 2 http://pc7.2ch.net/test/read.cgi/jisaku/1101041110/
Part 3 http://pc7.2ch.net/test/read.cgi/jisaku/1139046363/
Part 4 http://pc7.2ch.net/test/read.cgi/jisaku/1151732227/
Part 5 http://pc9.2ch.net/test/read.cgi/jisaku/1159238563/
Part 6 http://pc9.2ch.net/test/read.cgi/jisaku/1169393906/
【前スレより転載】
816 :聞伝君:2007/05/02(水) 04:54:50 ID:MIZBpvl2
更にcellはSIMDではない
- 2 名前:・∀・)っ-○◎● :2007/05/03(木) 06:21:11 ID:C7PZYiLL
- 2ゲット
998 名前:Socket774[sage] 投稿日:2007/05/03(木) 03:24:44 ID:wWJSXCIP
ベクトル計算機の場合マルチと言ってもクラスタに近いから、それほど厳密に区別する必要も無いでしょ。
ベクトル演算ユニットがあればベクトル計算機で良いんじゃね?
そいやー、Crayにはベクトル演算中の0除算を無視するモードとかあったなぁ…
999 名前:Socket774[sage] 投稿日:2007/05/03(木) 03:30:05 ID:d1JfRd2R
1000ならおっぱい
1000 名前:・∀・)っ-○◎●[sage] 投稿日:2007/05/03(木) 03:30:24 ID:C7PZYiLL
1000
- 3 名前:Socket774 :2007/05/03(木) 08:33:53 ID:EwI2I2bS ?2BP(7778)
- 3
- 4 名前:・∀・)っ-○◎● :2007/05/03(木) 09:03:14 ID:C7PZYiLL
- まきのせんせいお茶目だな。自サイトにニュー速のログかよ
ttp://grape.astron.s.u-tokyo.ac.jp/~makino/press/2006-11-6/2ch-newsoku.html
- 5 名前:Socket774 :2007/05/03(木) 10:12:08 ID:ugaL4hIv
- 936 :Socket774:2007/05/03(木) 00:59:27 ID:RM/uqQqY
サン社のプロセッサ設計トップに聞く、
「課題は製造パートナーの確保」
http://www.eetimes.jp/contents/200705/17866_1_20070502193717.cfm
- 6 名前:Socket774 :2007/05/03(木) 11:01:50 ID:7/TOxO9e
- 聞伝くんって、ブロック図的に独立した複数の演算モジュールに制御シグナル
をブロードキャストして同期動作させる、今じゃ死語の世界に片足を突っ込ん
じゃった古典的SIMDプロセッサしかSIMDと言いたがらないひとなのねん
このこだわりってやっぱり愛ゆえ?
「高並列でスケーラブルで汎用なSIMDが実験プロセッサを除いて絶滅したのは
使い道が無いからだ」とか言ってみるテスト
- 7 名前:Socket774 :2007/05/03(木) 11:04:31 ID:eMf+vQWY
- すごく古い人だなってのは至る所で感じるよ>伝聞君
- 8 名前:Socket774 :2007/05/03(木) 11:05:28 ID:WTA6fSV0
- 汎用で使い道が無いってどういうことっすか
- 9 名前:Socket774 :2007/05/03(木) 11:15:29 ID:7/TOxO9e
- 「高並列でスケーラブルで汎用なSIMD」ってそもそもコンセプト的に
成立しない、ゆえにそれを生かせる使い道が無いのかもってこと
並列度を最大限に生かそうとしたら、互いに異なる処理も同時に実行
したくなるよね?
- 10 名前:Socket774 :2007/05/03(木) 11:44:56 ID:wWJSXCIP
- 一時期プログラマブルな画像処理プロセッサとかがSIMDであったけど、今はもう無いのかな。
最近のCTやMRIのはどうなってるんだろう?
- 11 名前:MACオタ :2007/05/03(木) 11:52:09 ID:LpHr6P80
- 前スレ終盤の叩き合いに参加できなかったのわ、つくづく残念す(笑)
どっちに組するにしても、面白いソースの一つも紹介したものを。。。
- 12 名前:聞伝君 :2007/05/03(木) 12:37:29 ID:kg5QnGlP
- 意図せず人気者ってやつ?オレ。まあ、いいやw
SIMDに愛なぞ、、どちらかというと余り好きじゃない。
演算器積んでいてもloadネックで遊ばしてしまうような用途には無力で、
主にそう言う用途に関わっているから。
section 並列の方が(遊びとしても)面白いし。
- 13 名前:聞伝君 :2007/05/03(木) 12:43:43 ID:kg5QnGlP
- >>11
面白いソースあるなら出して。
おいらはコレを張っておく。面白いかは微妙だが。
ttp://www.kasahara.elec.waseda.ac.jp/pdf/CS_advanced_technology_061003.pdf
- 14 名前:Socket774 :2007/05/03(木) 12:47:38 ID:7/TOxO9e
- >>10
ピクセル並列で処理を行うプログラマブルな画像処理専用デバイスなら
あるだろ、単純なSIMDで作ると適応形フィルタ処理で効率が落ちると思うが
- 15 名前:MACオタ>聞伝 さん :2007/05/03(木) 13:02:25 ID:LpHr6P80
- >>13
このネタ、この謎カキコを除けば聞伝さんに組したい感じがするす。
http://pc9.2ch.net/test/read.cgi/jisaku/1169393906/816
------------------------
816 :聞伝君:2007/05/02(水) 04:54:50 ID:MIZBpvl2
更にcellはSIMDではない
------------------------
私の認識でわ、ベクトル機と対照すべきモノわスカラじゃなくて、キャッシュアーキテクチャだと思うす。
http://docs.cray.com/books/S-2315-50/html-S-2315-50/fixed2nvngcwf3.html
========================
the 32 KB of vector register space effectively functions as the lowest level of processor
data cache, similar to the L1 cache found on microprocessor-based systems.
========================
メモリアクセスを隠蔽する手法の違いということで。。。
そういう意味で、普通ショートベクトル(=SIMD)わキャッシュアーキテクチャと組み合わせて使われる
以上、伝統的ベクトルアーキテクチャとわ一線を画する筈す。
- 16 名前:MACオタ@続き :2007/05/03(木) 13:08:58 ID:LpHr6P80
- プロセッサのメモリ階層がL1-L3と多層化されている昨今、「ベクトル=キャッシュ無し」という
という古い考えわ捨てて、ベクトルレジスタをメモリ階層の一段階として考えるのも興味深い
発展かと思うす。
http://www.research.ibm.com/aceed/2005/proceedings/krste.ppt
- 17 名前:聞伝君 :2007/05/03(木) 13:09:30 ID:kg5QnGlP
- >>15
>このネタ、この謎カキコを除けば聞伝さんに組したい感じがするす。
>http://pc9.2ch.net/test/read.cgi/jisaku/1169393906/816
よほどin cacheか on registerでぐるぐる回すだけのようなprogram以外で
softwareがIPC3で動くようにするのは難しいでしょ。
そういう意味として816は当たり前のことを書きたかったのではないかと思うよ。
下の方は同意だよ。
- 18 名前:聞伝君 :2007/05/03(木) 13:13:18 ID:kg5QnGlP
- >>16
そいう考え方を発展させれば面白い物が出来るかも知れないけど。
解が見えないんだよ。
すぐ実用性求められるし、
こういう場合にはやっぱりまだベクトルに負けるじゃんとかケチ付けられるし。
それでコンサバなarchitectureの拡大発展と並列化に走ると。
成熟してきたんかな。
- 19 名前:MACオタ>聞伝 さん :2007/05/03(木) 13:13:33 ID:LpHr6P80
- >>17
-----------------------
softwareがIPC3で動くようにするのは難しいでしょ。
-----------------------
SPEわ2-issueのプロセッサなので、理論限界でIPC=2なんすけど。。。
- 20 名前:聞伝君 :2007/05/03(木) 13:17:13 ID:kg5QnGlP
- >>19
SPEじゃなくて別のprocessorを想定してた。
あと、IPCを測るときに積和を2としたがる人も居て
そう言う人は何で4がでないのか説明しろと無理難題を迫ってくる。
SIMD命令のIPC maxは1と見るかNと見るかみたいな話し。
- 21 名前:聞伝君 :2007/05/03(木) 13:18:20 ID:kg5QnGlP
- ちょっと用があるんで、抜けますノシ
- 22 名前:MACオタ>聞伝 さん :2007/05/03(木) 13:22:53 ID:LpHr6P80
- >>20
-------------------
IPCを測るときに積和を2としたがる人も居て
-------------------
IPC (instruction per cycle) と ops (operation per second)の勘違いのような気がするす。
話変わって「CELL BE = MIMD」説の方わ、私も常々"cluster on a chip"と主張しているすから
同意するす。
- 23 名前:MACオタ :2007/05/03(木) 13:47:05 ID:LpHr6P80
- POWER6搭載製品のリリーススケジュールについて公式のコメントが出たす。
http://www.eweek.com/article2/0,1895,2124931,00.asp
--------------------------
At IBM's ParterWorld Conference in St. Louis, Ross Mauri, the general manager for
System p in IBM's Systems and Technology group, told eWeek that Big Blue will be
announcing new System p servers based on the Power6 processor in the next six weeks.
--------------------------
- 24 名前:・∀・)っ-○◎● :2007/05/03(木) 15:35:21 ID:C7PZYiLL
- CellがMIMDなのは疑いようが無いが
な ん で
「SIMDではない」
んだ?
排他的概念か?
それともSPEを並列に動かしたら、1命令で1個のデータしか扱えなくなるのか?
- 25 名前:MACオタ>団子 さん :2007/05/03(木) 15:46:20 ID:LpHr6P80
- >>24
あれが謎発言だってのわ、前スレ後半についたコメントを見ても衆目の一致するところす。
これ以上からんでも団子さんのほうがキチガイ粘着に見えてくるだけかと。。。
- 26 名前:MACオタ@補足 :2007/05/03(木) 15:55:25 ID:LpHr6P80
- 我々、一般のヒトわデスクトップ用マイクロプロセッサに実装されるショートベクトルのユニットを
"SIMD"と呼ぶす。しかしスーパーコンピュータの世界でわ、ちょっと違う分類をしているらしいすよ。
http://www.linux.or.jp/JF/JFdocs/CPU-Design-HOWTO-6.html
-----------------------
6.3 SIMD(Single Instruction stream, Multiple Data stream) マシン
このようなマシンはしばしば 1,024個から 16,384個といった膨大な数の処理単位をもち、
それらがそれぞれ異なるデータに対して軍隊の行進のように同じ命令を実行することが可能と
なっています。したがって、たった一つの命令で多くのデータを並列に操ることができます。
このタイプに分類される SIMD の例としては CPP DAP Gamma II や Alenia Quadrics などが
挙げられます。
もう一つのタイプの SIMD システムはベクトルプロセッサです。ベクトルプロセッサは特別な
構造をもつ CPU を使って、独立したデータ群より類似データの配列に対して能力を発揮します。
ベクトルユニットでデータを処理する場合、結果は3クロックサイクル当たり 1個かまた特別な場合
には2個の割合で出力されます。 (1クロックサイクルとはシステムの内部処理時間の基本単位
です。) つまり、ベクトルモードで実行するときに限り ベクトルプロセッサはほぼ並列にデータを
処理する事になります。この場合、旧式のスカラーモードで実行するのに比べて数倍高速となり
ます。このため、ベクトルプロセッサの実用上の効果は、ほぼ SIMD マシンと同じと考えられます。
このようなシステムの例をあげるとすれば、Hitachi S3600 です。
-----------------------
彼らの用語でわ、ショートベクトルわ"SIMD"じゃ無いらしいすね。
- 27 名前:Socket774 :2007/05/03(木) 15:55:31 ID:eMf+vQWY
- 仲裁役のMACオタなんて見たくない…
- 28 名前:・∀・)っ-○◎● :2007/05/03(木) 15:57:34 ID:C7PZYiLL
- MACヲタは「しばしば」を「全て」と脳内変換してるらしい
- 29 名前:Socket774 :2007/05/03(木) 16:28:12 ID:7yBoYf9l
- >>15
どっちに組するもなにも、{更にCellのSIMDではない}以前に、
しつこいようだが、前スレの議論の発端は、
ベクトル演算=ベクトルプロセッサでするもの
という聞伝君の誤認識からだよ。
それがなければすぐに終わっていた話なのに。
一切ベクトル機やSIMD機の議論ではなかった。
というわけで、そろそろ次の話題に移行してほしい。
- 30 名前:MACオタ@団子 さん :2007/05/03(木) 16:34:21 ID:LpHr6P80
- >>28
英語において"often"わ「〜じゃない場合より多い」というニュアンスす。("as often as"の用法で
調べると良いかと思うす)
>>26の意味でわ少なくともSIIMDに分類されるシステムのうち半分以上わ1,024-16,384の
ロングベクトルである。。。ということになるわけで、明らかに、MMX, SSE, AltiVecの類わSIMDに
分類されていないす。
- 31 名前:MACオタ>29 さん :2007/05/03(木) 16:38:19 ID:LpHr6P80
- >>29
-------------------
そろそろ次の話題に移行してほしい。
-------------------
面白いと思うからコメントしているすけど、他にご希望があるなら自前でネタ出しすべきかと思うす。
- 32 名前:Socket774 :2007/05/03(木) 16:47:33 ID:7yBoYf9l
- ちゃんと次のネタを提供しているのはさすがMACオタではないか。
774 名前:MACオタ>757 さん[sage] 投稿日:2007/04/30(月) 22:06:20 ID:qk7MKfVw
>>757
特に遅れているという訳でも無さそうす。
http://www.itjungle.com/tfh/tfh043007-story02.html
others that I am now hearing say IBM will crimp the clock speed back
to 3.3 GHz or 3.5 GHz except for the machines that get sent to the big
supercomputing laboratories operated by the U.S. Department of Energy.
I have no confirmation of these new rumors, but IBM is expected to deliver
a range of Power6 processors that span as low as 3 GHz and as high as 5
GHz over the two-year span of the product,
- 33 名前:Socket774 :2007/05/03(木) 16:53:51 ID:7yBoYf9l
- 今後6週以内に3GHz級のPOWER6 serverが登場。5GHzはとても無理とのこと。
- 34 名前:・∀・)っ-○◎● :2007/05/03(木) 16:57:12 ID:C7PZYiLL
- SRAMの製造にトラブル抱えて成功するわけがない
- 35 名前:聞伝君 :2007/05/03(木) 16:58:02 ID:8Am9M4nx
- clock speed backもさることながら、6は苦難だろうな。
向いているprogramでは、まあ、あれなんだろうけど、
もうじき市場で様々な評価がされるだろうな。
次を急ぐのか、clock上げて逃げるのか…
- 36 名前:Socket774 :2007/05/03(木) 16:59:39 ID:eMf+vQWY
- 5GHzが無理となるとえらい厳しい戦いになりそうだなー
Nehalemに市場取られる気配がぷんぷんするんだぜ?
- 37 名前:MACオタ>32 さん :2007/05/03(木) 17:07:07 ID:LpHr6P80
- >>32
続報わ、こっちす。>>23
ちなみに、既存のPOWER5+製品ラインの値下げとPOWER搭載ブレードサーバーの管轄を
x86 (x series)部門からunix (p series)部門に移管する等、POWER6搭載製品発表の準備も
始まったとのことす。
http://www.crn.com/hardware/199203320
-----------------------
IBM is changing the way it distributes the blade version of its System p servers to
separate them from sales of the company's System x blade servers.
[中略]
This week will see IBM also drop the price of its current System p servers, based on
the POWER5+ processor, by 15 percent to 25 percent as it prepares for the release of
the POWER6-based System p servers in the next couple of months, Handy said. The
cuts will be a combination of price reductions and promotions and will apply to the
midrange System p 5 570 servers and high-end 590 and 595 servers, he said.
-----------------------
3GHz版ってブレードサーバーのことじゃないかと思われるす。
- 38 名前:MACオタ :2007/05/03(木) 17:38:17 ID:LpHr6P80
- POWER6の性能すけど、整数パイプラインのin-order化による既存コードの性能低下わ予想通り
あるらしいす。
先ごろ開催されたPower.org Software Summit 2007のプレゼン資料からの引用す。
http://www.power.org/swsummit/download/SW_Summit_gcc_and_tool_chain_Peter.pdf (p.8参照)
------------------------
.・32-bit and 64-bit default: -mtune=power4
- Good value for power4 and related 970 processors
- Ok, for power5 and power5+
- No so good for the in-order power6 processor
------------------------
- 39 名前:Socket774 :2007/05/03(木) 17:45:46 ID:eMf+vQWY
- ゎーぃ
やっぱpowerでin-orderはやべぇっぽいな
ブレード以外ではしっかり4GHz+出てりゃいいんだけど…
- 40 名前:Socket774 :2007/05/03(木) 19:47:14 ID:4t5SkZ8p
- クロック上げるために、in-orderにしたんじゃないの?
それで3GHzじゃ悲し過ぎるぞ。
- 41 名前:Socket774 :2007/05/03(木) 20:55:49 ID:RM/uqQqY
- I.B.M. to Announce an Advance in Making Chips Faster and More Energy-Efficient
http://www.nytimes.com/2007/05/03/technology/03chip.html?ref=business
- 42 名前:MACオタ>41 さん :2007/05/03(木) 21:13:23 ID:LpHr6P80
- >>41
少し詳しい解説つけたす。
http://pc11.2ch.net/test/read.cgi/jisaku/1177368830/127
- 43 名前:・∀・)っ-○◎● :2007/05/03(木) 21:58:45 ID:C7PZYiLL
- 次のネタ
アホアホ聞伝君の次のハンドル
- 44 名前:MACオタ>団子 さん :2007/05/04(金) 01:27:40 ID:8lBhBvV5
- >>43
そういえば、これ火消しに行かなくて良いすか?
http://pc11.2ch.net/test/read.cgi/jisaku/1177961091/
----------------------
4 名前:Socket774 投稿日:2007/05/01(火) 04:26:55 ID:CEN0BCuL
TXで負荷を掛けながら、IEを起動するとC2Dの超もっさりが顔を出す
[以下略]
----------------------
- 45 名前:・∀・)っ-○◎● :2007/05/04(金) 01:32:36 ID:KDR0wW9x
- 時間の無駄
- 46 名前:・∀・)っ-○◎● :2007/05/04(金) 01:38:33 ID:KDR0wW9x
- 絶対処理量を無視した比較に公平性もなにもない
所詮無能の詭弁
- 47 名前:・∀・)っ-○◎● :2007/05/04(金) 01:48:46 ID:KDR0wW9x
- もっさり=毛深いを「もたつき」だと勘違いし続けてるいつもの馬鹿のスレを
こんなスレに貼るMACヲタも所詮その程度だね
- 48 名前:Socket774 :2007/05/04(金) 02:05:58 ID:C6/xQXJi
- 「もたつき」の意味もありますがw
- 49 名前:・∀・)っ-○◎● :2007/05/04(金) 02:11:07 ID:KDR0wW9x
- はいはい【ギザワロス】wwwww
- 50 名前:・∀・)っ-○◎● :2007/05/04(金) 02:13:54 ID:KDR0wW9x
- っていうかさ、Core2Duoの半分以下の性能しか出せないのにIEの同時起動云々って
はなから論外じゃん
腕相撲で負けて「実は左利きなんだ再戦しろ」っていうくらい見苦しい
- 51 名前:Socket774 :2007/05/04(金) 02:24:25 ID:C6/xQXJi
- もっさり
@動きがにぶいさま。気がきかない。
Aあかぬけないさま。
B毛などが厚く生えているさま。
だそうですよ。
- 52 名前:・∀・)っ-○◎● :2007/05/04(金) 02:26:46 ID:KDR0wW9x
- つまり、俺ベンチでC2Dの半分の性能も出ないAthlon64 X2=もっさり
- 53 名前:MACオタ :2007/05/04(金) 12:12:18 ID:8lBhBvV5
- >>41のナノテクによる超low-k技術わ、元々ナノスケールのマスクを自動生成するための
研究からの派生すけど、なんとHPが同様な手法で"nanoimprint"なるマスク生成技術に
成功したそうす。
http://www.hp.com/hpinfo/newsroom/press/2007/070502a.html
--------------------
The technology involves a process called nanoimprint lithography (NIL) -- a method of
literally stamping out patterns of wires less than 50 atoms wide on a substrate. HP Labs
researchers have created patented NIL technology, which has enabled the fabrication of
laboratory prototype circuits with wire widths of 15 nanometers -- about one-third the
dimension of the features in the most advanced circuits that will be commercially available
this year.
--------------------
HP自体わ半導体製造わ商売にしていないんで、この技術をライセンスするとのことすけど
どこが実用化するすかね。
- 54 名前:Socket774 :2007/05/04(金) 12:49:18 ID:C6/xQXJi
- >>53
マスクを生成ってのとはちょっと違う気がする。
ナノインプリントは色んなところで研究してるから珍しくはないけど実用レベルなのかな。
15nmだとリソグラフィに遜色ないし、簡単な半導体を安価に作るには良いね。
今だとリソグラフィのマスクコストは馬鹿にならんおかげで、数がそう出ない半導体なんかは
微細化を諦めてたりするけど、ナノインプリントが実現出来ればそれも変わりそう。
- 55 名前:MACオタ>54 さん :2007/05/04(金) 13:05:36 ID:8lBhBvV5
- >>54
確かにIBMの高分子の自己組織化ネタとわ違うす。
微細化とともにうなぎ上りのマスクコストの対策の話題ということで。。。
- 56 名前:MACオタ :2007/05/04(金) 18:22:55 ID:8lBhBvV5
- IPF叩きが大好きなTheInquirerの記事なんで、話半分に読んだ方が良いかと思うすけど、
Tukwilaが動作クロックが上がらないという問題に直面しているとのことす。
http://www.theinquirer.net/default.aspx?article=39397
---------------------------
Well, now word has reached out tender ears that the delayed Tukwila is also having
serious speed problems. It is currently looking like it it will top out at 2.1Ghz, but given
the line's illustrious history, there is still time for this to drop significantly. In any case,
this is a massive drop from what was promised.
---------------------------
- 57 名前:MACオタ :2007/05/05(土) 14:44:40 ID:PYZKrr9x
- Software Optimization Guide for AMD Family 10h Processor (Balcerona)が公開されているのわ
あちこちで報じられているすけど、Appendix Aに一通りのアーキテクチャ解説がついてるので
以後の資料として必読かと思うす。
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/40546.pdf
AMDのアーキテクチャに詳しい方にわ常識なんだと思うすけど、実行ユニットの直前まで
Macro-opsのまますから、特にmicro-ops fusion的な機構わ不要なんすね。
また浮動小数点におけるロード->演算のsuperforwardingの追加等、高級言語の一命令をそのまま
に近い状態でハードウェア処理するという方向性が見えるす。SSE4系高機能命令も同様な目的に
見えるす。
この辺、ハードワイアードCISCとでも言うべき方向性かと思うすけど、高クロックとマルチコア実現
のために古典RISCに戻しちゃったCELL SPEなんかとの対比が面白いす。
- 58 名前:Socket774 :2007/05/05(土) 19:17:21 ID:fjI7JcMu
- 220 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 18:27:13 ID:ML3bg+Sf0
>>216
違うだろ。
もしこの説が有力ならPS3がミス設計だったってだけ。
しかも今後出るモデルは現行のPS3下位互換だから、取り返しが付かない。
223 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 18:47:49 ID:ML3bg+Sf0
理解力の無いアホが早速噛み付いてきた
225 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 18:51:51 ID:nLMTJSGq0
>>223
今後出るモデルがどう下位互換で、何が取り返しが付かないのか
具体的にどうぞ
230 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 19:07:22 ID:dMdeP9wf0
>>220
全く意味不明なんで詳しく説明して。
PS2までへの互換部分以外になにか変更あるの?
ソフト動かなくなるじゃん。
- 59 名前:Socket774 :2007/05/05(土) 19:18:04 ID:fjI7JcMu
- 231 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 19:13:43 ID:ML3bg+Sf0
そもそもPS3の勝ちって何ですか
1.Wiiから今世代機トップシェアを奪還すること
2.ゲームから撤退しないこと
3.今年中にはゲームから撤退しないこと
1はまず無理だと思ってますが
233 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 19:14:59 ID:rWwJDbs70
詭弁のガイドライン
6.一見、関係がありそうで関係のない話を始める
「そもそもPS3の勝ちって何ですか?」
234 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 19:15:28 ID:nLMTJSGq0
>>231
そもそもミス設計って何ですか
論点すりかえるなよ
- 60 名前:Socket774 :2007/05/05(土) 19:37:32 ID:fjI7JcMu
- 235 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 19:19:53 ID:ML3bg+Sf0
「PS3が勝つる!」に対してレスしたのに詭弁扱いすることのほうが
よっぽど詭弁かと。
トレンドを見誤ったという点ではハードそのものがミス設計だよ
238 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 19:24:57 ID:rWwJDbs70
そもそも>>216の「これでPS3勝つる」は性能面でって意味だろ(どうせ皮肉だろうが)
>トレンドを見誤ったという点ではハードそのものがミス設計だよ
ミスリードも甚だしいなw
241 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 19:36:27 ID:ML3bg+Sf0
トレンドってようは商売になるかどうかだよ。
結果論として商売になってない。売り上げ予測を下方修正してる。
PS3は時に定価より安値で売られてるのに、Wiiは逆だ。
まあ、PS3の捨て値>Wiiのボッタクリ値ではあるけど。
240 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 19:29:29 ID:rWwJDbs70
団子氏はCellスレとVSスレを勘違いしているご様子
- 61 名前:Socket774 :2007/05/05(土) 19:54:19 ID:fjI7JcMu
- 団子の往生際の悪さを生で見たい人はCellスレまで
http://ex22.2ch.net/test/read.cgi/ghard/1177951427/l50
- 62 名前:Socket774 :2007/05/05(土) 20:10:43 ID:libR8IGf
- >>61
まさにゲハコテそのものでワロタ
- 63 名前:MACオタ>58-62 さん :2007/05/05(土) 22:00:09 ID:PYZKrr9x
- >>58-62
面白くない。。。と言っちゃ嘘になるすけど、ここ団子さんの行状を語るスレッドじゃないす。
- 64 名前:Socket774 :2007/05/05(土) 22:10:31 ID:8qHVShNy
- ハード詳しくないのに無理に語ろうとするからボロが出たな
- 65 名前:Socket774 :2007/05/05(土) 22:52:59 ID:a4ufpd/P
- 307 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 22:26:19 ID:ML3bg+Sf0
そういえばLSの存在を忘れてた。
Cellでシェーダ処理を行う場合、LSを小さなVRAMと考えてテンポラリ的に使用すれば、
帯域的にはもっと凄いことになる。
<中略>
↑いや、最初から言ってることだけど、これのお目出度さが解らないあたりがGK脳というか
308 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 22:28:44 ID:EghhwPrU0
>>307
複数IDを駆使した自演?
誰もそういう釣りにいちいち食いつく気もおこらないだけ。
309 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 22:30:16 ID:ML3bg+Sf0
俺が否定するまでマンセーしてたけどなwww
310 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 22:32:48 ID:EghhwPrU0
イカ臭い書き込みばっかりで斜め読みしかしてないけど、
ヲーズマンですか?って突っ込みしか入ってないような。
311 名前:名無しさん必死だな[sage] 投稿日:2007/05/05(土) 22:33:05 ID:bdN1r93/0
ID:KzXs2OL60をマンセーしてるカキコなんて1つも無いよ
ヤクチューだろってカキコはあるけど
315 名前:・∀・)っ-くコ:彡-[sage] 投稿日:2007/05/05(土) 22:48:23 ID:ML3bg+Sf0
>>306によるとここは ID:bdN1r93/0 のスレらしいので
ずらかる
腹イテェwww
- 66 名前:MACオタ :2007/05/05(土) 23:15:09 ID:PYZKrr9x
- せっかく今日わbarcelonaの最適化ガイド(>>57参照)も出て、お得意のSSE性能に関する
講釈もできたものを、わざわざゲーハー板で存在しない敵相手に大暴れってのも。。。
- 67 名前:Socket774 :2007/05/06(日) 00:34:58 ID:XtaCnD1x
- ようやく彼の身の丈にあった居場所が見つかったようだな
- 68 名前:+++ :2007/05/06(日) 23:10:17 ID:kzz9v83a
- High End Amiga System To Use PA Semi Multicore Chips
http://www.osnews.com/story.php/17856/High-End-Amiga-System-To-Use-PA-Semi-Multicore-Chips
P.A.Semiのチップが新Amigaに使われるって、・・まあ今更Amigaかよっていう話になるけど
>>53
ナノインプリント・リソはEUV対抗として一番強力じゃないかと(TSMCはEB露光とか言ってたけど)。
これが実用になるんなら、Intel以外が喜びそうだ。
- 69 名前:MACオタ>+++ さん :2007/05/07(月) 00:02:34 ID:smbeKttC
- >>68
マスクコストが下がると実験的プロセッサを先端プロセスで造り易くなるという点で、
世の中面白くなりそうだと期待しているす。
ちなみにEBわスループットが下がる上、装置に高レベルの磁気遮蔽が必要とか
難しい点が多いと思うす。
- 70 名前:・∀・)っ-○◎● :2007/05/07(月) 01:50:29 ID:KBnTIzAq
- >>66
MOVAPSですらレイテンシ2じゃ語る価値もねーだろwwww
- 71 名前:・∀・)っ-○◎● :2007/05/07(月) 01:59:37 ID:KBnTIzAq
- さらにcellはSIMDではない(笑)
- 72 名前:Socket774 :2007/05/07(月) 02:34:02 ID:u3py3PhV
- 実際問題movapsに待たされる局面ってあるか?
oooまでやっててレイテンシが1か2で性能変わるもんか?
- 73 名前:・∀・)っ-○◎● :2007/05/07(月) 02:41:35 ID:KBnTIzAq
- とりあえずLatency-Throughput : 2-0.5ってCore 2の1-0.33と比べれば激しくしんどい。
4並列処理を意識して徹底的にチューニングしてもIPC=2だからな。
フェッチ帯域やLoadの本数の差が出やすい(Barcelona優位)浮動小数以外の
スコアをAMDが公表しないのも道理
- 74 名前:Socket774 :2007/05/07(月) 03:07:14 ID:/0B3aECT
- http://pc9.2ch.net/test/read.cgi/jisaku/1169393906/815
- 75 名前:Socket774 :2007/05/07(月) 03:12:16 ID:36/7CxRO
- >Latency-Throughput : 2-0.5ってCore 2の1-0.33
FSTOREでも MOVAPS xmm, xmmを実行できるよ
- 76 名前:・∀・)っ-○◎● :2007/05/07(月) 03:12:32 ID:KBnTIzAq
- XMMレジスタは、8本もしくは16本(x64)ですが?
レイテンシが長いと、ストール頻度は増大。
もしくはそれを回避するためのアンローリングにより
コードサイズやロード・ストアの発行頻度の増大を招く。
- 77 名前:・∀・)っ-○◎● :2007/05/07(月) 03:14:24 ID:KBnTIzAq
- >>75
そこは見落としてた。
現実問題として使えんと思うよ。Core2と比べてL/Sが忙しくなるはずだ。
- 78 名前:・∀・)っ-○◎● :2007/05/07(月) 03:27:41 ID:KBnTIzAq
- movapsだけがレイテンシ大きいんじゃなくて、ほとんどのSIMD整数演算のレイテンシがほぼ倍だ。
まあ、予想はついてたことだけど、性能を引き出すには「書き分け」は必須になるな
なにが変わったかというと、Intelコンパイラに言いがかりつける要因が再び出来上がったということ。
いい加減純正コンパイラ作ってください。
- 79 名前:Socket774 :2007/05/07(月) 06:07:54 ID:O6XMiobS
- あの一つ質問なんだけど、今のコア2って改良はしてても結局P6なの?
- 80 名前:Socket774 :2007/05/07(月) 06:37:29 ID:XFXVMjY5
- 糞スレageんなウンコゲハ厨
- 81 名前:Socket774 :2007/05/07(月) 06:59:40 ID:CVBGeZi6
- >>79
CPUIDで Family=6 だから Intel の扱いとしては Core2Duo は P6
最初の P6 から大きく変わったけど、同種と見るか別種と見るかはあまり意味が無いような
- 82 名前:Socket774 :2007/05/07(月) 22:50:37 ID:jDeQX4CO
- IntelのえらいひともRockのことを気にしているというネタ
The Geology of Sun
http://interconnects.blogspot.com/2007/05/geology-of-sun.html
- 83 名前:MACオタ>82 さん :2007/05/07(月) 22:58:31 ID:smbeKttC
- >>82
富士通の安藤氏もあのwebサイトを長年やっているし、プロのアーキテクトも他人の仕事わ
普通に気になるんじゃないすかね。。。
- 84 名前:Socket774 :2007/05/08(火) 00:34:28 ID:DA6D1OLq
- ついでにこいつもはっとくか
Sun's chip gurus theorize about obliterating IBM and Intel
http://www.theregister.co.uk/2007/05/04/sun_proximity_communications/
- 85 名前:MACオタ :2007/05/08(火) 20:30:03 ID:aS05Llh+
- ダイスタッキング技術に関するレビューす。
http://www.realworldtech.com/page.cfm?ArticleID=RWT050207213241
配線長短縮による性能向上に関する部分わ、話半分に聞いておいた方が良いかもしれない
すけど、Intel, IBM共に注力している技術すから目を付けておいて損わ無いす。
- 86 名前:Socket774 :2007/05/08(火) 22:33:07 ID:/7eIBh5C
- 45nm版UltraSPARCはUMCで製造される模様
TI tips foundry strategy; UMC wins Sparc business
http://www.eetimes.com/news/latest/showArticle.jhtml?articleID=199300152
- 87 名前:Socket774 :2007/05/08(火) 22:40:39 ID:/7eIBh5C
- >>85
信号はいいけど電源供給は足りるんかね
- 88 名前:Socket774 :2007/05/09(水) 02:22:11 ID:K3+pD1f8
- Amigaほしいなw
- 89 名前:Socket774 :2007/05/09(水) 02:31:40 ID:jzOrbd8g
- 富士通がSPARCをやめるかもしれないというお話
http://itpro.nikkeibp.co.jp/article/MAG/20070427/269779/
- 90 名前:レトリック君 :2007/05/09(水) 03:36:02 ID:EHpKsaKv
- 良く今まで粘った
というか見込みのないことに時間費やし杉(ry
- 91 名前:Socket774 :2007/05/09(水) 03:56:58 ID:MAxEHcp7
- 新Amiga上位モデルの仕様が明らかに - PPC 970互換デュアルコアCPUを搭載
http://journal.mycom.co.jp/news/2007/05/08/010/index.html
- 92 名前:Socket774 :2007/05/09(水) 05:51:24 ID:dwgGJPK9
- >>89
それホントに「主任編集委員」が書いた記事か。
「返す刀」って攻撃する時の例えだろ。SunがAMDやIntelに斬りつけたのかよ。
最後の段落も、「…の誤算。これが〜見直し論」である。」って、どう語句を補完すればいいのやら。
「とっととx86-64に一本化しろ」と思ってて、それに合いそうな事実を並べてるだけのような。
富士通のSPARC64が前途多難なのは間違いないが。
- 93 名前:MACオタ :2007/05/09(水) 18:37:58 ID:QqcrkS6w
- xbox360版のLinuxに関するプレスリリースが出てるす。
http://www.free60.org/wiki/Press_Release_2007-05-08
----------------------
The free60 project today announced the release of a new Live CD enabling users to try
out the GNU/Linux Open Source operating system on Microsoft's Xbox 360 gaming consoles.
The new Live CD supports all Xbox 360 consoles with firmware versions 4532 and 4548 and
can be run without affecting the console's normal functionality.
----------------------
ハック版ゆえにハイパーバイザの制限も無いし、PowerPCに興味を持つオープンソース作者向けの
プラットフォームわPS3 Linuxより、こちらが有望すかね。。。
- 94 名前:Socket774 :2007/05/09(水) 21:37:25 ID:G7pS80Md
- Amigaほしいな
- 95 名前:・∀・)っ-○◎● :2007/05/09(水) 23:59:43 ID:csI2ROsd
- > PWRficient
ktkrktkr
夢が広がりんぐwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww
- 96 名前:MACオタ>レトリック さん :2007/05/10(木) 00:04:56 ID:EEUG0kKL
- >>90
時々ハンドルを変えるのわ個人の自由かと思うすけど、"latest"の件で取り下げた
名前を使うのわ逆効果じゃないすか?
ログ残してるヒトって少なくないので、無駄に煽られるネタになるかと思うす。
- 97 名前:・∀・)っ-○◎● :2007/05/10(木) 00:08:24 ID:adaGpuZ9
- ユー「更にcellはSIMDではない」をハンドルにしちゃえYO
- 98 名前:MACオタ :2007/05/10(木) 00:24:16 ID:EEUG0kKL
- NetlibがPS3クラスタの構成ガイドブックをポストしてるす。
http://www.netlib.org/utk/people/JackDongarra/PAPERS/scop3.pdf
MPI関連のインストールについても記述があるす。
確か、2ちゃんねるでPS3クラスタを自作するって息巻いていたヒトがいたかと思うので、
参考になるかと。。。
- 99 名前:MACオタ :2007/05/10(木) 00:26:13 ID:EEUG0kKL
- こういう(>>97)団子さんのような粘着のヒトがいるすよ。
もちろん私もネタ用にログ残してるすから、ヒトのことわ言えないすけどね(笑)
- 100 名前:・∀・)っ-○◎● :2007/05/10(木) 00:56:48 ID:adaGpuZ9
- どうでもいいし
更にcellはSIMDではない
- 101 名前:レトリック君 :2007/05/10(木) 01:11:46 ID:I7rVz91G
- >>96
心配ならthx、しかし2chは遊び、気にならないタチなので、
気分でハンドルは変えてます。(しかしこのスレ保存してどうすんの…)
>>97
くだらんよ。SPEではなくcellをSIMDとして使いなされ。
- 102 名前:レトリック君 :2007/05/10(木) 01:15:52 ID:I7rVz91G
- cellは片側単精度のfmacの寄せ集めってところを1000歩譲って我慢しても
softwareからはむちゃくちゃ使いにくそうだな。
開発者さんは大変だわ。
- 103 名前:レトリック君 :2007/05/10(木) 01:19:18 ID:I7rVz91G
- SMTと依存、性能特性について書こうと思ってたら
前スレから話が逸れに逸れた
また今度だ
- 104 名前:レトリック君 :2007/05/10(木) 01:26:10 ID:I7rVz91G
- 片側じゃなくて入り口両方か…
- 105 名前:Socket774 :2007/05/10(木) 14:03:39 ID:QTNM4DYi
- 団子は下らん話をまだ続けているのか。
CellのSPEにSIMD演算器が入っているのは事実だがCellをSIMDと
呼んでいいかは別問題だろう。
- 106 名前:Socket774 :2007/05/10(木) 14:21:21 ID:03m9pRyn
- 団子は俺のCore2とかキモイ発言するからな。
自己アイデンティティが特定のCPUと同化してる。おかしな自称プログラマー
- 107 名前:Socket774 :2007/05/10(木) 15:11:32 ID:HpzAJZpd
- > CellのSPEにSIMD演算器が入っているのは事実だがCellをSIMDと
> 呼んでいいかは別問題だろう。
これ言っちゃうと、SIMDユニット付いてるのに
SIMDではないと言い切っていいのか、という堂々巡り開始。
- 108 名前:Socket774 :2007/05/10(木) 15:19:07 ID:QTNM4DYi
- >>107
いや、CellのinstructionとしてSPEのinstruction単体を含めるかって問題がある。
- 109 名前:Socket774 :2007/05/10(木) 15:22:33 ID:HpzAJZpd
- >>108
明らかに包含関係にあると思うが。
- 110 名前:Socket774 :2007/05/10(木) 15:28:45 ID:QTNM4DYi
- >>109
え?メモリ上のinstructionをSPEは直接実行できないのに?
- 111 名前:Socket774 :2007/05/10(木) 15:34:15 ID:HpzAJZpd
- >>110
それが何か?
- 112 名前:Socket774 :2007/05/10(木) 15:36:17 ID:QTNM4DYi
- >>111
わかんないならもういいよ。
- 113 名前:Socket774 :2007/05/10(木) 15:40:45 ID:HpzAJZpd
- >>112
全く無意味な観点からの議論だからな。
時間を浪費するにはもってこいだ。
- 114 名前:Socket774 :2007/05/10(木) 15:53:07 ID:QTNM4DYi
- >>113
視点の違いにより評価が変わるという事を「無意味」と表現するなんて
議論する価値のない人間ですね。
- 115 名前:Socket774 :2007/05/10(木) 15:56:46 ID:HpzAJZpd
- >>114
この議論では何も産まないから無意味だな。
別にどう定義すればどうなるってのは最初からわかってるしぃ。
ただの、俺様の主張をいかに押し通すかゲームwww
- 116 名前:Socket774 :2007/05/10(木) 15:56:55 ID:n3Ef0rxO
- CrusoeをVIEWと考えるべきか?それともx86と考えるべきか?と似たような話か?
- 117 名前:Socket774 :2007/05/10(木) 16:02:03 ID:QTNM4DYi
- >>115
> 別にどう定義すればどうなるってのは最初からわかってるしぃ。
本当かどうかあやしいもんだが。下らん。
それなら面白い側に立ったほうがいいじゃないか。
>>116
そんな感じ。正直どっちでもいい。だから反団子。
- 118 名前:Socket774 :2007/05/10(木) 16:25:14 ID:HpzAJZpd
- >>116
だな。
AとBがあって現実的には両方が微妙に混ざってるわけだが、
定義や屁理屈でもってAとBの範囲を弄って
例えば、片方を全体化してもう一方ではない、とか言ってるだけ。
そんな、まことに不毛な議論でございます。
- 119 名前:Socket774 :2007/05/10(木) 20:05:02 ID:kUTaEIWe
- IBM's Power 6 promises 5GHz boost
http://www.theinquirer.net/default.aspx?article=39522
- 120 名前:Socket774 :2007/05/10(木) 21:54:17 ID:Qi9VMbZY
- >>102
むちゃくちゃ使いにくいが、ツボにハマった時はそれなりに速いぞ。
まあそのツボにハメる作業が大変なのだが・・・
- 121 名前:・∀・)っ-○◎● :2007/05/10(木) 22:00:31 ID:adaGpuZ9
- >>106
「俺の」ってなんだよwwww
おまい頭おかしいwwwwwww被害妄想きめぇwwwwwww
- 122 名前:・∀・)っ-○◎● :2007/05/10(木) 22:04:00 ID:adaGpuZ9
- VIEWってなんだおwwwww
まさかVLIWじゃないよなwwwwwww
このスレクォリティ高ぇwwwwwwwww
流石、「更にcellはSIMDではない」の人だwwwww
- 123 名前:・∀・)っ-○◎● :2007/05/10(木) 22:12:59 ID:adaGpuZ9
- >>110
変換したコードをトレースキャッシュ上に展開しないと実行できないNetBurstアーキテクチャは
オメー的にはいったい何なんだよ
>>120
このスレのギャグセンスは俺のツボにハマりまくってる
本人たちにとってはガチレスだから余計おもろい
- 124 名前:・∀・)っ-○◎● :2007/05/10(木) 22:27:05 ID:adaGpuZ9
- >>107-108
そもそもSPEを全く使わなくともPPEだけでSIMD演算はできる。
SPEがSIMD演算「しかできない」だけ。
ID:QTNM4DYiは頭悪すぎます
- 125 名前:レトリック君 :2007/05/10(木) 22:40:28 ID:ZPJ5zrqx
- MMXもSIMD拡張だがMMX Pentiumは…
- 126 名前:・∀・)っ-○◎● :2007/05/10(木) 22:41:28 ID:adaGpuZ9
- 「CellはSIMDである」なんて誰も言ってなかったのに唐突に
SIMDではないと言った馬鹿本人の登場です
- 127 名前:レトリック君 :2007/05/10(木) 22:41:48 ID:ZPJ5zrqx
- >>123
NetBurst architectureと言います。
- 128 名前:・∀・)っ-○◎● :2007/05/10(木) 23:02:05 ID:adaGpuZ9
- ホント、次スレのテンプレに追加したいくらいの爆笑レスの宝庫だな
- 129 名前:Socket774 :2007/05/10(木) 23:07:07 ID:QIDPOvKU
- すっかりネタスレ化したな
- 130 名前:Socket774 :2007/05/10(木) 23:56:50 ID:shjkxm9J
- Reborn Sun Micro plots server CPU push
http://www.eetimes.com/showArticle.jhtml?articleID=199203751
まあ特に新しい情報はありませんが、このスレ的には↓ここらあたりかな
> "We don't have the volume Intel has, so we will not compete on cost. Intel has
> the best transistor designers--they are leading the semiconductor industry--so
> we will not compete with them in frequency. So we decided to compete in
> architecture. That is the only thing left, and not anyone's monopoly," said Yen.
- 131 名前:・∀・)っ-○◎● :2007/05/11(金) 00:03:56 ID:adaGpuZ9
- またすぐ re-"bone" しそうな・・・・
- 132 名前:Socket774 :2007/05/11(金) 00:07:20 ID:shjkxm9J
- >>131
つかIDがGPUw
- 133 名前:・∀・)っ-○◎● :2007/05/11(金) 00:11:15 ID:TeONZpf9
- 今気づいた
しかもadaとは熱いな
- 134 名前:Socket774 :2007/05/11(金) 00:19:28 ID:C8OcO+TW
- CPUスレなんだから、むしろz9だろ
- 135 名前:Socket774 :2007/05/11(金) 15:21:58 ID:INgAr72e
- >>129
団子の妄想ネタスレだろ。他人が書いたネタを基に妄想して次世代を語る。
そして団子風味の解析や予想が加わったとたん怪しくなる。
いろいろ突っ込まれて苦しくなったら、地下にもぐり。
まとめて猫パンチレスを返す。そして、何故か好意的な単行レスがつく。
これの繰り返し。
なんだかんだ言う割りにコード晒したことはない。
- 136 名前:Socket774 :2007/05/11(金) 15:52:05 ID:ERWoXXsT
- 2bit以上のCPUは概ねSIMDな命令を持つ
- 137 名前:Socket774 :2007/05/11(金) 16:01:28 ID:Xuaezxei
- >>135
ム板ではそこそこ晒してるっぽいが。
まぁ、お前、団子が嫌いなのは分かったがそこそこにしね?
能力の無い人間がグダグダ言っても始まらんぞ
ネタが無いなら出せ。
怪しいなら突っ込め。
>>136
どこら辺がM?
- 138 名前:Socket774 :2007/05/11(金) 16:32:38 ID:V6DgauUI
- ゲハでCellのスカラ演算が遅い云々の議論でmacヲタを撃破してたな
珍説を唱え続けるも団子が公開した実測結果には勝てなかったようだ
あれはもう暫く出てこれないだろ。
- 139 名前:Socket774 :2007/05/11(金) 16:45:41 ID:ERWoXXsT
- >>137
たとえばZ80には8つの1bitデータ同士の論理和を同時に行える命令がある
などと自分でネタ解説しなければいけないのが空しい
- 140 名前:Socket774 :2007/05/11(金) 17:06:34 ID:Xuaezxei
- ごめんごめん
>>136の意味が日本語として分かってなかった。
- 141 名前:MACオタ :2007/05/11(金) 18:47:14 ID:5t4FVfG5
- TheInquirerのPOWER6ネタ2題す。3GHzしか出ない(>>33とか)というのわ、誤報だったようで。。。
http://www.theinquirer.net/default.aspx?article=39522
---------------------
IBM HAS promised its partners that its Power 6 processors will hit between 4 to 5GHz
pretty soon now, with each SMT2 core accessing 4MB of L2 memory, and sitting astirde a
32MB level three controller.
---------------------
http://www.theinquirer.net/default.aspx?article=39556
---------------------
The Power 6 processor 5622 includes a 4.2GHz chip, an 0/2 core Power 6 and 12 DDR-2
memory slots. The Power 6 5621 upgrade is similar but includes eight DDR-2 memory slots,
he gurgled.
---------------------
- 142 名前:Socket774 :2007/05/11(金) 19:33:39 ID:Fx1BE/I1
- >>139
ネタとしてもつまんなすぎる
- 143 名前:Socket774 :2007/05/11(金) 19:46:49 ID:Xuaezxei
- >>141
ふーん
「4GHzなんてすぐ出るよ!」とか言ってたIntelみたいにならなきゃいいけど。
OoOやめてクロックあんま上がりませんでした、じゃシャレにならんからね。
そうならPower死ぬかもね。
あ、加算命令って2オペランドだからSIMDじゃね?
- 144 名前:Socket774 :2007/05/11(金) 19:47:58 ID:Xuaezxei
- ん、4GHzは今度のPenrynで達成しちゃう可能性があるのか…
- 145 名前:・∀・)っ-○◎● :2007/05/11(金) 21:07:56 ID:TeONZpf9
- 分割要素ごとにせめてラップアラウンドや飽和処理しないとSIMDとは胃炎だろ
- 146 名前:MACオタ>143 さん :2007/05/11(金) 21:16:29 ID:5t4FVfG5
- >>143
-------------------
「4GHzなんてすぐ出るよ!」とか言ってたIntelみたいにならなきゃいいけど。
-------------------
6月だか7月だかに発表されるようなサーバー製品が実物でバリデーションが終っていない訳が
無いす。デスクトップPowerPCのように大量生産して外販する部品じゃ無いすから、歩留まり等わ
別の話すけど。
- 147 名前:Socket774 :2007/05/11(金) 21:48:27 ID:RJ2/+MUE
- >>143
IBMだって「3GHzなんてすぐ出るよ!」って言ってたじゃないか
- 148 名前:・∀・)っ-○◎● :2007/05/11(金) 22:06:52 ID:TeONZpf9
- 実はPS3のCellのクロックは3.2GHzではなく3192MHz
- 149 名前:レトリック君 :2007/05/11(金) 22:41:26 ID:NVbWV9hR
- ム板ってどのスレだ。Haskell、Scheme、Pythonでは見かけんな。
叩きに行こうかなニヤニヤ
- 150 名前:・∀・)っ-○◎● :2007/05/11(金) 22:50:13 ID:TeONZpf9
- SIMDではない君おはwww
×叩きに
○叩かれに
- 151 名前:Socket774 :2007/05/11(金) 23:26:53 ID:5l8wo0tF
- >>143
このスレらしくはないが、自作板住人ぽいレスだなw
- 152 名前:レトリック君 :2007/05/12(土) 00:52:38 ID:U2v9uyJR
- おはって…
嘴の黄色い小僧になつかれちまった。やれやれ
そろそろ次の謎発言としゃれこむか。
SMTはCMTと異なり、threadの独立性が高くなるほど
migrationによるscalability抑制の性能特性要因を持つ。
- 153 名前:・∀・)っ-○◎● :2007/05/12(土) 06:31:22 ID:wA/vLTHp
- 中途半端に日本語と英語混ぜるなボケ
- 154 名前:Socket774 :2007/05/12(土) 09:05:21 ID:wmSyDxhy
- 妄想ネタ書くなボケ
- 155 名前:・∀・)っ-○◎● :2007/05/12(土) 09:16:00 ID:wA/vLTHp
- >>154=妄想家
- 156 名前:Socket774 :2007/05/12(土) 10:24:03 ID:4V7fONaX
- >>152
んじゃオジサンがクソつまんねーたとえ話を披露してあげよう
CMPは一つの机で二人が仕事してる
SMPは別の机で二人が仕事してる
- 157 名前:MACオタ>156 さん :2007/05/12(土) 10:36:56 ID:gD9+7XNL
- >>156
こうだと思うす。
・SMP: 別の机で二人が仕事
・CMP: 一つの机で二人が仕事、でも筆入れわ 二つ
・SMT: 一つの机で二人が仕事、筆入れも一つ
- 158 名前:Socket774 :2007/05/12(土) 13:02:51 ID:jYGJWy07
- >>120
ツボッた時は速いって何かCPUというよりDSPだな
- 159 名前:レトリック君 :2007/05/12(土) 13:30:05 ID:/u1syYKZ
- SMP: 二つの机にそれぞれ文房具があり、それぞれの机で二人が仕事
CMT: 一つの机に二つの文房具があり、二人が並んでお仕事
SMT: 一つの机で文房具を二つ使って一人が二つの仕事をヒーコラ掛け持ち
じゃない?
- 160 名前:MACオタ>レトリック さん :2007/05/12(土) 13:48:34 ID:gD9+7XNL
- >>159
理解できていないのわ、譬とリソースの概念のどちらなんすかね。。。
- 161 名前:・∀・)っ-○◎● :2007/05/12(土) 13:50:48 ID:wA/vLTHp
- SPEの場合だけレジスタはメモリという人は
言うことが違うな
- 162 名前:Socket774 :2007/05/12(土) 13:58:40 ID:pWCfv6Sz
- >>157SMT出てくると↓になっちゃう
チップ→机
同時に動くスレッド数→人数
コア→筆入れ
コア→仕事する人にしたほうがよくない?
- 163 名前:MACオタ>団子 さん :2007/05/12(土) 14:01:16 ID:gD9+7XNL
- >>161
-------------------
SPEの場合だけレジスタはメモリという人は
-------------------
この話すか?レジスタわキャッシュ的に使うと書いたすけど、メモリとわ書いていないように見えるす。
もりかして「メモリ階層」という概念をご存じ無くて、メモリ=メインメモリという思い込みなんすかね。。。
http://ex22.2ch.net/test/read.cgi/ghard/1177951427/656
===================
656 名前:MACオタ>団子 さん 投稿日:2007/05/10(木) 03:53:14 ID:DvaX376M0
[中略]
SPUにおけるトップレベルのメモリわ、汎用レジスタそのものと考えれば良いかと思うす。
===================
ちなみにSPEに限らず、Itanium等、沢山レジスタがあればregister-blockingなんてキャッシュと
同様のテクニックが可能す。
http://icl.cs.utk.edu/iclprojects/pages/files/sans/yelick-bebop.ppt
- 164 名前:・∀・)っ-○◎● :2007/05/12(土) 14:08:39 ID:wA/vLTHp
- ルネサスの技術者が殆どのケースで汎用レジスタは16本あれば十分って言ってるんだがな。
長いレイテンシの隠蔽を前提するにはテクニックが必要だっていうのはまあその通りなんだが
コンパイラレベルではどうしようもない変な条件が付く時点で、それは結局スカラ演算弱いんでしょってことで。
- 165 名前:MACオタ>162 さん :2007/05/12(土) 14:08:48 ID:gD9+7XNL
- >>162
最近、本気でプロセッサのボトルネックがデコーダにあるとか考えているヒトがいそうで恐ろしい
すけど、SMTの概念わ命令自体わキューに無尽蔵に詰まっていて、実行リソースを分け合う
というモノす。
現実にわ、命令キュー(ROB)のサイズ自体に制限があるために 「命令自体わキューに無尽蔵に
詰まっていて」の部分が成り立たなくて、色々工夫が必要なんすけど。。。
- 166 名前:Socket774 :2007/05/12(土) 14:09:53 ID:FFVqGsn4
- コアを人間に喩えるか演算ユニットを人間に喩えるかの違いかな
1つのスレッドを1つの仕事に喩えた方が俺にとってはわかりやすいけど
- 167 名前:MACオタ>団子 さん :2007/05/12(土) 14:11:23 ID:gD9+7XNL
- >>164
----------------
ルネサスの技術者が殆どのケースで汎用レジスタは16本あれば十分って言ってるんだがな。
----------------
汎用レジスタ32個のAVRアーキテクチャに対するFUDかと。。。
- 168 名前:レトリック君 :2007/05/12(土) 14:30:33 ID:baQtcMoW
- 理解できないのは「譬」の読みかな。
モレの例えでは
人間=演算ユニット
文房具=中のリソース
机=core・L2
(そして部屋=chip)
- 169 名前:レトリック君 :2007/05/12(土) 14:35:48 ID:baQtcMoW
- 必用な汎用レジスタの本数ねぇ…
用途によっては数個で十分、別の用途では256あっても
全然足らない(codeの急激な増大をまねく)。
対象と判定条件で全然違ってくる、そう言う議論だな
- 170 名前:Socket774 :2007/05/12(土) 14:36:22 ID:BXpFFjEK
- 伸びてると思ったらこれかよ、orz
- 171 名前:Socket774 :2007/05/12(土) 14:36:57 ID:FFVqGsn4
- 読み返してみたらわけわからないこと言ってるな
>>166の二行目は無かったことに
- 172 名前:Socket774 :2007/05/12(土) 14:38:34 ID:BXpFFjEK
- 汎用レジスタは4本、多くても8本で十分だろ
68kが出たときには、こんなたくさんあるのに
使えるやついるのか?とモトローラに問い詰めたかった
- 173 名前:Socket774 :2007/05/12(土) 14:50:14 ID:FFVqGsn4
- >>168
あれ?そうなんだ
それだと>>166の1行目もなかったことにw
- 174 名前:・∀・)っ-○◎● :2007/05/12(土) 14:51:01 ID:wA/vLTHp
- http://resource.renesas.com/lib/jpn/superh/theme/03.html
てか演算のレイテンシ馬鹿みたいに大きくなきゃそんなに要らんよ
- 175 名前:Socket774 :2007/05/12(土) 14:56:30 ID:sFnyD+05
- 「組み込み用途ならば」って書いてある気がする
- 176 名前:・∀・)っ-○◎● :2007/05/12(土) 14:58:47 ID:wA/vLTHp
- UNIX上のプログラムでも16変数以上は稀とあるな
- 177 名前:MACオタ>団子 さん :2007/05/12(土) 15:00:34 ID:gD9+7XNL
- >>174
図3を素直に信じると、要素数16以上の配列を使う関数ってほぼ0ってことになるすけど(笑)
15文字制限のprintfがメジャーな世界ってあるすか?
配列わポインタしか勘定に入れていないとか、色々ごまかしがありそうす(笑)
- 178 名前:レトリック君 :2007/05/12(土) 15:00:59 ID:XNhNW89w
- ルネの石の設計者って、あまりsoftware分かってない
unix使えるヤシどれほどいるのか
だから鵜呑みはどうかと
- 179 名前:・∀・)っ-○◎● :2007/05/12(土) 15:04:27 ID:wA/vLTHp
- 配列を全部レジスタに配置するような変態アーキテクチャは要らんだろ
アドレッシングモードをリッチにした方がいい
- 180 名前:・∀・)っ-○◎● :2007/05/12(土) 15:04:46 ID:wA/vLTHp
- ベクトル演算がわかってないカスは黙れ
- 181 名前:・∀・)っ-○◎● :2007/05/12(土) 15:06:29 ID:wA/vLTHp
- SHの開発主任は麻布から東大の典型的秀才
- 182 名前:MACオタ>団子 さん :2007/05/12(土) 15:06:42 ID:gD9+7XNL
- >>179
UNIX上のプログラムで「関数呼び出し時の引数とローカル変数の数」が16個以下になる例が、
統計的に100%なんて戯言を信じるかどうかって話すけど(笑)
- 183 名前:レトリック君 :2007/05/12(土) 15:07:05 ID:XNhNW89w
- streamのCSEのことも、たまには思い出してやって下さい
- 184 名前:Socket774 :2007/05/12(土) 15:08:54 ID:FQ2CjqB1
- 三大糞コテの同窓会かよ
- 185 名前:レトリック君 :2007/05/12(土) 15:09:06 ID:XNhNW89w
- >>
ニヤニヤ
- 186 名前:レトリック君 :2007/05/12(土) 15:10:04 ID:XNhNW89w
- 同窓会、いち抜けた ノシ
- 187 名前:・∀・)っ-○◎● :2007/05/12(土) 15:10:16 ID:wA/vLTHp
- レジスタの多さに甘んじて実行レイテンシを短くする努力を怠る糞アーキは
メチャメチャにホロン部
- 188 名前:MACオタ>団子 さん :2007/05/12(土) 15:12:30 ID:gD9+7XNL
- >>187
滅ぶかどうかわ知らないすけど、本気でローカル変数だけでも16個以下の関数しか世の中に存在
しないと思っているかどうかが知りたいす。
- 189 名前:Socket774 :2007/05/12(土) 15:12:33 ID:sFnyD+05
- 団子おすすめのItaniumはどうなの?
- 190 名前:・∀・)っ-○◎● :2007/05/12(土) 15:15:48 ID:wA/vLTHp
- 俺自身がローカル変数100個とか平気で使うし。レジスタが多ければね。
んで、どこに100%なんて書いてあるんだ?
- 191 名前:MACオタ>団子 さん :2007/05/12(土) 15:22:26 ID:gD9+7XNL
- >>190
-----------------
どこに100%なんて書いてあるんだ?
-----------------
これを信じているかどうか?という質問す。
http://resource.renesas.com/lib/jpn/superh/theme/images/03_zu3.gif
- 192 名前:・∀・)っ-○◎● :2007/05/12(土) 15:32:03 ID:wA/vLTHp
- >変数が10個以下の関数が95%以上を占めることがわかった。
とは書いてあるが、16個までで100%うんぬんはどうみても脳内妄想です。
本当にありがとうございました。
Itaniumがあんだけのレジスタが必要なのはユニット数が多いからでそ。
まあ、SHが否定してるPA-RISCの血統も引き継いではいるんだが。
まあ、汎用レジスタ8本のx86のほうがPowerPCを搭載したMacを
大きく引き離すようになった時点で、レジスタ本数が本質じゃないことは
既に分かり切ったことかと。
- 193 名前:MACオタ>団子 さん :2007/05/12(土) 15:42:13 ID:gD9+7XNL
- >>192
-------------------
>変数が10個以下の関数が95%以上を占めることがわかった。
とは書いてあるが、16個までで100%うんぬんはどうみても脳内妄想です。
-------------------
http://resource.renesas.com/lib/jpn/superh/theme/images/03_zu3.gif
しつこいようすけど、この図を見て何%に見えるのかが聞きたいす。まともな科学教育を
受けていれば、目盛りがついたものわどこまでが有効数字か教わっている筈かと。。。
- 194 名前:Socket774 :2007/05/12(土) 15:44:47 ID:sFnyD+05
- つか>>169が正しいと思う
とか書くとレトリック君の自演と思われるかな
ほぼ入れ替わりで出てきちゃったし
- 195 名前:・∀・)っ-○◎● :2007/05/12(土) 15:45:57 ID:wA/vLTHp
- プレゼン用に簡略したグラフにいちゃもん付ける馬鹿は手に負えない
- 196 名前:Socket774 :2007/05/12(土) 15:48:41 ID:1jWIzerW
- 関数呼び出し回数の割合だから、多変数関数が存在しててもほとんど呼び出されない、ってことでしょ。
>>192
Itanium のは、いっぺんに128個使うつもりではなくて、
ループでのレジスタのローテイトとか、SPARC風レジスタウィンドウのためでは?
あと、
8レジスタじゃ少なすぎるから、x86-64では16になったんでは?
- 197 名前:MACオタ>団子 さん :2007/05/12(土) 15:49:36 ID:gD9+7XNL
- >>195
---------------------
プレゼン用に簡略したグラフ
---------------------
http://resource.renesas.com/lib/jpn/superh/theme/01.html
=====================
出典:日経エレクトロニクス1997年7月14日号開発ストーリ「SHマイコン開発-第1回」P129-132
=====================
「大阪府立大院生が論文データを捏造 理想的な数値1千個」
http://www.asahi.com/national/update/0227/OSK200702270094.html
=====================
トランジスタの特性を示す二つのグラフのデータのとり方の不自然さに助手らが気づいた。
=====================
- 198 名前:・∀・)っ-○◎● :2007/05/12(土) 15:52:44 ID:wA/vLTHp
- なんにせよ汎用レジスタ8本のCPU作ってる会社が半導体業界のトップに君臨してるわけで
無論ルネサスも業界屈指だな
- 199 名前:MACオタ>団子 さん :2007/05/12(土) 16:01:52 ID:gD9+7XNL
- >>198
----------------
無論ルネサスも業界屈指だな
----------------
素直に「業界屈指の」ルネサスなんで捏造資料と気付かずに騙されたと書けば良いかと。。。
学歴コンプレックス(>>181)も気にしないほうが良いと思うす。
- 200 名前:・∀・)っ-○◎● :2007/05/12(土) 16:04:44 ID:wA/vLTHp
- 捏造資料って言いがかりかwwwww
SPUのレジスタがメモリだと主張したりデータも示さずスカラ演算が遅くないと言ったり
妄想に限りがないな
- 201 名前:MACオタ>団子 さん :2007/05/12(土) 16:06:15 ID:gD9+7XNL
- >>200
---------------
捏造資料って言いがかりかwwwww
---------------
でわ、>>193へ回答をお願いするす。数字を書くだけだから簡単だと思うすけど。。。
- 202 名前:・∀・)っ-○◎● :2007/05/12(土) 16:10:46 ID:wA/vLTHp
- ほぼ100%とは思うが、スケールの具合からして有効数字はまずないな
グラフが途中で切れたように見えるのはプロットツールの問題じゃないのか
学術論文そのまんまを持ち出してきてるわけでもあるまい。
- 203 名前:MACオタ :2007/05/12(土) 16:11:21 ID:gD9+7XNL
- 参考までに、目盛りの読み取り方の常識をどうぞ。
http://kuchem.kyoto-u.ac.jp/bukka/member/yyosuke/uebung/memori91.htm
--------------------
通常、ビュレットなどの目盛りは最小目盛りの十分の一(通常 0.01 mL)まで読むことになっている。
--------------------
- 204 名前:Socket774 :2007/05/12(土) 16:14:15 ID:sFnyD+05
- 100%かどうかなんて、どうでもいいのに
今回の話は、99.99%か100%かで結論が変わるようなものじゃないでしょ
- 205 名前:MACオタ>団子 さん :2007/05/12(土) 16:16:01 ID:gD9+7XNL
- >>202
まずこの件について
----------------
学術論文そのまんまを持ち出してきてるわけでもあるまい。
----------------
日経エレクトロニクスわ学術論文扱いす。例えば、http://www.sel.co.jp/sel_p03.htm
その上で、
----------------
ほぼ100%とは思うが
----------------
>>182をどう思うすか?
- 206 名前:Socket774 :2007/05/12(土) 16:16:18 ID:sFnyD+05
- それより>>196はスルーしちゃうの?
まあ2人でおしゃべりしてる方が楽しいのかも知れないけど
- 207 名前:・∀・)っ-○◎● :2007/05/12(土) 16:22:40 ID:wA/vLTHp
- あと、あっちのネタで悪いけどSPUで遅くならないスカラ演算のコードをいい加減、示してくださいね
もちろん机上の空論なら聞きたくない
ちなみに俺がCell向けに書いたMTのコードは本家へのコミットも検討してるくらいなんで
いつでも公開しますよ
- 208 名前:MACオタ>団子 さん :2007/05/12(土) 16:28:03 ID:gD9+7XNL
- >>207
SFMTの件なら、その後ソースコード見つけたす。シフト演算の山なんすね。
「机上の空論」で悪いとわ思うすけど、シフト演算わpermuteと同じパイプで行われるから、
この仮定が成り立たないというだけの話かと。
http://ex22.2ch.net/test/read.cgi/ghard/1177951427/661
--------------------
661 名前:MACオタ>団子 さん 投稿日:2007/05/10(木) 04:04:30 ID:DvaX376M0
>>657
スカラとベクトルがIPC的に一緒(当然ベクトルわ並列分だけスループットが高い)なので、
特にスカラが遅いということわ無いす。
permuteと演算わ別パイプラインになっているすから、並列動作可だし。
--------------------
- 209 名前:・∀・)っ-○◎● :2007/05/12(土) 16:30:28 ID:wA/vLTHp
- >>206
えーっとなんだったっけ?
REXはコードサイズが増えて性能低下するケースがあるよね。
だから一概に良いとは思わない。
まあ、何事も向き不向きはあるよね
- 210 名前:・∀・)っ-○◎● :2007/05/12(土) 16:36:56 ID:wA/vLTHp
- そもそも16バイト単位の読み書きしか出来ないプロセッサで
4バイト単位のスカラ演算を行うにはシフトは必ず発生する
だからこそ遅いって言ってるんだよ
ちなみに要素毎(32ビット迄)シフトはeven、バイトシフトはoddだ
- 211 名前:Socket774 :2007/05/12(土) 16:37:24 ID:sFnyD+05
- > まあ、何事も向き不向きはあるよね
うはw
- 212 名前:Socket774 :2007/05/12(土) 16:43:12 ID:sFnyD+05
- まあ、キャッシュですら遅いってんで、レジスタを拡張してなんとかならんか
って研究は、そこここでやってるらしいね
つっても詳しい話は知らん(というよりわからんw)けど
- 213 名前:・∀・)っ-○◎● :2007/05/12(土) 16:47:14 ID:wA/vLTHp
- ちなみに、あのネタ書いてから斉藤君とはメールで話やってて
SPE向けの最適化について助言貰っている。
昔、レジスタに番地が振られててレジスタ上にコードを並べると高速に
実行できるプロセッサが存在したそうな
- 214 名前:Socket774 :2007/05/12(土) 17:01:07 ID:sFnyD+05
- へぇ
- 215 名前:MACオタ>団子 さん :2007/05/12(土) 17:13:32 ID:gD9+7XNL
- >>213
-----------------
レジスタに番地が振られてて
-----------------
組込みだと現行の機能す。
http://www.atmel.com/dyn/resources/prod_documents/doc0938.pdf
http://www.atmel.com/dyn/resources/prod_documents/AVR204.zip
- 216 名前:MACオタ>団子 さん :2007/05/12(土) 17:15:04 ID:gD9+7XNL
- で、>>205にコメントわ付かないすか?
- 217 名前:・∀・)っ-○◎● :2007/05/12(土) 17:16:08 ID:wA/vLTHp
- SPEをスカラ演算に使ったときのロード・ストア・パーミュテーションの
レイテンシをじゅうぶん隠蔽できるケースの方が稀。
だから遅い。自明の理。
逆にあれだけのレイテンシが隠蔽できるくらいデータ並列性があるなら、SIMD化できる。
結局スカラ性能は悪い。
- 218 名前:・∀・)っ-○◎● :2007/05/12(土) 17:18:25 ID:wA/vLTHp
- グラフ捏造云々は詭弁者の言いがかり。それ以上でもそれ以下でもない。
その実態はSPEでスカラ演算が遅いことの反証すら出来ない雑魚ww
- 219 名前:・∀・)っ-○◎● :2007/05/12(土) 17:21:00 ID:wA/vLTHp
- データの正確さに拘る人間が自分では一切データを用意せず空論を語る矛盾
- 220 名前:MACオタ>団子 さん :2007/05/12(土) 17:30:02 ID:gD9+7XNL
- >>217-218
暴れるのわ結構すけど、ローカル変数の数の話わ何処に行ったすか?
------------------
ロード・ストア・パーミュテーションのレイテンシ
------------------
これについてわSIMDでもスカラでも一緒なんで、アーキテクチャの問題じゃなくて実装の問題す。
SIMDが速くてスカラが遅いというのとわ違うかと。。。
- 221 名前:レトリック君 :2007/05/12(土) 17:34:16 ID:Z8HpemwG
- >>193
このグラフはひどいな、実態からかけ離れている。
その辺にころがっているデータの都合良い部分を使ったんかいな。
レビューは受けてないのかな…
- 222 名前:Socket774 :2007/05/12(土) 17:37:31 ID:1jWIzerW
- >>220 MACオタ
16変数以上の関数があっても、それの「呼び出し回数の割合」は限りなくゼロに近い。
みんな分かっているが、団子がとぼけた答えをしているので、いつまでも終わらない。
二人の馴れ合い。
- 223 名前:レトリック君 :2007/05/12(土) 17:37:40 ID:Z8HpemwG
- がしかし、引数+変数の数だけregisterが無ければstallするという訳ではないんだよね。
よほど関数bodyが小さくない限り。
従って変数の個数でregisterの個数が多い少ないって議論は片手落ち。
ーみつをー
- 224 名前:レトリック君 :2007/05/12(土) 17:39:22 ID:Z8HpemwG
- >>222
なんだ二人はラブラブだったのか…
水を差しちゃ遺憾な、そっとしておいてあげるわ ノシ
- 225 名前:・∀・)っ-○◎● :2007/05/12(土) 17:42:48 ID:wA/vLTHp
- どーみてもパーシャルリード・ライトをサポートしないアーキテクチャの問題ですが。
なんにせよコードすら書いて検証できず詭弁ばかり並べる人よりも
多少おおざっぱでもグラフを出して説明出来る人の方が
説得力はダントツ上かと思います
まあ、SHの件は麻布高校出身のエリート(ちなみに同級生にかの古川享もいる)から
屈折した感情持っても仕方ないなと思ってしまいますでつよ。
- 226 名前:・∀・)っ-○◎● :2007/05/12(土) 17:50:13 ID:wA/vLTHp
- PCREをSPEに移植してみてください。もちろん遅くならないように。
うーんでもやっぱ口だけの人には無理かな
- 227 名前:MACオタ>222 さん :2007/05/12(土) 17:53:53 ID:gD9+7XNL
- >>222
--------------------
16変数以上の関数があっても、それの「呼び出し回数の割合」は限りなくゼロに近い。
--------------------
広く使われて(多くの場合)16変数以上使う関数の例わ>>177に書いた通りす。
配列をポインタの1変数として数えるようないかさまをしない限り、16変数以下がほぼ100%というのわ
無理かと思うす。
- 228 名前:・∀・)っ-○◎● :2007/05/12(土) 18:00:06 ID:wA/vLTHp
- 変数の個数云々の検証はレジスタ本数の決定のためであって
あたかも配列の要素数分だけレジスタを使うかのような詭弁はやめるべきだな
- 229 名前:Socket774 :2007/05/12(土) 18:06:16 ID:1jWIzerW
- >>227
配列は a[i] のiがimmediateで指定できるときは、レジスタに展開できる、
for(i=0;i<4;i++) a[i]=... → a0=, a1=, a2=, a3=
だけど
a[i] = b[ c[i] ] みたいな演算をしたいときは、
ファンタスティックなレジスタ指定が必要になります。
- 230 名前:MACオタ>団子 さん :2007/05/12(土) 18:06:42 ID:gD9+7XNL
- >>228
やっと正気に戻ったようすね(笑)
-------------------
変数の個数云々の検証はレジスタ本数の決定のため
-------------------
その場合、レジスタ本数の増減による性能の差を検証する必要があるす。
また所要レジスタの数も汎用レジスタが完全に対照か、一部の命令で使用するレジスタが
固定されているかどうか、等も大きく影響するかと思うす。
例えば>>215に上げたAVRの例でわ、一部のレジスタが直値の代入ができないために、
ldi r16, 1
mov r1, r16
のようなコードになってしまうことがあるようす。
- 231 名前:MACオタ>229 さん :2007/05/12(土) 18:10:32 ID:gD9+7XNL
- >>229
>>227わレジスタの話とまったく関係なく、ローカル変数が16個以下ということが一般的か?
という疑問す。
例えばa[100]という宣言が、1変数と数えるのか、100+1(ポインタ)+1(インデックス)と考える
べきか。。。ということなんすけど。
- 232 名前:・∀・)っ-○◎● :2007/05/12(土) 18:15:20 ID:wA/vLTHp
- うわっ
CのABIをまるで解っていない
- 233 名前:Socket774 :2007/05/12(土) 18:20:03 ID:1jWIzerW
- くどいな。
レジスタだけではなく、
b[ c[i] ] なんて操作をしたい場合は、b0,b1,b2,b3... では代用できないんだから、
b[] で一まとまりの変数として考えるべき。だから配列なんだろ。
- 234 名前:MACオタ>233 さん :2007/05/12(土) 18:25:02 ID:gD9+7XNL
- >>233
------------------
b[] で一まとまりの変数として考えるべき。だから配列なんだろ。
------------------
大きさわ、どうでも良いすか。。。
コードを書いたら、"segmentation fault"ばかりになりそうすね(笑)
- 235 名前:・∀・)っ-○◎● :2007/05/12(土) 18:40:10 ID:wA/vLTHp
- くだんね
配列があったら全要素レジスタ変数に展開しろとでも教育された可哀想な人なんだろうな
- 236 名前:Socket774 :2007/05/12(土) 18:43:49 ID:UP2odql5
- ベクトルプロセッサだとどうなるのかレトリック君に解説をお願いしたい
- 237 名前:・∀・)っ-○◎● :2007/05/12(土) 18:45:27 ID:wA/vLTHp
- int func1(int a[8]);
みたいな関数の引数が8個とか10個とか思っちゃう人なんだろうな。
ポインタはどこでも指せるから2^32個とかになるのか。
ト
- 238 名前:レトリック君 :2007/05/12(土) 19:07:30 ID:YJKBuV4r
- ん?b[ c[i] ]のような二重リストのvector化?
pre-load命令を持たないV.P.の場合は;
innermost loop;
1)まずindex配列c[i=0〜511]がmemoryから直接ザーッと
register file r0〜r511にloadされる(vector SIMD load命令)。
2)次にb[r0〜r511]に対する
load命令とそれに続く->演算->store 命令が(全てvecor SIMD命令)
vector pipelineにchaining投入されてゆく
このblocking=512のinnermost loopの外側に
512sttep widthのouter loopが形成される。
こんな感じだったかな。blockingはcompierが自動的に行う。
prelaod命令を持つarchでは二重リストの間接的な要素を直接loadできるので
1)と2)をマージしたようなinnermost loopになる
はず、なんチッチw
- 239 名前:レトリック君 :2007/05/12(土) 19:14:02 ID:YJKBuV4r
- こうやって改めて書くとSIMD拡張とはまるっきり別物だな。とくに2)が。
だからxlfやintel compilerでvector directiveを挿入してvector化したと
思っているヤシみると、ああ、この人は…と、ついね、思っちゃう訳。メシだ ノシ
- 240 名前:Socket774 :2007/05/12(土) 19:19:20 ID:UP2odql5
- >>238
ありがと
ベクトルパイプラインの数だけレジスタも用意されてるってことでいいのかな
(しろーとですんまそ)
ついでに、スカラプロセッサにSIMDを組み込む場合にはレジスタをどうすれば
いいのか教えて 数を増やす?サイズを大きくする?
- 241 名前:Socket774 :2007/05/12(土) 19:21:40 ID:UP2odql5
- あ、続きあったのか
> ああ、この人は…
まあ、そう言わずに教えてくださいな
- 242 名前:レトリック君 :2007/05/12(土) 19:24:17 ID:2IcgcX+0
- >>240
上は違う。pipelineは8とか16本。register fileは512とか1024
考え方としては各streamを16本のpipelineに割り振る感じ
下は質問の意味が今一分からないよ。メシに行くので ノシ
- 243 名前:Socket774 :2007/05/12(土) 19:42:08 ID:0MLiedM0
- レジスタのカバー率なんて、計測対象によって変わって来るものに有効桁数なんて意味がないから。
MACオタみたいな勤勉な低能を見ると可哀想になってくるな。
- 244 名前:MACオタ>243 さん :2007/05/12(土) 19:49:29 ID:gD9+7XNL
- >>243
まあ話をすりかえたいのわ分かるすけど、
--------------
レジスタのカバー率なんて、
--------------
レジスタのカバー率じゃなくて、「関数呼び出し時の引き数とローカル変数の数 (単位:個) 」す(笑)
http://resource.renesas.com/lib/jpn/superh/theme/images/03_zu3.gif
- 245 名前:Socket774 :2007/05/12(土) 19:50:30 ID:UP2odql5
- > 上は違う。pipelineは8とか16本。register fileは512とか1024
なるほど
> 下は質問の意味が今一分からないよ。
自分でも何を聞きたいのか分かってないのかもしれないw
えーと、たとえば32bitプロセッサで128bit幅のSIMD命令を追加するとして
32bitレジスタを4個用意した方がいいのか、128bitのレジスタを1個用意
した方がいいのか、とかそういう話を期待してた
あとは最適のレジスタ数はSIMD無しの時とくらべて変わるのかなとか
(なんか書いてて己の馬鹿さ加減に恥ずかしくなってきた)
> メシに行くので
後でも良いので 気が向いたらで良いので
- 246 名前:Socket774 :2007/05/12(土) 20:00:21 ID:4V7fONaX
- SPUのスカラ性能は、道具立ての貧弱さから来る印象よりは行けてるって感じ
かね。配列アクセスをスカラでやるようなまねをするととっても遅いってのは
串団子の言う通りだが、レジスタ変数を有効利用できるようなケースでは遅く
ないってのはMACオタの言うとおり。
大体、どういうケースで何と比較してってのを明確にしなきゃ話にならん。
それはそれとして、PPUは情けない。
- 247 名前:Socket774 :2007/05/12(土) 20:01:15 ID:hCjL26Kx
- >>244
はいはい
「関数呼び出し時の引き数とローカル変数の数 (単位:個) 」なんて、計測対象によって変わって来るものに有効桁数なんて意味がないから。
MACオタみたいな勤勉な低能を見ると可哀想になってくるな。
- 248 名前:Socket774 :2007/05/12(土) 20:03:36 ID:hCjL26Kx
- >>245
32bitレジスタ*4だと、ポート数も4倍必要なので
普通はそんなことはしないよ
- 249 名前:MACオタ>247 さん :2007/05/12(土) 20:07:23 ID:gD9+7XNL
- >>247
で、有効桁数って何の話なんすか?
- 250 名前:Socket774 :2007/05/12(土) 20:09:54 ID:hCjL26Kx
- >>239
>>238は正しいのだが、スカラープロセッサでの所謂ベクトル化もほとんど同じだよ。
要素ごとに命令を発行するのが違いなだけで。
- 251 名前:Socket774 :2007/05/12(土) 20:11:04 ID:hCjL26Kx
- >>249
193 名前: MACオタ>団子 さん [sage] 投稿日: 2007/05/12(土) 15:42:13 ID:gD9+7XNL
>>192
-------------------
>変数が10個以下の関数が95%以上を占めることがわかった。
とは書いてあるが、16個までで100%うんぬんはどうみても脳内妄想です。
-------------------
http://resource.renesas.com/lib/jpn/superh/theme/images/03_zu3.gif
しつこいようすけど、この図を見て何%に見えるのかが聞きたいす。まともな科学教育を
受けていれば、目盛りがついたものわどこまでが有効数字か教わっている筈かと。。。
- 252 名前:Socket774 :2007/05/12(土) 20:11:10 ID:4V7fONaX
- >>242
streamをpipelineに割り振るってどういうことだ?ベクタ命令内部のデータ並列
で並列演算パイプラインを駆動するってのが典型的なベクタプロセッサだと
思うが。
- 253 名前:MACオタ>251 さん :2007/05/12(土) 20:14:24 ID:gD9+7XNL
- >>251
それグラフを読めないヒトにしか関係ない話すけど。。。まさか、あなたも温度計の読み方とか
小学校で教わらなかったクチすか(笑)
- 254 名前:MACオタ@補足 :2007/05/12(土) 20:15:51 ID:gD9+7XNL
- ちなみに団子さんわ、プライドが高すぎるのでトボケてただけで読めないわけじゃ無いす。
- 255 名前:Socket774 :2007/05/12(土) 20:16:45 ID:hCjL26Kx
- >>252
演算やロードストアパイプが8個とか16個とかあるのが普通で
ベクトル命令は適当に空いているパイプに割り当てる
ってことじゃろ。
- 256 名前:Socket774 :2007/05/12(土) 20:18:16 ID:hCjL26Kx
- >>253
このグラフを温度計のように読むやつはMACオタしかいないと思うが。
- 257 名前:Socket774 :2007/05/12(土) 20:19:23 ID:oCakvo/6
- 日エレの特集記事が学術論文扱いって何の冗談なんだ
- 258 名前:MACオタ>257 さん :2007/05/12(土) 20:36:19 ID:gD9+7XNL
- >>257
http://www.google.co.jp/search?sourceid=navclient-ff&ie=UTF-8&rlz=1B2GGGL_jaJP176&q=%E5%8F%82%E8%80%83%E6%96%87%E7%8C%AE+%22%E6%97%A5%E7%B5%8C%E3%82%A8%E3%83%AC%E3%82%AF%E3%83%88%E3%83%AD%E3%83%8B%E3%82%AF%E3%82%B9%22
- 259 名前:Socket774 :2007/05/12(土) 20:52:45 ID:oCakvo/6
- 参考文献として使われているから日エレは学術論文っていう意味?
- 260 名前:Socket774 :2007/05/12(土) 20:54:00 ID:hCjL26Kx
- >>209
> REXはコードサイズが増えて性能低下するケースがあるよね。
微妙に違って、正しくは
・命令が長くなるのでキャッシュラインあたりの命令数が低下する
・プリフィックスをつけることによって、投機的な命令の切り出しの精度が低下する
ので実効バンド幅が減るのね
- 261 名前:MACオタ>259 さん :2007/05/12(土) 20:57:52 ID:gD9+7XNL
- >>259
特に「学術論文」の定義をするつもりわ無いすけど、学術論文の参考文献として
使われる程度に信頼されているという事かと。。。
- 262 名前:Socket774 :2007/05/12(土) 21:45:55 ID:zGMtApwJ
- >>197
下のネタは
「しばしば自分の意見を論文紹介で代弁するMACオタはバカです」
という自己紹介ですか?
- 263 名前:245 :2007/05/13(日) 00:23:10 ID:iSFbLCYO
- >>248
ありがとう
てことはレジスタの数を増やさずに一部を128bit化して
普段は32bitでも使えるようにしておく、って感じになるのかな
>>250
kwsk
- 264 名前:レトリック君 :2007/05/13(日) 00:56:51 ID:NViMoeQ1
- vector pipelineとscalarのvector的なpipelineをモレは別物だと見てる。
scalar processorでのいわゆるベクトル的な物はsoftpipeを指していると思うが
softpipeは簡略に言うと、iterationを展開してload -> 演算 -> store命令を
iteration間を跨がせる様にschedulingする事とも言える。このときCPU
pipe lineはloop bodyをあくまで縦にsequentialに流してゆくのが基本。
これはgemmの様な細いstreamのloopだとvector pipe line のsoftware +
scalar CPU pipelineによる回りくどいemulationにも似ていて、
違いはscalar命令が個々の要素に対し毎回実行される点だとも言える。
しかしloop bodyが複雑になってくるとvectorは時にwork 配列を使ってまでも
loop body をsplitし、細分化したloop内の少ないstreamをindex 変数方向に
pipeline化…横にpipelineを伸ばしそれを縦に束ねたような流れ…となるのに対し、
scalar のsoftpipeでは(配列を使ってsplitすることもできるが、load/stoerのコスト
がvectorより高いので滅多に有効ではない)大量のregister spillを起こさせながら
loop展開し、loop body内をsequentialに実行+先行prefetchやloadを投入する。
pipelineを流れるstreamの向きが直行と言っていいほど変わってくる。
>>250 あなた素人じゃなさそうだね、ニヤリ。酒飲んでくる ノシ
- 265 名前:・∀・)っ-○◎● :2007/05/13(日) 01:40:21 ID:4phbdK/b
- >だからxlfやintel compilerでvector directiveを挿入してvector化したと
こいつ真性のアホだwwwwwwwwwww
- 266 名前:・∀・)っ-○◎● :2007/05/13(日) 01:50:16 ID:4phbdK/b
- 自分でSIMD化も出来ない屑である上にコンパイラの仕事を勘違いしてるわけで
- 267 名前:・∀・)っ-○◎● :2007/05/13(日) 01:52:58 ID:4phbdK/b
- >>246
悪いが、「レジスタを活用するケース」というのがごく稀な例だと思うぞ。
ほとんどのケースで、素のCプログラムをspu-gccでコンパイルすれば
激しく遅い。
- 268 名前:・∀・)っ-○◎● :2007/05/13(日) 02:03:12 ID:4phbdK/b
- >>260
K8もCore2も16バイト/clkフェッチだから、命令長そのものがネックになるケースはあるよ。
>>263
あのさー、SIMDレジスタと汎用レジスタが共有されてるアーキテクチャってどれだけあると
思ってる?
Intelアーキテクチャの最適化リファレンスとか読んだことある?
XMMレジスタとFP/MMレジスタは物理的には共有した実装は多いが
汎用レジスタとは別物。
- 269 名前:レトリック君 :2007/05/13(日) 02:12:40 ID:Y2C2XzUx
- あなたは素人に毛が生えてるかどうかのレベルだわ。
自分の未知な世界は狭量にもケチ付けて、人を中傷して憂さ晴らししてるだけ。
人から学ぶと言うことを知らない。能力と人格に問題有り。
まぁどーでもいいやモレの部下じゃないし。2chじゃ珍しくないし。
どこのcodreだか知らないが友達少なそうだな ノシ
- 270 名前:Socket774 :2007/05/13(日) 02:17:50 ID:7A/ESxLR
- と素人が申しておりまし
- 271 名前:・∀・)っ-○◎● :2007/05/13(日) 02:18:08 ID:4phbdK/b
- と、真性の素人がほざいております
- 272 名前:Socket774 :2007/05/13(日) 02:19:10 ID:7A/ESxLR
- かぶってしもた
- 273 名前:・∀・)っ-○◎● :2007/05/13(日) 02:21:52 ID:4phbdK/b
- ベクトル演算とSIMD演算が別物って言うような無知な子だしww
- 274 名前:・∀・)っ-○◎● :2007/05/13(日) 02:40:34 ID:4phbdK/b
- >>264みたいな中途半端に英単語と日本語並べる文がかっこいいと思ってるのかね
一見読みづらいから相手が難しいこと話してるなって威圧感与えたいのか
なんなのか知らんが、本質的には馬鹿さ加減が酷いというか。
>先行prefetch
とかさ、長嶋の親父さんの「秋の秋季キャンプ」なみに無意味
- 275 名前:Socket774 :2007/05/13(日) 02:52:11 ID:jfXJr8v6
- http://homepage3.nifty.com/zap2/macintosh1/photoshopbench1.html
- 276 名前:Socket774 :2007/05/13(日) 02:53:06 ID:eYV080dG
- あんまり本質的でないところに突っ込んでるな。
- 277 名前:・∀・)っ-○◎● :2007/05/13(日) 02:53:40 ID:4phbdK/b
- そんなに英単語多用したいなら全部英文で書けばいいのに。
そっちのほうが読みやすいわ。
同じ流儀で一言でいえば「pedanticなレス」
知性にコンプレックス抱えた人間の典型だな。
- 278 名前:Socket774 :2007/05/13(日) 03:16:28 ID:8SqH8r6f
- カタカナでなければ読めないのならそう言えばいい
- 279 名前:・∀・)っ-○◎● :2007/05/13(日) 03:21:19 ID:4phbdK/b
- 日本語で書けるようなものまでわざわざ英単語で書く必要ないだろ
たとえば分割をsplitと書かなきゃいけない理由なんてあるか?
- 280 名前:Socket774 :2007/05/13(日) 03:22:43 ID:8SqH8r6f
- つremix
- 281 名前:・∀・)っ-○◎● :2007/05/13(日) 03:23:02 ID:4phbdK/b
- 中二病が「〜である」調や使い慣れない四字熟語を多用したりするのと同じ精神構造なんだろ
- 282 名前:Socket774 :2007/05/13(日) 03:24:32 ID:8SqH8r6f
- どうでもいいアホクサ
- 283 名前:・∀・)っ-○◎● :2007/05/13(日) 03:34:58 ID:4phbdK/b
- 「偉い人の反対は偉そうな人」
ブログでえらく反響をよんでるフレーズだが、なにげに真理なんだよね。
背が高い人と背伸びをしてる人も別だし
同様に、知識人と、知ったかぶりの関係もそうだよね。
本物の知識人は他人にわかりやすいように配慮することは事欠かない。
典型的な知ったかぶりはまったくその逆で、中身のない単純な文章を
一見小難しく見せるために日本語でもいいところをむやみに英単語に置き換えたりする。
その綻びが「先行prefetch」みたいな頭の悪いフレーズなわけですよ。
- 284 名前:・∀・)っ-○◎● :2007/05/13(日) 03:49:37 ID:4phbdK/b
- >縦にsequentialに
ここもだな。長嶋クォリティを感じるのは。
- 285 名前:Socket774 :2007/05/13(日) 03:50:18 ID:h7Jci3oM
- >>283
>>283
権威主義者の矛盾
- 286 名前:+++ :2007/05/13(日) 04:03:08 ID:oNcXQ/gI
- >>団子
Itaniumのレジスタ数の多さは、SPARCみたいなレジスタウィンドウ機能と、
ループでの自動レジスタアンローリングとか、そういう理由もある。
でも、それにはもっとレジスタ欲しいと思うけど、それ以上増やせない
理由もあって・・。
SHはあれだね、16bit命令を実現するにはレジスタ数が限界だし。
ちょっと前の日経エレでの対談には、レジスタ・カラリング手法が出てきたんで
これでいいや、とか書いてあったな。
・・・SH-6を作ろうとかいう機運は出てこないのかな。
- 287 名前:・∀・)っ-○◎● :2007/05/13(日) 04:43:45 ID:4phbdK/b
- 高橋麻奈女史の「やさしい〜」シリーズがなぜベストセラーなのか。
難しい内容を初心者にわかりやすいよう噛み砕いて本を書いてる。
あんだけ読みやすいのにツボはちゃんとおさえてる。
あんだけ多くのジャンルの本出せるんだから知識量は半端じゃないと思うが
そこをインテリぶらないのはT大卒の余裕かもね。
>>286
ルネサスとして新規に作ったR8CシリーズってSHではなくM16シリーズの流れだよね。
SHとしては携帯とか車関連で安定した市場があるからね
現状でも世界で通用する企業だし。
個人としてはARMともっとやりあって欲しいんだけど。
- 288 名前:Socket774 :2007/05/13(日) 07:54:13 ID:sgR8yGmI
- >>264
> scalar のsoftpipeでは(配列を使ってsplitすることもできるが、load/stoerのコスト
> がvectorより高いので滅多に有効ではない)大量のregister spillを起こさせながら
> loop展開し、loop body内をsequentialに実行+先行prefetchやloadを投入する。
スカラープロセッサの場合はループのブロック化もやるんで、こっちのほうがベクトル化のイメージに近いんじゃないかな。
ソフトウェアパイプラインだけじゃないお。
あとレトリック君はイテレーションをまたいだやつを先行プリフェッチと言っているぽいので、べつにそんな馬から落馬じゃないから>団子
- 289 名前:Socket774 :2007/05/13(日) 08:17:52 ID:sgR8yGmI
- あとOoOのスーパースカラーの場合は物理レジスタがたくさんあるんだから
わざわざスピルコードいれなくてもいいよ
- 290 名前:Socket774 :2007/05/13(日) 08:20:54 ID:2HN+BF3d
- >>267
だから、何と比べてどういう条件で動かしたときにどういう評価基準で
「遅い」のか明確にして話をしないとただのネガキャンだよ。ちなみに、
byte/short/word load storeが無いことによる性能低下は3割ぐらいかなぁ
と思ってる。コードサイズがでかくなることも痛い。
それから、GCC+素のCコードだとかなりタコだよ。変数をこまめに128bit
アラインするとか、ローカル変数にコピーするとかでずいぶんと早くなる。
XLCのほうはよく知らんがもっと賢いの?
- 291 名前:レトリック君 :2007/05/13(日) 08:31:21 ID:3ocC1wpW
- >>288
xlf 7,8の-qhot=vectorはschedulingの間隔を少し広げてlatencyの
ペナルティーを和らげようとし(効果小)
intel compiler 7,8のvector directiveはSSE命令を生成するものだったと記憶している。
自動blockingをするcompilerは…あれかなw、それを使っているならば
あなたも素人じゃ無さそうだね。
ただし、scalarの自動blockingはcache hit率を高めるために
折り畳んでいるのであってvector化と対比させる物はblockingした
innermost loopのL2 latencyペナルティを減らす為の疑似ベクトル化だと思う。
「やさしい〜」シリーズがどうのこうのしか書けず、内容に触れることの出来ない団子は
オレのレスの内容は全く理解できていないし、あなたのレスの意味も理解できていないよ。
朝飯だ ノシ
- 292 名前:MACオタ>290 さん :2007/05/13(日) 08:39:12 ID:mSmGJBHJ
- >>290
------------------
だから、何と比べてどういう条件で動かしたときにどういう評価基準で
「遅い」のか明確にして話をしないとただのネガキャンだよ。
------------------
団子さんわ、自作の乱数発生コードでx86と比較して遅いと言いたいみたいすけど、
普通わ回路規模や設計の世代を考慮するとPPEやPXと比較すべきかと思うす。
- 293 名前:レトリック君 :2007/05/13(日) 08:40:05 ID:3ocC1wpW
- >>289
つ 多重リストのsoftpipe code生成
loop bodyがほんの少し複雑になただけでregister何個あっても足りなくて
code量爆発するからw
あんまり書くと身元が
- 294 名前:Socket774 :2007/05/13(日) 08:44:37 ID:2HN+BF3d
- >>288
ブロック化を自動で上手にこなしてくれるコンパイラってある?レトちゃん
との議論は落としどころが良く分からんので、そっちにはあまりかかわりたく
ないのだが、いいコンパイラがあったら使いたいと思ってるんで。
- 295 名前:レトリック君 :2007/05/13(日) 08:47:29 ID:3ocC1wpW
- >>294
いいのがあるけどここにはかけない。
落としどころが見えにくいのはこっちがねた全部出し切れない理由があるからかな。
ごめんね。
- 296 名前:Socket774 :2007/05/13(日) 09:02:18 ID:2HN+BF3d
- >>291
blockingについては、L1=ベクタ変数的な解釈も成り立つかと。結局、ストラ
イドとか、スキャッタ/ギャザーをあの性能でこなせるメモリシステムがベクタ
の取りえであり弱点であると思うのだ。それ以外は瑣末?というか解釈の問題
というか。
- 297 名前:Socket774 :2007/05/13(日) 09:08:08 ID:3ocC1wpW
- >>296
>blockingについては、L1=ベクタ変数的な解釈も成り立つかと。
単純なprogramならそう捕らえられるけど
その考えを拡大して、頑張って造って実は複雑なsoftwareで効果が出なくて
えらく苦労したのが90年代終盤〜ここ数年の一つのscalar compier技術だったと思う。
名無しに戻りますw
- 298 名前:MACオタ>レトリック さん :2007/05/13(日) 09:08:10 ID:mSmGJBHJ
- >>295
------------------
いいのがあるけどここにはかけない。
------------------
ここで話を完結させる気が無いというのわ、上から視点で罵詈雑言だけ書く時の団子さんと
同じレベルかと思うすけど。。。
- 299 名前:Socket774 :2007/05/13(日) 09:54:02 ID:KXNItg9a
- レトリック君は前からそうじゃん
肝心な所になると逃げちゃう
自分じゃ他人を馬鹿にして楽しいのかも知れないけど
傍から見ると説明が下手な頭の悪い人にしか見えない
- 300 名前:・∀・)っ-○◎● :2007/05/13(日) 10:00:43 ID:4phbdK/b
- あたまがわるいひとが無理してむずかしいことを書こうとすると
不要に英単語をちりばめて自体を読みづらくすることくらいしかできない
※無論全部英文で書くことなんてできない。おそらくTOEIC300レベルだから
むろん内容自体は大したことは言っていない
- 301 名前:MACオタ :2007/05/13(日) 10:18:16 ID:mSmGJBHJ
- TheRegisterのPOWER6サーバーに関する報道す。今月中にも発表されるが、対応OS
であるAIX 5.4わ遅れるとのことす。
http://www.theregister.co.uk/2007/05/12/ibm_power6_lifesupport/
---------------------------
Most notably, IBM has shifted from an out of order design with Power5's integer
units to an in order design with Power6. Such a drastic change will require first
AIX 5.4 and then a full software recompile should customers want to see maximum
performance.
---------------------------
Power Mac G5発売時のOS Xの状況と同じす(笑) Ashlee Vance記者自身わ、まだ
POWER6の製造問題を疑っているみたいす。チップとして歩留まりが悪そうなのわ当然
すけど、意図的にFUDをバラまいてるヒトがいるのかもしれないす。
---------------------------
We've heard consistent speculation that a manufacturing issue has crippled IBM's
ability to produce Power6 chips above 3.5GHz. Customers, however, were promised
that the initial Power6-based systems will indeed come in above 4.0GHz, during the
recent IBM ParterWorld event in St. Louis.
---------------------------
- 302 名前:・∀・)っ-○◎● :2007/05/13(日) 10:19:00 ID:4phbdK/b
- >>290
spu-gccは一応、SCE純正のコンパイラなんだけどな。
ただ、メモリレイアウト云々にめんどくさいことに気を遣わなきゃいけないのは
最初からSIMD化するんだよね。
SCEも明示的にSIMD組み込み関数使えば性能が16倍出ますよって公言してる。
確かにspu-gccで明示的にSIMD化すればかなり性能良いコード吐く。
スケジューリングも悪くない。
そもそもスカラが遅いのはCellのアーキテクチャ・実装の問題だと思ってる。
SSEみたいにパーシャルリード・ライトをサポートすればかなり変わってくる筈。
- 303 名前:MACオタ>302 さん :2007/05/13(日) 10:24:17 ID:mSmGJBHJ
- >>302
-------------------
パーシャルリード・ライトをサポート
-------------------
>>300のように他人を非難するなら、ここわ」「ワードやバイトデータのロード/ストア」
とか書くべきかと。。。
- 304 名前:Socket774 :2007/05/13(日) 10:30:00 ID:3XsG4Rg1
- >>301
> a full software recompile
ああ、やっぱそうなのね
- 305 名前:・∀・)っ-○◎● :2007/05/13(日) 10:34:22 ID:4phbdK/b
- あと、レトロ人間君はそんなに英単語使いたいなら全部英文で書いてください。
And Letroman, if you like to write English-terms so much, please write without Japanese.
- 306 名前:・∀・)っ-○◎● :2007/05/13(日) 10:35:38 ID:4phbdK/b
- おっとRetromanだったかな。綴りがわかりません><
- 307 名前:・∀・)っ-○◎● :2007/05/13(日) 10:40:05 ID:4phbdK/b
- @ パーシャルリード・ライトをサポート
A ワードやバイトデータのロード/ストアをサポート
どっちが回りくどいかね。
SSEのmovss/movsdはパーシャルリード・ライトでしょう
少なくとも1バイトの読み書きは聞いたことがない。
pinsrb/pextrbはSSE4で初めてサポートされる機能だ
- 308 名前:・∀・)っ-○◎● :2007/05/13(日) 10:45:47 ID:4phbdK/b
- もっともパーシャルリードかどうかは実装依存だ。
第一要素にスカラデータをロードしろという仕様はあるが
その他の要素は不定するように仕様で決まってる。
pinsrw/pextrw/maskmovq/maskmovdquはパーシャルライトだな
- 309 名前:263 :2007/05/13(日) 10:52:35 ID:QCrMuaRU
- >>268
あいてしてくれて、ありがとう
すんませんね、なにぶんしろーとなもんでw
- 310 名前:・∀・)っ-○◎● :2007/05/13(日) 10:56:23 ID:4phbdK/b
- SPEネタその続き。
16バイト境界にあわせても、ストア時にパディング領域を破壊していいかどうかの情報は
コンパイラにはわからないので、保持のためのコードを生成してしまうね。
結局SIMD組み込み関数を明示的に使うしかなかったり。
そもそもLSが256KBしかない。
パディングなんてしてられないでしょ。
- 311 名前:Socket774 :2007/05/13(日) 11:24:18 ID:esNK0p2y
- >>305
団子さん、はっきり言ってしつこすぎだ。
内容に対する突っ込みが>>265だけで、英単語云々に対する
突っ込みが黙々と続くのはいかがなもんかとおもうぞ。
- 312 名前:・∀・)っ-○◎● :2007/05/13(日) 11:44:28 ID:4phbdK/b
- 内容がないんだからそこくらいしか突っ込むところ無いじゃん
いまだにvectorの意味を誤解してるし
- 313 名前:・∀・)っ-○◎● :2007/05/13(日) 12:11:02 ID:4phbdK/b
- ちなみに内容なんて、前スレで論破された記憶を喪失して
同じことを連呼してる以上のことは何もない。
したがって、何も理解しようとする必要なんてない。
英単語に置き換えて読みづらくしてるだけで相変わらず知識の狭さを露見してるだけ。
無理して英語を使おうと必死な痛い子よりもお塩ロックのほうがまだ聴けるよ
ファッキンライト
- 314 名前:MACオタ>団子 さん :2007/05/13(日) 12:34:16 ID:mSmGJBHJ
- >>307-308
---------------------
どっちが回りくどいかね。
---------------------
分野にもよるのかも知れないすけど、パーシャルリード・ライトという用語わ、バーストアクセスの方が
普通であるメモリやバス、ネットワークのアクセスで使うす。
http://www.google.co.jp/search?hl=ja&rlz=1B2GGGL_jaJP176&q=partial-read
- 315 名前:MACオタ@続き :2007/05/13(日) 12:35:06 ID:mSmGJBHJ
- ただQWORD以外のスカラデータでのロード/ストアわ、CELL BEが生き残ることができれば将来
の実装で追加される可能性わ大きいと思うす。歴史を鑑みても初期のAlpha AXPの実装もこんなんす。
http://www.hpl.hp.com/hpjournal/dtj/vol4num4/vol4num4art1.pdf
--------------------
Only aligned longwords or quadwords may be accessed: an aligned
longword is a four-byte datum whose address is a multiple of four; an
aligned quadword is an eight-byte datum whose address is a multiple of
eight.
--------------------
微細化でトランジスタや配線が楽になれば、LSがマルチポート化されてMFCとSPUが並列動作
できるようになるのも、ありそうな話す。
そういう意味でわ団子さんの最近の文句もPower.orgやIBMのフォーラムでもっと大っぴらに書けば
建設的展開があるかもしれないす。
- 316 名前:・∀・)っ-○◎● :2007/05/13(日) 12:54:19 ID:4phbdK/b
- 過渡期の技術など、残る必要ない。
過去の資産を受け継いできたIntelプロセッサに部分技術が採り入れられて
Cellの役目は終わり。
- 317 名前:Socket774 :2007/05/13(日) 12:58:23 ID:zMR3hkxO
- そういえばLarrabeeってどうよ
http://arstechnica.com/articles/paedia/hardware/clearing-up-the-confusion-over-intels-larrabee.ars
- 318 名前:MACオタ>団子 さん :2007/05/13(日) 12:58:54 ID:mSmGJBHJ
- >>316
--------------------
Intelプロセッサに部分技術が採り入れられてCellの役目は終わり。
--------------------
まあ確かにAlpha自体がその良い前例す。
- 319 名前:Socket774 :2007/05/13(日) 13:04:06 ID:2HN+BF3d
- >>302
配列じゃない独立データだったら、パディング入れてメモリアクセスがシン
プルになってコードサイズが減少する分を考慮すると、パディングの増分を
埋め合わせて黒字になったりする。とはいえ、さっさとスカラアクセス入れ
やがれってのは同意。
なんにせよ、できるだけレジスタに載せるとか、SIMD命令の明示的な利用ま
で含めてチューニングすれば「スカラ」なコードもかなり救える。そんなの
めんどくさくてやってられっか、という意見はもっともだが、CODECが速い
のはそこらへんのテクニックを総動員しているからだったりする。
決して「CODEC向きのプロセッサだから」じゃないんだよ。
- 320 名前:Socket774 :2007/05/13(日) 13:05:39 ID:KbejpFwJ
- 関係ないけど
「Sonyはついに狂ったのか?」by 安藤さん
- 321 名前:Socket774 :2007/05/13(日) 13:09:52 ID:zMR3hkxO
- ビキニトップをペイントと見抜く眼力はさすが
- 322 名前:MACオタ>320 さん :2007/05/13(日) 13:10:08 ID:mSmGJBHJ
- >>320
このスレッド向けの話題だと、APLの件でSUNから散々な仕打ちを受けた安藤氏がRock開発遅延
の報道で嬉しそうなのが。。。
- 323 名前:Socket774 :2007/05/13(日) 13:22:06 ID:zMR3hkxO
- Larrabeeでなくて?
- 324 名前:Socket774 :2007/05/13(日) 18:32:15 ID:Cocyux0E
- >>320-323 リンク貼ってください
ttp://www.geocities.jp/andosprocinfo/wadai07/20070512.htm
>>323
> a subset of the x86 ISA that includes some GPU-specific extensions
ISAかデコーダがグタグタになる悪寒。512ビット幅のベクトルユニットってのも。
あと、
10コア以上でL2$共有って、>10ポートのメモリで同時アクセス可能?
- 325 名前:Socket774 :2007/05/13(日) 18:55:22 ID:2HN+BF3d
- >>324
> 10コア以上でL2$共有って、>10ポートのメモリで同時アクセス可能?
コア毎に専属の領域を設けるとコア-メモリのIFは無理なく作れるが、その外
が大変。L2をマルチバンクメモリにするとバスとバッファに面積を食われる。
- 326 名前:・∀・)っ-○◎● :2007/05/13(日) 20:36:32 ID:4phbdK/b
- どのみちレイテンシすさまじいんだからおもっきしリッチな命令を
コンプレックスデコーダでデコードさせるんでない?
x86は一応15バイト命令まではいける。
- 327 名前:Socket774 :2007/05/14(月) 16:00:54 ID:4RkPiqF4
-
ttp://www.procable.jp/setting/19.html
ttp://www.procable.jp/setting/20.html
>IBMやモトローラなど、デジタルの欠落の怖さを知り尽くしているメーカー
- 328 名前:MACオタ :2007/05/14(月) 19:02:40 ID:T+HlRhKp
- IBMがpSeriesのホームページにPOWER6サーバー発表のリンクを載せてしまって
発表日が5/22とバレちゃったす。リンク先自体わ存在しないすけど。。。
今のところ訂正されてないみたいす。
http://www-03.ibm.com/systems/p/
同時期にAIX 6の概要も公開するみたいすね。
- 329 名前:Socket774 :2007/05/15(火) 00:07:40 ID:DAK+PHlT
- おもろいな。学閥とか持ち出して来た。分かりやすく説明するのが得意なのは
分からない奴の気持ちが分かってるということだからな。
頭の良さとは関係ない。学者が教師として適格かどうかなんてどうでもいいのと同じ。
- 330 名前:Socket774 :2007/05/15(火) 00:31:48 ID:ugtYNHZl
- キチガイは怖いな
- 331 名前:・∀・)っ-○◎● :2007/05/15(火) 01:49:53 ID:g2fqtQte
- >>329
いや、問題大あり。
民間資金や競争資金引っ張ってこなくとも潤沢に固定予算もらえてた時代ならいざしらず
校費等は大幅削減だからネクラ学者さんは総あぼーんの構図だな。
いまどきブンケイ相手にでも研究概要説明できない学者さんは資金の調達できねーわなw
つーか営業力のある教授さんって民間で揉まれた人が多いと思う。
- 332 名前:・∀・)っ-○◎● :2007/05/15(火) 01:55:33 ID:g2fqtQte
- 講義内容を学生が評価する制度も始まってたと把握してるが
- 333 名前:Socket774 :2007/05/15(火) 13:05:50 ID:Qhik7DiC
- そもそもレトリック=聞伝の不必要に英語句に置き換えてものを書く癖は、
本人はかっこいいと思っているのだろうが、知的でもなければ技巧的でもない。
ただ無駄に読みづらくしてるだけで、珍走団の当て字と同じくらいDQN臭い。
- 334 名前:Socket774 :2007/05/15(火) 21:45:22 ID:RbudYLPI
- Sun, allies broaden open-source chip push
http://news.com.com/Sun%2C+allies+broaden+open-source+chip+push/2100-7344_3-6183562.html
Niagara2もオープンソース化される模様
- 335 名前:Socket774 :2007/05/16(水) 14:28:44 ID:/mFcQcRx
- 相変わらず尾ひれにしか食いつかない魚だねぇ。。。
- 336 名前:Socket774 :2007/05/16(水) 22:18:29 ID:6MqYh9iO
- Sun licenses tech to ARM
http://www.theinquirer.net/default.aspx?article=39629
NiagaraみたいなARMが出るのかな?
- 337 名前:Socket774 :2007/05/16(水) 22:28:39 ID:6MqYh9iO
- サンの新しいチップ、UltraSPARC T2とVictoria Fallsに何が期待できるのか?
〜さらなる省電力とパフォーマンスの向上に向けたサンの挑戦〜
http://jp.sun.com/newsletters/innercircle/0705/feature1.html
Victoria Fallsはニコイチで256スレッドを実現
- 338 名前:MACオタ>337 さん :2007/05/16(水) 22:37:07 ID:DXFF0AHi
- >>337
----------------
Victoria Fallsはニコイチで256スレッドを実現
----------------
SMP対応ってだけす。
http://japan.zdnet.com/news/hardware/story/0,2000056184,20342534,00.htm
================
Victoria Fallsは、Niagara 2チップを2基搭載するサーバ向けチップ。
================
- 339 名前:Socket774 :2007/05/16(水) 22:38:56 ID:Bk+6QBGT
- >>336-337
向こうとのマルチうぜー
- 340 名前:Socket774 :2007/05/16(水) 23:01:47 ID:dpwRmuBu
- >>337は256スレッド、>>338は128スレッドになってるね
- 341 名前:Socket774 :2007/05/17(木) 00:27:50 ID:CFvy1yPf
- >>339
すまなかった
もうやらない
- 342 名前:Socket774 :2007/05/17(木) 13:53:05 ID:Pa5lcBrt
- 「----------------」と「================」、うぜー
- 343 名前:Socket774 :2007/05/17(木) 18:20:08 ID:ZOtzqh2A
- 「〜(主語)〜わ〜(述語)〜す。」、うぜー
- 344 名前:Socket774 :2007/05/17(木) 19:07:30 ID:hq7DgWgr
- >>342-34
こっちでも粘着か
- 345 名前:Socket774 :2007/05/17(木) 22:34:55 ID:t/dagiTx
- うぜーうぜー、うぜー
- 346 名前:Socket774 :2007/05/18(金) 17:40:00 ID:G+bTfjwm
- 韓国女子高生
http://bbs.enjoykorea.jp/tbbs/read.php?board_id=pfashion&page=17&nid=34598
- 347 名前:Socket774 :2007/05/18(金) 19:50:07 ID:4m+N1Mb2
- うぜー
- 348 名前:Socket774 :2007/05/18(金) 19:57:54 ID:HZNiIH2b
- IBM、間もなく「POWER6」プロセッサ搭載サーバをリリースへ
ht