グラフィックチップ解説

Source

http://sg.vr-zone.com/?i=4838
 
http://pc.watch.impress.co.jp/docs/2007/0509/nvidia.htm
http://www.mikeshardware.co.uk/RoadmapQ207.htm
anandtech GeForce 8M 特集 

http://plusd.itmedia.co.jp/pcuser/articles/0705/14/news031_3.html

wikipedia GeForce 8M 比較

wikipedia Radeon_R600 

後藤氏 HD 2000 アーキテクチャ解説
NVIDIA AMDのRadeon HD 2000仕様に反論
NOTEBOOKCHECK ベンチ一覧

http://ati.amd.com/products/mobile.html

メモリ帯域

http://pc.watch.impress.co.jp/docs/2003/0704/kaigai001.htm
http://pc.watch.impress.co.jp/docs/2005/0408/kaigai169.htm
http://pc.watch.impress.co.jp/docs/2005/0415/kaigai170.htm
http://pc.watch.impress.co.jp/docs/2005/0211/kaigai155.htm
http://pc.watch.impress.co.jp/docs/2003/1024/kaigai037.htm

    128bit FSB 225Mhz DDR2 (NV36)
     16bytes * 900Mtps = 14.4GB/sec
    256bit FSB 150Mhz DDR3 (Geforce Go 6800)
     32bytes * 1200Mtps = 38.4GB/sec

    128bit FSB 200Mhz DDR
     16bytes * 400Mtps = 6.4GB/sec
    128bit FSB 200Mhz DDR2
     16bytes * 800Mtpsz = 12.8GB/sec
    256bit FSB 200Mhz DDR3
     32bytes * 1600Mtps = 51.2GB/sec

    Mtps(Mega transfer per second)

DRAMチップの語構成

通常DRAMは語構成「x8」「x16」、8bitや16bitインターフェイス。x32にまでインターフェイスを拡張するとダイサイズが大きくなり製造コストが跳ね上がる。そのためグラフィックス用途などに限定。

PCでは64bit幅が欲しいから、x16チップなら最低4つのチップがいる。1GbitsのDRAMでモジュールを作ると、グラニュラリティは512MB。最小量のモジュールでも512MBとなる。

この点において、RDRAMはピン当たりの転送レートが高いため、16bitで1.6GB/s(PC800で)、32bitにすると3.2GB/sの帯域を確保できる。

グラニュラリティ問題 (DRAMチップの場合)

    低コストのDRAMチップはx8 or x16 (8bit or 16bit)。x32のような広いバス幅を確保すると高コストになる。グラフィック用は多少コストがかかってもOKなので存在
    http://pc.watch.impress.co.jp/docs/article/20011130/kaigai01.htm
    http://pc.watch.impress.co.jp/docs/2004/0716/kaigai103.htm 

    そのため、x16(16bit)チップで64bitアウトプットのモジュールを作ろうと思うと、必ず4個必要になる。

    製造プロセスが進み、1チップが256Mbit(64MB)チップ世代になると、最低個数の4個だけで1モジュールが256MBになってしまう。512Mbit世代なら、512MBだ。しかも、2モジュールでデュアルチャネルを構成しようとすると、さらに最低MBが増えてしまう。

    シリアルなRDRAMチップなら、そもそも1チップがx16/x18(16/18bit幅)であり、しかも転送レートが高い。そのため、2チップだけで3.2GB/sec(DDR2-400相当)を作ってしまう。
     http://ja.wikipedia.org/wiki/PCI_Express

グラニュラリティ (メモリアクセス粒度)

http://pc.watch.impress.co.jp/docs/2006/1201/kaigai322.htm 

 GDDR3 Prefetch4 4回先読みし一気に送る。64bitsなら256bits(32bytes)
 GDDR4 Prefetch8 8回先読み 64bitsなら512bits

DRAM高速化に伴う搭載容量の壁

http://pc.watch.impress.co.jp/docs/2003/0711/kaigai002.htm

分岐のあるStub型バスアーキテクチャではStubからの反射により高速化が難しい
スロットを減らしシンプルにするか、FB-DIMMのような解決策。またはXDR DRAM(yellowstone)は完全にStubのない、デイジーチェーン型、ポイントツーポイント型のバス。

 

参考資料
http://pcweb.mycom.co.jp/special/2004/trendfall/menu.html
PC Watch Intel845系
PC Watch Intel830系
http://pc.watch.impress.co.jp/docs/2002/0827/kaigai01.htm 
http://pc.watch.impress.co.jp/docs/2004/0720/ubiq72.htm 

http://www.anandtech.com/video/showdoc.aspx?i=2283&p=2
http://pcweb.mycom.co.jp/articles/2004/06/04/ati/index.html 

GMA900デスクトップ版のクロック

チップセットのスペック一覧

http://www.cdr.cz/a/16548/4

http://pc.watch.impress.co.jp/docs/2006/0116/ubiq145.htm

http://pc.watch.impress.co.jp/docs/2006/0303/kaigai246.htm

 

http://www.4gamer.net/

HyperMemoryの仕組み
http://pcweb.mycom.co.jp/news/2005/03/25/003.html(ベンチで必要なメモリ量など)
http://www.ati.com/jp/products/mobilityradeonx1400/specs.html
http://ascii24.com/news/i/topi/article/2005/03/23/654977-000.html?geta 

TurboCache
http://pcweb.mycom.co.jp/articles/2004/12/16/gf6200tc/
http://pcweb.mycom.co.jp/articles/2004/12/16/gf6200tc/001.html 

PCI Expressの仕組み
http://www.atmarkit.co.jp/fsys/kaisetsu/009pci_innovation/pci_innov03.html

パッケージの種類
http://www.intel.co.jp/jp/developer/design/flcomp/prodbref/298113.htm

GeForce Go 7300
http://www.pc-erfahrung.de/Index.html?Geforce7300Go.html
http://www.hkepc.com/hwdb/g72m-4.htm 

ピクセル出力性能=フィルレートはピクセルシェーダーの性能を反映しない
なぜなら同クロックでもPixwl Sader内部の並列性により効率が違う

GDDR

連続データが多いため、行アドレスを減らして、列アドレスを増やすなど工夫されている。
 ページモード:行アドレス固定のまま列アドレスを連続読み込み

 Prefetch8の場合、64bit幅のDRAMインターフェイスだと64×8で512bitsが最小単位に。

 

GDDR

GDDR2

GDDR3

GDDR4

転送レート 規格時

500Mhz

500Mhz

1000Mhz

1400Mhz

最大CASレイテンシー

5

7

13

22

動作電圧

1.8/2.5V

1.8/2.0V

1.8〜2.2V

1.5V

ベースとなった規格

DDR

DDR2

DDR2

DDR3

Prefetch

2

4

4

8

バースト転送量

128bits

256bits

256bits

512bits

 GDDR4 語構成は16Mワード×32bit

     

メインメモリの帯域

帯域の拡張はエンコード処理や科学技術演算などでは効果があるが、オフィスアプリなどでは効果薄い。

メモリ

DDR200

DDR266

DDR333

DDR400

DDR533

DDR2-533

DDR2-667

DDR2-800

DDR2-1066

内部周波数 chip

100

133

166

200

266

133

166

200

 

帯域 (GB/s) デュアル

3.2

4.3

5.3

6.4

8.5

8.6

10.6

12.8

 17.0

FSB (Mhz)

400

533

667

800

1066

 

1333

 

 

メモリ

DDR3-800

DDR3-1066

DDR3-1333

DDR3-1600

DDR3-2133

帯域 (GB/s) デュアル

12.8

17

21.3

 

 

3チャネル

 

 

32.0

 

 

FSB

 

 

 

 

 

Intelがひたすらメモリ帯域の拡大にこだわる理由

SDRAM は64bitインターフェイス RDRAMが同じ64bitとすると、帯域は6.4GB/sとなる

RDRAM ch数

1

2

2

2

3

4

 

PC800

PC800

PC1066

PC1200

PC800

PC800

インターフェイス

16/18bit

32/36bit

32/36bit

32/36bit

64/72bit

64/72bit

帯域 (GB/s)

1.6

3.2

4.2

4.8

6.4

6.4

FSB (Mhz)

400

400

533

600

400

400

 

Nehalem時代のバス

QPI(CSI) ピン当たりの転送レートは6.4Gbps 32bitsインターフェイスなら25.6GB/s。

 

ビデオメモリ

2Dだけなら解像度×色深度の2枚分程度でOK
あとはデュアルディスプレイ対応なら、さらに2倍。トリプルなら3倍必要。

3Dは出力データだけでなく、頂点座標やテクスチャの格納、アンチエイリアシング処理時の引き延ばしデータなど2Dよりも遙かに多くのメモリが必要となる。

 

8GB DIMMを実現する2Gbits DRAM
 http://www.elpida.com/ja/news/2007/09-25.html

 → グラフィックメモリ一覧 GDDR3, GDDR4, GDDR5 メーカー順
 → グラフィックメモリ一覧 GDDR3, GDDR4, GDDR5 クロック順
 → Sourceと各種メモ
 → 3Dゲームをノートパソコンで 蹴茶