GPU Gems 2: Programming Techniques for High-Performance Graphics and General-Purpose Computation 编辑:Matt Pharr (NVIDIA) 出版社:Addison-Wesley | 2005
这是《GPU Gems 2》的完整读书笔记,涵盖:
- 48章核心内容:从几何复杂度到科学计算
- 6个主题部分:几何、光照、高质量渲染、GPU通用计算、图像计算、模拟算法
- GPGPU重点:完整的Part IV通用计算(CUDA发布前一年)
- 完全免费:NVIDIA官网在线提供
- 虚拟植物真实感渲染
- GPU几何clipmap地形
- 几何实例化
- Segment buffering
- 多流资源管理
- 硬件遮挡查询
- 细分曲面自适应曲面细分
- 逐像素位移贴图
- 延迟着色(S.T.A.L.K.E.R.)⭐⭐⭐
- 动态辐照度环境映射
- 近似双向纹理函数
- Tile-based纹理映射
- mental ray GPU加速
- 动态AO与间接光照
- 非真实感渲染
- 精确大气散射
- 软阴影优化
- 顶点纹理位移水面
- 通用折射模拟
- 三阶纹理过滤
- 高质量抗锯齿光栅化
- 快速预过滤直线
- 头发动画与渲染(Nalu演示)
- 色彩变换查找表
- Apple Motion GPU图像处理
- 改进Perlin噪声
- 高级高质量过滤
- Mipmap级别测量
- 流式架构与技术趋势
- GeForce 6系列GPU架构
- 计算概念到GPU的映射
- GPU计算入门
- 高效并行数据结构
- GPU流程控制惯用法
- GPU程序优化
- 流归约操作
- GPU八叉树纹理
- 光栅化全局光照
- 渐进细化辐射度
- GPU计算机视觉
- 延迟过滤
- 保守光栅化
- 蛋白质结构预测
- 线性方程组求解
- 期权定价
- 改进GPU排序
- 复杂边界流体模拟
- FFT医学图像重建
| 维度 | GPU Gems 2 | GPU Gems 1 | GPU Gems 3 |
|---|---|---|---|
| 定位 | 高级技术+GPGPU | 实战技巧合集 | 现代GPU特性 |
| 年份 | 2005 | 2004 | 2007 |
| 章节数 | 48章 | 42章 | ~40章 |
| 硬件 | GeForce 6/7 (SM 3.0) | GeForce FX (SM 2.0) | GeForce 8 (Unified) |
| GPGPU | ✅ 完整Part IV | ✅ CUDA时代 | |
| 新技术 | 延迟着色、顶点纹理 | 基础技术 | 几何着色器 |
| 免费 | ✅ 在线完全免费 | ✅ 在线完全免费 | ✅ 在线完全免费 |
- ✅ GPGPU先驱:CUDA发布(2006)前一年的通用计算完整探索
- ✅ 延迟着色:首次详细介绍S.T.A.L.K.E.R.的延迟渲染架构
- ✅ Shader Model 3.0:动态分支、顶点纹理获取、长shader
- ✅ 高级几何:细分曲面、位移贴图、几何clipmap
- ✅ 跨学科应用:从游戏到蛋白质预测、金融定价、医学成像
- ✅ 技术演进:见证GPU从图形专用到通用计算的转型
渲染技术:
- 延迟着色:Ch9 ⭐⭐⭐
- 几何处理:Ch2-8
- 光照:Ch10, Ch14, Ch16
- 阴影:Ch17
- 水面:Ch18-19
GPGPU核心:
- 架构:Ch29-30
- 编程模型:Ch31-32
- 数据结构:Ch33
- 优化:Ch34-35
- 应用:Ch36
科学计算:
- 生物信息学:Ch43
- 数值计算:Ch44, Ch46
- 金融:Ch45
- 流体:Ch47
- 医学:Ch48
高质量渲染:
- 抗锯齿:Ch21
- 过滤:Ch20, Ch27
- 头发:Ch23
- NPR:Ch15
- 📘 在线版本:https://developer.nvidia.com/gpugems/gpugems2
- 💻 示例代码和Demo:可下载
- 📚 GPU Gems 1和3:也在线提供
- GPU Gems 1读书笔记 - 基础GPU编程
- RTR4读书笔记 - 实时渲染理论
- PBRT4读书笔记 - 离线渲染实现
- GPU Gems 1的基础知识
- Shader编程经验(HLSL/Cg)
- 线性代数
- 并行计算概念(对于Part IV)
路径1:游戏开发者(推荐)
Ch2-3(地形+实例化)→ Ch9(延迟着色)→ Ch14(动态AO)→ Ch16(大气)→ Ch17-19(阴影+水)
路径2:GPGPU研究者 ⭐⭐⭐
Part IV完整(Ch29-36)→ Part VI选读(Ch43-48)→ 了解CUDA前的GPGPU
路径3:渲染工程师
Ch9(延迟着色)→ Ch7-8(曲面细分+位移贴图)→ Part III(高质量渲染)→ Ch38-39(全局光照)
路径4:技术美术
Ch1(植物)→ Ch15(NPR)→ Ch23(头发)→ Ch24-25(色彩+图像处理)
路径5:完整学习
Part I→VI按顺序(48章)
路径6:历史研究
重点Part IV(了解CUDA前的GPGPU状态)→ 对比现代CUDA/OpenCL
- ✅ 实现延迟着色管线(Ch9)
- ✅ 对比SM 2.0→SM 3.0的进步(顶点纹理、长shader)
- ✅ 研究GPGPU历史(Part IV vs CUDA)
- ✅ 实现几何clipmap地形(Ch2)
- ✅ 探索科学计算应用(Part VI)
GPU:
- GeForce 6/7系列(DirectX 9.0c)
- Shader Model 3.0
- 顶点纹理获取(VTF)✅ 新增
- 动态分支✅ 新增
- 更长的shader(vs: 512指令,ps: 512-1024指令)
- 仍然分离的顶点/像素处理器
GPGPU状态:
- CUDA发布前一年(2006年11月发布)
- 通过图形API实现通用计算
- 数据存储为纹理
- 计算表达为渲染操作
历史意义:
- 延迟着色成为主流(S.T.A.L.K.E.R.等AAA游戏)
- GPGPU从研究走向应用
- GPU从专用图形处理器向通用并行处理器转型
技术演进:
- 统一着色器架构(GeForce 8+, 2006)
- CUDA/OpenCL通用计算框架
- 实时光线追踪(RTX, 2018)
- Mesh Shader/Amplification Shader
- 机器学习加速(Tensor Cores)
仍然有效的核心思想:
- 延迟着色仍是主流技术
- 数据并行思维
- GPU流处理概念
- 性能优化策略
- 总行数:737行(初始框架)
- 完成日期:2026-03-05
- 状态:✅ 框架完成,📝 详细内容持续补充中
- 笔记质量:⭐⭐⭐⭐(框架完整,部分详细)
- 完整框架:所有48章的结构和目录
- 重点突出:GPGPU部分(Part IV)的历史价值
- 技术分类:按应用领域分类章节
- 历史视角:CUDA发布前的GPGPU探索
- 互补体系:与GPU Gems 1/3形成完整系列
- 持续更新:框架已完成,详细内容持续补充
已完成:
- ✅ 完整48章目录结构
- ✅ Part I部分章节详细内容
- ✅ 所有章节概述
待补充:
- 📝 Part II-VI详细技术要点
- 📝 更多代码示例和算法描述
- 📝 章节间的技术关联
贡献方式:
- 欢迎补充详细技术要点
- 欢迎纠正技术错误
- 欢迎补充实践经验
本笔记仅包含技术要点总结和概念提取,不含原书的完整内容。 完整内容请访问NVIDIA官方在线版本(完全免费)。
原书版权:© 2005 NVIDIA Corporation and Addison-Wesley
欢迎提出改进建议!特别欢迎补充Part II-VI的详细技术内容。
笔记整理:Master + Claude 最后更新:2026-03-05 版本:v0.1(初始框架)