光栅化（三角形的离散化）

几何与像素的交界

图形管线在经过顶点着色器与投影变换后，几何体（如三角形）处于连续的数学空间中。屏幕或帧缓冲则是由离散像素构成的二维网格。光栅化 (Rasterization) 的核心目标，是将连续的几何形状转换为离散的屏幕采样点，为后续的计算生成候选状态——即片元 (Fragment)。

离散化与覆盖测试

将连续三角形映射到离散网格的基础方法是覆盖测试 (Coverage Test)。硬件光栅化器通过检查像素中心点是否落在三角形内部来判断覆盖状态。

边缘方程与数值实例

判定点是否在三角形内部的标准数学方法是使用向量叉乘构造边缘方程。假设三角形三个顶点按逆时针顺序排列为 $A(x_0, y_0)$ 、 $B(x_1, y_1)$ 、 $C(x_2, y_2)$ ，对于平面上任意一点 $P(x, y)$ ，可以构造由边向量与点 $P$ 构成的二维叉乘：

E_{AB}(x, y) = (x_1 - x_0)(y - y_0) - (y_1 - y_0)(x - x_0)

如果点 $P$ 位于三角形内部，则它必须同时满足位于三条有向边的左侧，即 $E_{AB} \ge 0$ 且 $E_{BC} \ge 0$ 且 $E_{CA} \ge 0$ 。这在本质上应用了第一章中向量叉乘在二维空间中判定方向的几何意义。

硬件级加速机制

在真实的 GPU 硅片设计中，光栅化过程集成了大量依赖数学特性的性能优化机制：

1. 背面剔除 (Back-Face Culling)

用于判定边缘方程的向量叉乘，同时表征了三角形的有向面积 (Signed Area)。若顶点在屏幕空间中呈顺时针排列（即整个三角形的二维叉乘结果符号为负），图形管线会直接判定该三角形背向摄像机，并将其完全剔除，阻断后续的像素覆盖测试。

2. 包围盒与分块光栅化

为了避免遍历全屏像素，光栅化器首先计算三角形的轴对齐包围盒 (AABB)，提取坐标极值以缩小测试范围。现代 GPU 架构进一步引入了分块光栅化 (Tile-based Rasterization)。屏幕被划分为固定尺寸的宏块（如 $8 \times 8$ 像素）。硬件通过测试三角形与整个块的相交关系，快速批量剔除不相交的网格区域。

3. 边缘方程的增量计算法 (Incremental Evaluation)

边缘方程 $E(x, y)$ 是关于 $x$ 和 $y$ 的线性函数。在逐像素测试时，GPU 不会对每个像素重复执行两乘两减的完整代数公式。根据线性函数的导数特性，当光栅化器在屏幕网格的水平方向步进一个像素（即 $x \to x+1$ ）时，方程的值仅需累加一个固定的斜率常数 $\Delta y = y_0 - y_1$ ；在垂直方向步进时，只需累加 $\Delta x = x_1 - x_0$ 。这种以单次加法替代复数次乘法运算的底层设计，是硬件光栅化具备极高吞吐量的数学基础。

显示包围盒 (AABB) 显示边界线段 (Edges) 网格密度: 20x20

拖动三角形的顶点 A, B, C，观察光栅化器如何计算边界包围盒 (AABB)，并通过判定边缘方程的符号 (E ≥ 0) 来决定哪些像素的中心点被覆盖，从而生成片元。

获取屏幕坐标：假设三角形三个顶点位于 $A(1, 1)$ 、 $B(5, 2)$ 、 $C(3, 6)$ 。
计算包围盒：边界为 $X \in [1, 5]$ 与 $Y \in [1, 6]$ 。
遍历中心点：取包围盒内某像素中心点 $P(3.5, 3.5)$ 进行测试。
执行边缘方程：
- 边 $AB$ 向量为 $(4, 1)$ ， $AP$ 向量为 $(2.5, 2.5)$ 。叉乘 $E_{AB} = 4 \times 2.5 - 1 \times 2.5 = 7.5 \ge 0$ 。
- 边 $BC$ 向量为 $(-2, 4)$ ， $BP$ 向量为 $(-1.5, 1.5)$ 。叉乘 $E_{BC} = -2 \times 1.5 - 4 \times (-1.5) = 3 \ge 0$ 。
- 边 $CA$ 向量为 $(-2, -5)$ ， $CP$ 向量为 $(0.5, -2.5)$ 。叉乘 $E_{CA} = -2 \times (-2.5) - (-5) \times 0.5 = 7.5 \ge 0$ 。
生成片元：三个叉乘结果均大于等于 $0$ ，判定点 $P(3.5, 3.5)$ 位于三角形内部，在此位置生成片元。

边界规则

当两个三角形共享一条边时，边上的采样点会产生归属歧义。为避免同一采样点产生重复片元（冗余计算）或不产生片元（导致几何体之间出现缝隙），图形 API 统一定义了严格的光栅化边界规则。

以 Direct3D 和 OpenGL 中采用的“左上边缘规则” (Top-Left Rule) 为例：只有当边位于三角形的左侧（非水平边，且在数学上向右递增）或上侧（水平边）时，恰好落在该数学边上的像素中心才被判定属于该三角形。

属性插值与重心坐标

三角形仅在三个顶点处定义了位置、颜色、法线与纹理坐标等属性。为了向三角形内部生成的片元传递这些数据，需要执行空间插值。

面积公式推导

重心坐标 (Barycentric Coordinates) 是解决三角形内部插值的标准数学工具。对于三角形内部的任意点 $P$ ，可以由三个顶点 $A$ 、 $B$ 、 $C$ 线性组合表示：

P = \alpha A + \beta B + \gamma C

其中，权重满足 $\alpha + \beta + \gamma = 1$ 。在几何上，这些权重可通过子三角形面积与总面积的比值计算：

$\alpha = S_{\triangle PBC} / S_{\triangle ABC}$
$\beta = S_{\triangle PCA} / S_{\triangle ABC}$
$\gamma = S_{\triangle PAB} / S_{\triangle ABC}$

这套权重可等效应用于任意顶点属性的插值计算：

Attribute_P = \alpha Attribute_A + \beta Attribute_B + \gamma Attribute_C

α (A: 红) = 0.33 β (B: 绿) = 0.33 γ (C: 蓝) = 0.33

插值颜色:

拖动点 P，观察重心坐标 α, β, γ 的权重变化，以及顶点颜色是如何通过这些权重在三角形内部进行线性插值混合的。

数值实例

假设三角形顶点 $A$ 为纯红 $(1, 0, 0)$ ， $B$ 为纯绿 $(0, 1, 0)$ ， $C$ 为纯蓝 $(0, 0, 1)$ 。若某片元 $P$ 的位置计算得出的重心坐标为 $\alpha = 0.2$ 、 $\beta = 0.3$ 、 $\gamma = 0.5$ 。则该片元的插值颜色为：

Color_P = 0.2 \times (1, 0, 0) + 0.3 \times (0, 1, 0) + 0.5 \times (0, 0, 1) = (0.2, 0.3, 0.5)

片元着色器接收到的即为经过此离散化插值后生成的平滑过渡数据。

透视校正插值

在三维空间经透视投影至屏幕空间后，屏幕上的线性距离并不等同于三维空间中的实际线性距离。

直接在屏幕的二维空间中对深度 $Z$ 坐标或纹理坐标 $U, V$ 进行线性插值，会导致错误的视觉映射。在具有透视收缩（Perspective Foreshortening）效果的视图中，远处物体的像素密度应大于近处。若在屏幕空间实施线性混合，物体表面的纹理会出现明显的仿射扭曲失真。

为了解决该误差，图形管线硬件会执行透视校正插值 (Perspective-Correct Interpolation)。

数学推导表明，虽然顶点属性 $I$ 在屏幕空间中不呈线性分布，但属性与透视除数 $W$ 的比值（即 $I/W$ ），以及 $1/W$ 本身，在屏幕空间中保持严格的线性变化。因此，现代 GPU 执行透视校正的实际计算步骤如下：

在屏幕空间中，使用重心坐标 $\alpha, \beta, \gamma$ 对顶点的 $1/W$ 进行线性插值，求得当前片元的深度倒数 $1/W_P$ 。
使用相同的重心坐标对 $I/W$ （如 $U/W$ 和 $V/W$ ）进行线性插值，求得当前片元透视投影后的属性项 $I_P/W_P$ 。
将计算得到的 $I_P/W_P$ 除以 $1/W_P$ ，恢复出符合三维透视关系的原始属性 $I_P$ 。

通过上述数学步骤，硬件光栅化器在进行离散采样的同时，确保了三维透视信息的物理准确性。