提取游戏模型：Hook的概念与流程

2021-02-18

最近在分析游戏动画的实现方式，需要提取游戏模型。对于个别游戏，常用的截帧工具RenderDoc与GPA无法正常使用。因此我通过Hook DirectX API，实现了游戏模型的提取。本文借助这个案例，介绍了Hook的概念和Hook DirectX API的流程，不包含代码。

1. 问题分析

在分析游戏动画时，需要判断动画是否采用BlendShapes方案。对于老游戏比较容易判断，因为BlendShapes几乎都在CPU中计算，只要截取shader的输入模型，观察是否形变就能确定了。

但实际操作时，常用的RenderDoc/GPA等截帧工具，对于个别游戏会截帧失败。例如分析《模拟人生4》时，RenderDoc无法挂入，GPA则在截帧时使游戏崩溃，导致无法获取输入模型。

初步检查了下游戏后，我发现《模拟人生4》没有反调试等保护功能，于是打算手动Hook DirectX API，通过API来截取顶点Buffer中的模型数据。为了达到这一点，我需要：

根据上面的问题分拆，就能得到解决方法：

如果能让进程调用自己编写的dll，这样就可以在进程内执行特定代码，访问进程本身的虚拟内存，达到Hook函数的目的。这个过程被称作「DLL注入」，注入的方法大致分为：

为了提取模型，只需要在单个游戏进程中，Hook其中一帧就行了，所以「动态注入」是最适合的方式。动态注入的流程大致是：

上面的流程中，最复杂的是第四步，因为目标进程只会按照原有的程序执行，必须通过一些特殊hack来打断原始程序，让进程执行读取dll的代码，再恢复原始程序的执行。

关于远程执行的详细介绍，可以在Open Security Research的这篇文章找到。关于远程执行的详细实现代码，可以在fdiskyou的GitHub仓库找到。

这里我直接使用开源DLL注入工具Xenos。

为了Hook特定的目标函数，需要首先获取函数的地址，然后改写函数内容。常见获取API地址的方法有这些：

「静态分析」适用于导出表或pdb包含函数名的情况，可以直接拿到地址，但自动获取较为麻烦，更多用于人工分析。「特征匹配」则是根据二进制特征，匹配出函数头的位置，由于要求二进制的一致性，容易出现不兼容问题。「vtable」则是根据虚函数的vtable表，来间接获取地址，适用性较高。

在DirectX9中，所有的绘制操作都需要通过「Device接口」。Device接口是一个COM接口，它的函数不会直接导出，而是通过COM组件提供，所以无法从导出表获取地址。

根据《COM技术内幕》，任何COM接口都是纯虚类，所以它们的函数都在vtable中，并且由多个接口共享，如下图所示：

4-COM

所以此时可以用「vtable」法，从而访问到全部虚函数地址，方法流程是：

由此，得到了Device接口的全部函数地址，此时查阅vtable函数序号表，便能得到特定函数的地址。

在内存中，函数是一段二进制机器码，应用程序通过函数的地址来调用函数。如果能修改函数的机器码，就可以修改函数的功能。为了获取模型数据，需要修改DX的绘制函数，使其在绘制前提取绘制数据。

Inline Hook是一种常见方法，它将函数的首个指令修改为jmp指令，直接跳转到自定义函数，执行完后再跳转回原始函数，Hook前后的函数如图：

左边是原始过程，函数分为前言和执行两部分，执行完后返回调用者。右边是Hook后的函数流程，其中：

Hook后的执行流程如下：

详细的Hook流程可以在BananaMafia的博客文章中找到。整个过程的难点，在于要正确获取前言的长度，并且构造合适的跳板函数。前言长度可以通过IDA分析得到，跳板函数的构造可以通过许多开源库实现，例如微软开源的Detours。

Hook到绘制函数后，就可以在绘制之前，读取绘制所需要的数据了。此时可以拿到以下的数据：

获取模型定点数据的流程如下：

这一步的核心是「解释内存」：通过DX获取元数据，从中分析出内存格式，将顶点信息提取出来。由于DX使用了许多提升性能的设计，所以数据格式的理解会比较绕，需要多参考官方文档。

Hook是一种利用Windows/x86的实现细节，来修改原有函数的实现，达到增加功能的目的。通过Hook，可以实现增强调试、破解收费、透视外挂、修改数据等许多功能，为业务带来更多可能性。

这篇文章通过实际的例子，即从游戏进程中抓取游戏模型，来介绍了DLL注入、定位API地址、Hook函数和提取模型数据，展示了Hook的概念与流程。如果需要了解详细实现，可以继续阅读文章里的链接，或者参考Guided Hacking的文章。