查看原文
其他

IAT的填充过程与执行流程

amzilun 看雪学院 2019-05-26

IAT是什么?为什么它在脱壳修复中扮演着如此重要的地位?它在内存中是怎么样排列的,又是怎样获取的呢?


调试器:OllyDbg

环境:WinXP SP3 虚拟机


(一)IAT


什么是IAT呢。同一个函数,在A电脑里的首地址和在B电脑里的首地址是不一定相同的。系统版本不同,补丁版本不同,都会导致同一个函数的地址有所差异。


如果找不到正确的系统API地址程序就没法正常调用函数,自然就没法运行。为了提升系统的兼容性,每次执行程序时软件都会重新获取一次 基于当前的系统的API的地址,并把这些地址集中起来管理,组成一个表。我们把这个表叫输入函数地址表,简称输入表。即IAT(import address table)。


有些壳没有彻底破坏掉IAT结构。比如ASpck,我们以一个加Aspack的课件为例,我们首先使用ESP定律来到OEP,此时壳已经将IAT还原完毕了。


(关于ESP定律的详细解释可以参考坛主大大的文https://bbs.pediy.com/thread-20366.htm


然后,来看一个调用函数的实例。




call <imp.&KERNAL32.GetmoduleHandle>,点击这一行按下回车,来到跳转表




接着按下空格键,看到未经修饰的原始代码为 jmp [403238]




jmp [403238] ,数据窗口跟随403238,看到 [403238] = 752d582e,如下图。


所以 jmp[403238] 等价于jmp 752d582e ,而 752d582e 是函数GetModuleHandle 的首地址,从而达到了调用 GetModuleHandle 函数的目的。


当然并不是所有程序都保留有跳转表结构,本例对IAT的保存比较完整和系统,有跳转表。




那么能不能直接写 jmp 752d582e呢?不能,因为这个地址在每台电脑都不一样。必须用[4031ac]间接调用77d507ea。


本节我们初步了解了IAT长什么样,下一节我们接下来我们来了解IAT的原始结构及获取方法



(二)IAT的原始结构及获取方法



根据上一节的预备知识可知,数据窗口跟随 403238,取出里面的内容,就是是GetModuleHandle函数的真实地址




选中 752d1245  ,右键,点击“查看可执行文件”,如下图所示,最左上角的那里




原本的 403238 变成了1038, 752d1245变成了355E。 这是为什么呢

我们把1038 叫文件偏移地址,这个地址加上402200就是403228。


355e是相对虚拟地址(RVA),它加上基址 400000(image base)得到一个虚拟内存地址40355e(VA),跟随地址40355e发现里面的内容是该函数的名称字符串如下图所示。




偏移地址的内容里存储着字符串,利用字符串, 接下来,程序调用GetProcAddress获取到函数的真实地址,并将该地址填充到40355e所在的区域。注意这里是存储偏移地址的地方,而不是存储字符串的地方。


IAT就由这样的步骤重复执行而形成的。


我们使用十六进制工具winhex验证一下。载入课件,定位1038,里面也是0000355e,再来到40355e,里面是字符串GetModuleHandle

所以程序需要用获取哪些函数,该信息早就已经存在程序里了,在程序运行前用GeProcAddress获取这些函数的地址填充到IAT就能运行了。


字符串信息事先保存在程序中,但一旦IAT获取完毕,字符串往往会被删除。


(三)导入表与输入表详解



在数据窗口右击-指定-PE头,然后转到400000(基址),查看PE文件,找到import table address=3000.这表示导入表指针偏移是3000,真实地址等于3000加上基址,即403000。




我们先来区分一下导入表(IT)和输入表(IAT)。导入表是IT(import table),输入表是IAT(import address table).IT的描述符结构是每5个Dword为一个单元,这个单元叫IID,如图所示




一个IID有五个字段,每个字段占一个Dword,但前三个字段一般没用,有用的是第四字段和第五字段。第四字段加基址403290,这里存放dll名称。我们定位到403290看一下




如图所示,dll的名称是user32.dll


第五字段里的内容加基址,作为指针指向的内容是这个dll的第一个函数地址。



导入表虽然包含了输入表,但IAT不一定与IT所在的内存空间相邻,它可以位于任何一个具有写入权限的地方。即使他们分隔很远也可以,换言之,在内存空间中可以不连续。IID通过第五个双字里的函数地址与IAT链接起来,这相当于一个链表。


总结,先在PE文件里找到IT的位置,接着根据IT里第一个IID的第四字段定位到dll的名称,第五个字段定位dll对应的IAT项的起始位置。接着根据IAT里的字符串偏移,提取出函数的名称,接着利用GetProcAddress来获取函数的地址。


最后将函数的地址填充进去。一直这样重复,当获取到的不再是字符串偏移地址而是00000000时,即表示当前dll里所有函数的IAT填充完成了。来到IT的下一个IID里重复刚才的过程。可以看到下一个dll是kernal32.dll,以此类推。



以上是填充IAT的完整过程。


认识了IAT,接下来我们就要着手修复了,以后如果还有时间,我会分享IAT修复的文章给大家。




本文由看雪论坛 amzile  原创

转载请注明来自看雪社区


往期热门阅读:


扫描二维码关注我们,更多干货等你来拿!

Modified on

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存