查看原文
其他

Windows内存放血篇 | 突破物理内存的CopyOnWrite

2018-01-02 FaEry 看雪学院


本篇以x86(开启PAE) 以及x64 Win7系统,不借助微软API突破内存的写拷贝机制进行讲述。



0x01 Before Starting



1. PAE

      

Physical Address Extension,Inter为了支持更大的物理内存寻址而设计的x86寻址方式,虚拟地址没有变化都是32位,只是描述物理内存的位数由原先的32为增加到36位,能够最多寻址 2^4 * 4GB = 64GB内存,也就意味着你机器上如果存在超过4GB的内存条,那么一般都可以被充分利用到,这只是体现在多进程多任务的性能上,并没有增加一个进程的寻址空间,仍然为4GB。


微软喜欢把页面表基地址放在0xC0000000上,当发生进程切换操作时这块页表内容会随CR3引导的页面表的内容而发生改变(一般内核的高2GB不会变化太大,主要体现在低2GB内存),那么这就有规律可言,在内核情景分析中可能大家都已经见过未开启PAE的几个公式:


 1) 未开启PAE状态下 (10/10/12)


          PTE = (VA >> 12) << 2 + PTE_BASE

          PDE = (VA >> 22) << 2 + PTE_BASE

         

因为 PDE_BASE 是描述PTE_BASE的PTE

         

显然  PDE_BASE = (PTE_BASE >> 12) << 2 + PTE_BASE = (0xC0000000 >> 12) << 2 +  0xC0000000 = 0xC0300000


那么自己推导下PAE下的计算方式


2) 开启PAE状态下 (2/9/9/12)


          PTE = (VA >> 12) << 3 + PTE_BASE

          PDE = (VA >> 21) << 3 + PTE_BASE

          PDPE = (VA >> 30) << 3 + PDE_BASE

         

因为 PDE_BASE 是描述PTE_BASE的PTE

         

显然 PDE_BASE = (PTE_BASE >> 12) << 3 + PTE_BASE = (0xC0000000 >> 12) << 3 + 0xC0000000 = 0xC0600000



2. x64 公式推导



WRK或者WDK开发包头文件中定义了64位下 PTE_BASE 的内容


#define PTE_BASE  0xFFFFF68000000000UI64

#define PPE_BASE  0xFFFFF6FB7DA00000UI64

#define PDE_BASE  0xFFFFF6FB40000000UI64

#define PXE_BASE  0xFFFFF6FB7DBED000UI64


自然,这几个值看起来都是固定了,其实是因为PTE_BASE固定的,才有个下面这几个固定的值,计算方式如下:


PDE_BASE = ((PTE_BASE & 0x0000FFFFFFFFF000) >> 12) * 8 + PTE_BASE

                    = 0xF68000000 * 8 + PTE_BASE 

                    = 0x7B40000000 + PTE_BASE = 0xFFFFF6FB40000000
PPE_BASE = ((PDE_BASE & 0x0000FFFFFFFFF000) >> 12) * 8 + PTE_BASE 

                    = 0xF6FB40000 * 8 + PTE_BASE = 0x7B7DA00000 + PTE_BASE

                    = 0xFFFFF6FB7DA00000
PXE_BASE = ((PPE_BASE & 0x0000FFFFFFFFF000) >> 12) * 8 + PTE_BASE 

                    = 0xF6FB7DA00 * 8 + PTE_BASE 

                    = 0x7B7DBED000 + PTE_BASE = 0xFFFFF6FB7DBED000 


在PAE开启状态下 (下文默认) 或者x64系统下,描述PTE结构的定义为:

typedef struct _MMPTE_HARDWARE {

    ULONGLONG Valid : 1;

    ULONGLONG Write : 1;        // UP version

    ULONGLONG Owner : 1;

    ULONGLONG WriteThrough : 1;

    ULONGLONG CacheDisable : 1;

    ULONGLONG Accessed : 1;

    ULONGLONG Dirty : 1;

    ULONGLONG LargePage : 1;

    ULONGLONG Global : 1;

    ULONGLONG CopyOnWrite : 1; // software field

    ULONGLONG Prototype : 1;   // software field

    ULONGLONG reserved0 : 1;  // software field

    ULONGLONG PageFrameNumber : 28;

    ULONG64 reserved1 : 24 - (_HARDWARE_PTE_WORKING_SET_BITS+1);

    ULONGLONG SoftwareWsIndex : _HARDWARE_PTE_WORKING_SET_BITS;

    ULONG64 NoExecute : 1;

} MMPTE_HARDWARE, *PMMPTE_HARDWARE;

 

typedef struct _MMPTE {

    union  {

        //ULONG_PTR Long;

        MMPTE_HARDWARE Hard;

        //MMPTE_HARDWARE_LARGEPAGE HardLarge;

        //HARDWARE_PTE Flush;

        //MMPTE_PROTOTYPE Proto;

        //MMPTE_SOFTWARE Soft;

        //MMPTE_TRANSITION Trans;

        //MMPTE_SUBSECTION Subsect;

        //MMPTE_LIST List;

        } u;

} MMPTE;

 

typedef MMPTE *PMMPTE;

0x02 Physical Memory Patch

实际上这个ULONGLONG CopyOnWrite : 1; // software field我并没有看出什么玄机,重点是这个ULONGLONG Write : 1;        // UP version


找到虚拟地址对应的PTE项,将Write位置为1,自然这块内存就不再为写拷贝了,看Inter手册上对这个字段的描述也不是特别的清楚,下图为2MB的大页面对应的结构,跟4KB的小页面也差不了多少,对R/W字段的描述也不是很明显,只是WRK/Win2000上的这个software field的3个字段全部为Ignored...




这个位起着的作用看上去不是只有一个可写属性,当我写一个Dll让一个目标进程去Load然后用这种方式把他的PE头给Patch了之后,达到了与MDL修改物理内存一样的效果(MDL其实也是一个突破CopyOnWrite的一个方法),以后这个进程再也加载不起来这个Dll了,因为原始的物理页已经被修改了。


typedef struct tag_CTRLV2

{

    PVOID lpAddress;

    PVOID lpPatchContext;

    ULONG ulSize;

 

} CtrlV2, *PCtrlV2;

 

BOOLEAN ModifyPhysicalAddressX86(PCtrlV2 pV2)

{

    if (g_bPAEON)

    {

        PMMPTE_PAE ProtectPTE = MiGetPteAddressForPAE(pV2->lpAddress);

        __try

        {

            if (ProtectPTE->Valid)

            {

                // Disable CopyOnWrite

                ProtectPTE->Write = 1;

                // Now Patch Physical Memory

                memcpy(pV2->lpAddress, pV2->lpPatchContext, pV2->ulSize);

 

                DbgPrint("[Wxoit] ModifyPhysicalAddressX86 pV2->lpAddress:%x, Context:%x\r\n", 

                    pV2->lpAddress, *(ULONG*)pV2->lpAddress);

            }

        }

        __except(EXCEPTION_EXECUTE_HANDLER)

        {

            DbgPrint("[Wxoit] ModifyPhysicalAddressX86 Raise Exception %x", GetExceptionCode());

        }

    }

 

    return TRUE;

}


第一次加载NopDll.dll 并Patch NopDll.dll 的PE DOS_SIGNATURE。



第二次加载NopDll.dll时,发现这个Dll已经是一个bad exe format



当然这个方法,我也给大家支持了64位,但是警告大家不要去随意搞系统的内存,出问题本人概不负责...


代码写的比较急,没有支持跨进程操作物理内存,大家如果想做只要KeStackAttachProcess下就OK了,


代码在最后的附件中



0x02 Things of MDL



最后就当作福利吧,前段时间在看MDL的一些API,把我所学分享给大家。


IoAllocateMdl

MmProbeAndLockPages/MmBuildMdlForNonPagedPool

MmMapLockedPagesSpecifyCache


MDL不止只有下面描述的结构,在这个结构的后面还存在着这个MDL描述的所有的物理页的页面帧号。


typedef struct _MDL {

    struct _MDL *Next;

    CSHORT Size;

    CSHORT MdlFlags;

    struct _EPROCESS *Process;

    PVOID MappedSystemVa;

    PVOID StartVa;

    ULONG ByteCount;

    ULONG ByteOffset;

} MDL, *PMDL;


1. IoAllocateMdl


PMDL

IoAllocateMdl(

    IN PVOID VirtualAddress,

    IN ULONG Length,

    IN BOOLEAN SecondaryBuffer,

    IN BOOLEAN ChargeQuota,

    IN OUT PIRP Irp OPTIONAL

    )

      

这个API没啥好说的,就是小心点大小检测,当传入的Length越过了0x17个页面时,对MDL的大小有要求(不能超过0xFFFF),第三参数只有在第五参数存在时才有意义:标志这个是不是一个链式内存(一般只有在IRP结构中需要处理),第四参数没看到在哪用。一般地,三四五参数都传NULL。


2.  MmProbeAndLockPages


MmProbeAndLockPages (
     IN OUT PMDL MemoryDescriptorList,
     IN KPROCESSOR_MODE AccessMode,
     IN LOCK_OPERATION Operation
     )


好了,这个API开始就要注意了,这块特别容易抛异常

1. 进入这个函数之前,不要随便给MDL置标记(不管是你手动的还是API帮你置的位),特别是


MDL_PAGES_LOCKED 

MDL_MAPPED_TO_SYSTEM_VA

MDL_SOURCE_IS_NONPAGED_POOL

MDL_PARTIAL

MDL_IO_SPACE


2. 存在当前模式,如果传入UserMode,那么在第一步初始化MDL如果描述的虚拟地址是一个内核地址,那么这直接抛0xC0000005异常


3. 这个API紧接这会去锁住MDL描述的物理内存页面,当你传入MDL的虚拟地址是一个Ring3地址, 也会校验你传入的Operation, 其中

  

一个页面不具有写属性你却传入了 IoWriteAccess/IoModifyAccess 那么不好意思,同样RaiseException


4. 检查当前进程(对是当前进程!,调用这个函数如果你要修改别人家的物理内存那么请先KeStackAttachProcess ) 的虚拟内存对应的物理

   

页面映射关系,如果你尝试传入一个缺页的内存,这个函数会尝试处理这个缺页情况,再做类似第三步的动作


5. 即使找到了虚拟页面映射的物理页面,如果传入 IoWriteAccess/IoModifyAccess  也会校验对应的VAD是否具有MM_READWRITE属性


使用这个函数时,如果你要修改内存那么不必急着传入 IoWriteAccess/IoModifyAccess 这样会造成这个函数代码内部的检测逻辑,因为最后在调用MmMapLockedPagesSpecifyCache 函数时,不管是Ring3还是Ring0应该都是具有读写属性的。在我的理解上来看.......


3.  MmBuildMdlForNonPagedPool


VOID

MmBuildMdlForNonPagedPool (

    IN OUT PMDL MemoryDescriptorList

    )


这个函数很简单,就负责置MDL的标志位以及填充页面帧号,当然也要求当前进程的页面表能够访问到的内存

MemoryDescriptorList->MdlFlags |= MDL_SOURCE_IS_NONPAGED_POOL;


4.  MmMapLockedPagesSpecifyCache


PVOID

MmMapLockedPagesSpecifyCache (

     IN PMDL MemoryDescriptorList,

     IN KPROCESSOR_MODE AccessMode,

     IN MEMORY_CACHING_TYPE CacheType,

     IN PVOID RequestedAddress,

     IN ULONG BugCheckOnFailure,

     IN MM_PAGE_PRIORITY Priority

     )


当MDL的页面帧号都填充完毕时,通过 MmMapLockedPagesSpecifyCache最后一步映射物理内存到当前进程页面表中,不知道微软是怎么想到设计这个接口的,这个函数实在过于强大。强大不光体现在他能越过内存的CopyOnWrite机制,而且通过 MmMapLockedPagesSpecifyCache得到的虚拟内存地址具有读写属性......


1. KernelMode 内核模式下会得到一个内核地址,我们都知道内核中的内存都是可读可写可执行的

2. UserMode 用户模式下Map的地址同样具有读写属性,具体实现见MiMapLockedPagesInUserSpace,在LoadImage回调下

    这个函数有进程的AddressCreationLock限制,所以在模块回调时不要用UserMode!


至少到目前为止的Windows版本都是可读写的。


说到这里,我想到某厂的驱动开发人员写了这样一段代码,看的我哭笑不得



这个人即想把MDL映射到内核地址( MDL_MAPPED_TO_SYSTEM_VA ),又使用UserMode的映射....... 局外人啊。


不过这段代码不会出什么问题,因为 MmMapLockedPagesSpecifyCache 还是先校验 AccessMode的,如果是UserMode就不会看 MDL_MAPPED_TO_SYSTEM_VA 标记了,而且这个厂商用这个方法 Patch 动态库让动态库无法加载,实在让人深恶痛绝,因为改了物理内存,所有进程都加载不了这个动态库了。


而且从时间上的观察来看,这个厂商甚至不知道这些函数干了些啥,只知道这样可以获取内存的写权限......


本文由看雪论坛 FaEry 原创

转载请注明来自看雪社区



热门阅读


点击阅读原文/read,

更多干货等着你~


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存