分享

Linux下HOOK动态链接库中API的方法

 lifei_szdz 2017-12-03

2012年,我写了一篇介绍Windows系统下Ring3层API的hook方案——《一种注册表沙箱的思路、实现——Hook Nt函数》,其在底层使用了微软的Detours库。5年后,我又遇到这么一个问题,但是系统变成了Linux。我最开始的想法是找一个Linux下的Detours库,于是找到了subhook。其原理是:修改被Hook函数起始地址处的汇编代码,让执行流程跳到我们定义的函数中。但是在实际使用中,我发现通过该库调用原始函数有错误——地址违例,导致进程崩溃,所以最终放弃了subhook的方案。(转载请指明出于breaksoftware的csdn博客)

        后来发现,Linux用户层Hook非常简单。我们只要定义一个和被Hook的API相同名称、参数、返回值的函数即可。比如我们需要Hook获取用户UID的函数getuid(原来是在libc.so中实现的),则需要定义如下函数:

  1. uid_t getuid(void) {  
  2.     return 800;  
  3. }  
        我们在main函数中调用之

  1. int main() {  
  2.     printf("get_uid:%d\n", getuid());  
  3. }  
        函数返回


        我使用work账户登录的,其真实uid是502。而我们重写了程序中的getuid,则返回的是我们“指定”的800。

        如果我们希望在被hook中的函数中调用原始函数,怎么做呢?这儿有个比较尴尬的问题,那就是我们定义的getuid地址将对应于符号getuid,那么原始的getuid(以后称libc中的getuid)地址将对应什么符号?我们怎么找到它?

        可以想象libc中的getuid对应的符号不会因为我们的程序而被改变,那么就意味着程序运行中,将有两个getuid。事实也的确如此。

        第一个getuid就是我们重定义的hook的函数体,第二个是动态链接库libc.so中的。于是我们在重定义的函数体中,使用

  1. dlsym(RTLD_NEXT, "getuid")  
        就可以获得原始的函数地址。

        所以这种方案的精髓就是RTLD_NEXT参数。我们看下dlsym函数参数的说明:

        There are two special pseudo-handles, RTLD_DEFAULT and RTLD_NEXT. The former will find the first occurrence of the desired symbol using the default library search order. The latter will find the next occurrence of a function in the search order after the current library. This allows one to provide a wrapper around a function in another shared library.
        这段文字意思是:在默认的库查找顺序下,RTLD_DEFAULT是用于查找第一个符号匹配的函数地址,RTLD_NEXT是用于查找第二个符号匹配的函数地址。这种方式就提供了一种针对动态链接库中函数替换的功能。

        以我们例子,RTLD_DEFAULT将找到我们自己定义的getuid,而RTLD_NEXT将找到libc.so中的。
        为了方便使用这种方式,我封装了相关调用

  1. #ifndef HOOK_BASE  
  2. #define HOOK_BASE  
  3.   
  4. #ifndef _GNU_SOURCE  
  5. #define _GNU_SOURCE  
  6. #endif  
  7.   
  8. #include <dlfcn.h>  
  9.   
  10. #define HOOK_FUNC_TEMPLATE(function_name) function_name##_func_t  
  11.   
  12. #define HOOK_FUNC_ORI_NAME(function_name) function_name##_ori  
  13.   
  14. #define HOOK_FUNC_INIT(function_name) static HOOK_FUNC_TEMPLATE(function_name) HOOK_FUNC_ORI_NAME(function_name);  
  15.   
  16. #define HOOK_FUNC(function_name) \  
  17.     if (!HOOK_FUNC_ORI_NAME(function_name)) {\  
  18.         HOOK_FUNC_ORI_NAME(function_name) = (HOOK_FUNC_TEMPLATE(function_name)) dlsym(RTLD_NEXT, #function_name);\  
  19.     }\  
  20.   
  21. #define ORIGINAL_FUNC(function_name) ((HOOK_FUNC_TEMPLATE(function_name)) HOOK_FUNC_ORI_NAME(function_name))  
  22.   
  23. #endif  
        我们只要关注HOOK_FUNC_INIT、HOOK_FUNC和ORIGINAL_FUNC三个宏。HOOK_FUNC_INIT方法声明了一个全局函数指针变量,其在HOOK_FUNC宏中被指定为被HOOK函数的原始地址。ORIGINAL_FUNC则是将这个指针进行类型转换,从而方便调用。

        下一步我们要定义被HOOK的函数的类型

  1. #ifndef HOOK_DEF  
  2. #define HOOK_DEF  
  3.   
  4. #include "hook_base.h"  
  5. #include <stdio.h>  
  6. #include <sys/types.h>  
  7. #include <unistd.h>  
  8.   
  9. typedef uid_t (*HOOK_FUNC_TEMPLATE(getuid))(void);  
  10. #endif  
        然后重定义我们要HOOK的函数

  1. #include "hook_def.h"  
  2. #include <stdio.h>  
  3. #include <sys/types.h>  
  4.   
  5. HOOK_FUNC_INIT(getuid);  
  6.   
  7. uid_t getuid(void) {  
  8.     HOOK_FUNC(getuid);  
  9.     int uid = ORIGINAL_FUNC(getuid)();  
  10.     printf("getuid original:%d\n", uid);  
  11.     return 800;  
  12. }  
        这段代码,我们先调用原始的getuid函数,并打印出它的值。最后才返回一个我们定义的值——800。

        在main函数中,我们只调用getuid。并使用 gcc src/*.c -ldl -o main 编译

  1. #include <stdio.h>  
  2. #include <unistd.h>  
  3. #include <sys/types.h>  
  4. #include "hook_def.h"  
  5.   
  6. int main() {  
  7.     printf("get_uid:%d\n", getuid());  
  8.     return 0;  
  9. }  
        其返回结果如下

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多