淘先锋技术网

首页 1 2 3 4 5 6 7

  相信熟悉系统调用的都知道,系统调用在内核中的入口都是sys_xxx,我也不例外,记得有一次,我抱着学习一下socket内核实现的心态想在内核中寻找sys_socket系统调用,却发现只能找到宏定义,怎么也找不到函数实现。后来经过查阅才知道,原来Linux的系统调用都改为SYSCALL_DEFINE定义的了。相信大家都很疑惑,原来的sys_xxx不是挺好的吗?为什么要定义成SYSCALL_DEFINE呢?我也很疑惑,所以我看了一下SYSCALL_DEFINE的定义,如下:

#define SYSCALL_DEFINE0(name)	   asmlinkage long sys_##name(void)
#define SYSCALL_DEFINE1(name, ...) SYSCALL_DEFINEx(1, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE2(name, ...) SYSCALL_DEFINEx(2, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE3(name, ...) SYSCALL_DEFINEx(3, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE4(name, ...) SYSCALL_DEFINEx(4, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE5(name, ...) SYSCALL_DEFINEx(5, _##name, __VA_ARGS__)
#define SYSCALL_DEFINE6(name, ...) SYSCALL_DEFINEx(6, _##name, __VA_ARGS__)

 

#define SYSCALL_DEFINEx(x, name, ...)					\
	asmlinkage long sys##name(__SC_DECL##x(__VA_ARGS__));		\
	static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__));	\
	asmlinkage long SyS##name(__SC_LONG##x(__VA_ARGS__))		\
	{								\
		__SC_TEST##x(__VA_ARGS__);				\
		return (long) SYSC##name(__SC_CAST##x(__VA_ARGS__));	\
	}								\
	SYSCALL_ALIAS(sys##name, SyS##name);				\
	static inline long SYSC##name(__SC_DECL##x(__VA_ARGS__))



相信大家猛一下看到这么一大堆东西,有点蒙,不着急,一点一点来看。我们就拿socket来举例,SYSCALL_DEFINEx里面的x代表的是系统调用参数个数。sys_socket的宏定义为:

asmlinkage long sys_socket(int, int, int);那么可以看出来对应的应该是SYSCALL_DEFINE3。到socket.c里面找到socket的定义如下:

SYSCALL_DEFINE3(socket, int, family, int, type, int, protocol)

 

我们把它打开看一下:

首先##是连接符,__VA_ARGS__代表前面...里面的可变参数,也就是说展开后结果为

SYSCALL_DEFINEx(3, _socket,  int, family, int, type, int, protocol)

 

那么再将上面的展开,结果如下:

	asmlinkage long sys_socket(__SC_DECL3(int, family, int, type, int, protocol));		\
	static inline long SYSC_socket(__SC_DECL3(int, family, int, type, int, protocol));	\
	asmlinkage long SyS_socket(__SC_LONG3(int, family, int, type, int, protocol))		\
	{								\
		__SC_TEST3(int, family, int, type, int, protocol);				\
		return (long) SYSC_socket(__SC_CAST3(int, family, int, type, int, protocol));	\
	}								\
	SYSCALL_ALIAS(sys_socket, SyS_socket);				\
	static inline long SYSC_sockt(__SC_DECL3(int, family, int, type, int, protocol))


这回大家看到了第一行熟悉的sys_socket了。哎,不对,这好像只是一个函数声明,不是定义吧,那么定义跑到哪里去了?向下接着看,定义其实在最后一行,结尾没有加分号,下面再加上一对大括号,可不就是定义。那么上面的一大堆是干什么用的呢?

先看SYSCALL_ALIAS,根据名字就可以知道,这个宏定义的意思其实就是将SyS_socket的别名设为sys_socket,也就是说调用sys_socket其实就是在调用SyS_sockt。

定义如下:

#define SYSCALL_ALIAS(alias, name)					\
	asm ("\t.globl " #alias "\n\t.set " #alias ", " #name "\n"	\
	     "\t.globl ." #alias "\n\t.set ." #alias ", ." #name)

那么SyS_socket里面就调用到了SYSC_socket了,就调用到了函数定义里去了。这样子兜了一大圈,通过别名再调用到函数定义,如此麻烦到底是为了什么?难道是大神们在秀技术?显得高大上吗?NO,关键在那几个我们一直没有介绍到的宏,__SC_DECL3,__SC_LONG3,__SC_CAST3。

大家看一下定义:

#define __SC_DECL1(t1, a1)	t1 a1
#define __SC_DECL2(t2, a2, ...) t2 a2, __SC_DECL1(__VA_ARGS__)
#define __SC_DECL3(t3, a3, ...) t3 a3, __SC_DECL2(__VA_ARGS__)
#define __SC_DECL4(t4, a4, ...) t4 a4, __SC_DECL3(__VA_ARGS__)
#define __SC_DECL5(t5, a5, ...) t5 a5, __SC_DECL4(__VA_ARGS__)
#define __SC_DECL6(t6, a6, ...) t6 a6, __SC_DECL5(__VA_ARGS__)

#define __SC_LONG1(t1, a1) 	long a1
#define __SC_LONG2(t2, a2, ...) long a2, __SC_LONG1(__VA_ARGS__)
#define __SC_LONG3(t3, a3, ...) long a3, __SC_LONG2(__VA_ARGS__)
#define __SC_LONG4(t4, a4, ...) long a4, __SC_LONG3(__VA_ARGS__)
#define __SC_LONG5(t5, a5, ...) long a5, __SC_LONG4(__VA_ARGS__)
#define __SC_LONG6(t6, a6, ...) long a6, __SC_LONG5(__VA_ARGS__)

#define __SC_CAST1(t1, a1)	(t1) a1
#define __SC_CAST2(t2, a2, ...) (t2) a2, __SC_CAST1(__VA_ARGS__)
#define __SC_CAST3(t3, a3, ...) (t3) a3, __SC_CAST2(__VA_ARGS__)
#define __SC_CAST4(t4, a4, ...) (t4) a4, __SC_CAST3(__VA_ARGS__)
#define __SC_CAST5(t5, a5, ...) (t5) a5, __SC_CAST4(__VA_ARGS__)
#define __SC_CAST6(t6, a6, ...) (t6) a6, __SC_CAST5(__VA_ARGS__)
#define __SC_TEST(type)		BUILD_BUG_ON(sizeof(type) > sizeof(long))
#define __SC_TEST1(t1, a1)	__SC_TEST(t1)
#define __SC_TEST2(t2, a2, ...)	__SC_TEST(t2); __SC_TEST1(__VA_ARGS__)
#define __SC_TEST3(t3, a3, ...)	__SC_TEST(t3); __SC_TEST2(__VA_ARGS__)
#define __SC_TEST4(t4, a4, ...)	__SC_TEST(t4); __SC_TEST3(__VA_ARGS__)
#define __SC_TEST5(t5, a5, ...)	__SC_TEST(t5); __SC_TEST4(__VA_ARGS__)
#define __SC_TEST6(t6, a6, ...)	__SC_TEST(t6); __SC_TEST5(__VA_ARGS__)
#define BUILD_BUG_ON(condition) ((void)sizeof(char[1 - 2*!!(condition)]))


 

展开过程如下:

	__SC_DECL3(int, family, int, type, int, protocol) -> int family, __SC_DECL2(int, type, int, protocol) -> int family, int type, __SC_DECL1(int, protocol) -> int family, int type, int protocol 

 

	__SC_LONG3(int, family, int, type, int, protocol) -> long family, __SC_LONG2(int, type, int, protocol) -> long family, long type , __SC_LONG1(int, protocol) -> long family, long type, long protocol

 

	__SC_CAST3(int, family, int, type, int, protocol) -> (int) family, __SC_CAST2(int, type, int, protocol) -> (int) family, (int) type, __SC_CAST1(int, protocol) -> (int) family, (int) type, (int) protocol 

 

	__SC_TEST3(int, family, int, type, int, protocol) ->  __SC_TEST(int); __SC_TEST2(int, type, int, protocol) -> __SC_TEST(int); __SC_TEST(int); __SC_TEST1(int, protocol) -> __SC_TEST(int); __SC_TEST(int); __SC_TEST(int); -> BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long));

 

那么上面的SYSCALL_DEFINEx就变为了下面这段比较清晰的代码了:

 
  1. asmlinkage long sys_socket(int family, int type, int protocol); \

  2. static inline long SYSC_socket(int family, int type, int protocol ); \

  3. asmlinkage long SyS_socket(long family, long type, long protocol) \

  4. { \

  5. BUILD_BUG_ON(sizeof(int) > sizeof(long)); BUILD_BUG_ON(sizeof(int) > sizeof(long)); \

  6. return (long) SYSC_socket((int) family, (int) type, (int) protocol); \

  7. } \

  8. SYSCALL_ALIAS(sys_socket, SyS_socket); \

  9. static inline long SYSC_sockt(int family, int type, int protocol)


大家这下总算看明白了吧,其实里面做的工作,就是将系统调用的参数统一变为了使用long型来接收,再强转转为int,也就是系统调用本来传下来的参数类型。那么这么强转一下究竟是为什么呢?原因就是64位的Linux有一个名为CVE-2009-2009的漏洞,这个漏洞的具体内容,请大家看我的另外一篇博客:

http://blog.csdn.net/hxmhyp/article/details/22619729,有详细说明。