婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 從Linux源碼看Socket(TCP)Client端的Connect的示例詳解

從Linux源碼看Socket(TCP)Client端的Connect的示例詳解

熱門標簽:工廠位置地圖標注 企業400電話辦理哪正規 地圖標注企業名稱侵權案件 地圖標注需要現場嗎 400電話辦理哪家好廠商 繽客網注冊時地圖標注出不來 網站上插入地圖標注內容 重慶營銷外呼系統排名 鶴壁電銷外呼系統怎么安裝

前言

筆者一直覺得如果能知道從應用到框架再到操作系統的每一處代碼,是一件Exciting的事情。
今天筆者就來從Linux源碼的角度看下Client端的Socket在進行Connect的時候到底做了哪些事情。由于篇幅原因,關于Server端的Accept源碼講解留給下次給大家介紹。
(基于Linux 3.10內核)

一個最簡單的Connect例子

int clientSocket;
if((clientSocket = socket(AF_INET, SOCK_STREAM, 0)) < 0) {
	// 創建socket失敗失敗
 	return -1;
}
......
if(connect(clientSocket, (struct sockaddr *)&serverAddr, sizeof(serverAddr)) < 0) {
	// connect 失敗
	return -1;
}
.......

首先我們通過socket系統調用創建了一個socket,其中指定了SOCK_STREAM,而且最后一個參數為0,也就是建立了一個通常所有的TCP Socket。在這里,我們直接給出TCP Socket所對應的ops也就是操作函數。

如果你想知道上圖中的結構是怎么來的,可以看下筆者以前的文章:

https://www.jb51.net/article/106563.htm

值得注意的是,由于socket系統調用操作做了如下兩個代碼的判斷

sock_map_fd
	|->get_unused_fd_flags
			|->alloc_fd
				|->expand_files (ulimit)
	|->sock_alloc_file	
		|->alloc_file
			|->get_empty_filp (/proc/sys/fs/max_files)

第一個判斷,ulmit超限:

int expand_files(struct files_struct *files, int nr
{
	......
	if (nr >= current->signal->rlim[RLIMIT_NOFILE].rlim_cur)
		return -EMFILE;
	......
}

這邊的判斷即是ulimit的限制!在這里返回-EMFILE對應的描述就是
"Too many open files"

第二個判斷max_files超限

struct file *get_empty_filp(void)
{
 ......
	/*
	 * 由此可見,特權用戶可以無視文件數最大大小的限制!
	 */
	if (get_nr_files() >= files_stat.max_files && !capable(CAP_SYS_ADMIN)) {
		/*
		 * percpu_counters are inaccurate. Do an expensive check before
		 * we go and fail.
		 */
		if (percpu_counter_sum_positive(&nr_files) >= files_stat.max_files)
			goto over;
	}
	
 ......
}

所以在文件描述符超過所有進程能打開的最大文件數量限制(/proc/sys/fs/file-max)的時候會返回-ENFILE,對應的描述就是"Too many open files in system",但是特權用戶確可以無視這一限制,如下圖所示:

connect系統調用

我們再來看一下connect系統調用:

int connect(int sockfd,const struct sockaddr *serv_addr,socklen_t addrlen)

這個系統調用有三個參數,那么依據規則,它肯定在內核中的源碼長下面這個樣子

SYSCALL_DEFINE3(connect, ......

筆者全文搜索了下,就找到了具體的實現:

socket.c
SYSCALL_DEFINE3(connect, int, fd, struct sockaddr __user *, uservaddr,
		int, addrlen)
{
 ......
	err = sock->ops->connect(sock, (struct sockaddr *)&address, addrlen,
				 sock->file->f_flags);
	......
}

前面圖給出了在TCP下的sock->ops == inet_stream_ops,然后再陷入到更進一步的調用棧中,即下面的:

SYSCALL_DEFINE3(connect
	|->inet_stream_ops
		|->inet_stream_connect
			|->tcp_v4_connect
				|->tcp_set_state(sk, TCP_SYN_SENT);設置狀態為TCP_SYN_SENT
			 	|->inet_hash_connect
				|->tcp_connect

首先,我們來看一下inet_hash_connect這個函數,里面有一個端口號的搜索過程,搜索不到可用端口號就會導致創建連接失敗!內核能夠建立一個連接也是跋涉了千山萬水的!我們先看一下搜索端口號的邏輯,如下圖所示:

獲取端口號范圍

首先,我們從內核中獲取connect能夠使用的端口號范圍,在這里采用了Linux中的順序鎖(seqlock)

void inet_get_local_port_range(int *low, int *high)
{
	unsigned int seq;

	do {
		// 順序鎖
		seq = read_seqbegin(&sysctl_local_ports.lock);

		*low = sysctl_local_ports.range[0];
		*high = sysctl_local_ports.range[1];
	} while (read_seqretry(&sysctl_local_ports.lock, seq));
}

順序鎖事實上就是結合內存屏障等機制的一種樂觀鎖,主要依靠一個序列計數器。在讀取數據之前和之后,序列號都被讀取,如果兩者的序列號相同,說明在讀操作的時候沒有被寫操作打斷過。
這也保證了上面的讀取變量都是一致的,也即low和high不會出現low是改前值而high是改后值得情況。low和high要么都是改之前的,要么都是改之后的!內核中修改的地方為:

cat /proc/sys/net/ipv4/ip_local_port_range 
32768 61000 

通過hash決定端口號起始搜索范圍

在Linux上進行connect,內核給其分配的端口號并不是線性增長的,但是也符合一定的規律。
先來看下代碼:

int __inet_hash_connect(...)
{
		// 注意,這邊是static變量
		static u32 hint;
		// 這邊的port_offset是用對端ip:port hash的一個值
		// 也就是說對端ip:port固定,port_offset固定
		u32 offset = hint + port_offset;
		for (i = 1; i <= remaining; i++) {
			port = low + (i + offset) % remaining;
			/* port是否占用check */
			....
			goto ok;
		}
		.......
ok:
		hint += i;
		......
}

這里面有幾個小細節,為了安全原因,Linux本身用對端ip:port做了一次hash作為搜索的初始offset,所以不同遠端ip:port初始搜索范圍可以基本是不同的!但同樣的對端ip:port初始搜索范圍是相同的!

在筆者機器上,一個完全干凈的內核里面,不停的對同一個遠端ip:port,其以2進行穩定增長,也即38742->38744->38746,如果有其它的干擾,就會打破這個規律。

端口號范圍限制

由于我們指定了端口號返回ip_local_port_range是不是就意味著我們最多創建high-low+1個連接呢?當然不是,由于檢查端口號是否重復是將(網絡命名空間,對端ip,對端port,本端port,Socket綁定的dev)當做唯一鍵進行重復校驗,所以限制僅僅是在同一個網絡命名空間下,連接同一個對端ip:port的最大可用端口號數為high-low+1,當然可能還要減去ip_local_reserved_ports。如下圖所示:

檢查端口號是否被占用

端口號的占用搜索分為兩個階段,一個是處于TIME_WAIT狀態的端口號搜索,另一個是其它狀態端口號搜索。

TIME_WAIT狀態端口號搜索

眾所周知,TIME_WAIT階段是TCP主動close必經的一個階段。如果Client采用短連接的方式和Server端進行交互,就會產生大量的TIME_WAIT狀態的Socket。而這些Socket由占用端口號,所以當TIME_WAIT過多,打爆上面的端口號范圍之后,新的connect就會返回錯誤碼:

C語言connect返回錯誤碼為
-EADDRNOTAVAIL,對應描述為Cannot assign requested address 
對應Java的異常為
java.net.NoRouteToHostException: Cannot assign requested address (Address not available)

ip_local_reserved_ports。如下圖所示:

由于TIME_WAIT大概一分鐘左右才能消失,如果在一分鐘內Client端和Server建立大量的短連接請求就容易導致端口號耗盡。而這個一分鐘(TIME_WAIT的最大存活時間)是在內核(3.10)編譯階段就確定了的,無法通過內核參數調整。 如下代碼所示:

#define TCP_TIMEWAIT_LEN (60*HZ) /* how long to wait to destroy TIME-WAIT
				 * state, about 60 seconds	*/

Linux自然也考慮到了這種情況,所以提供了一個tcp_tw_reuse參數使得在搜索端口號時可以在某些情況下重用TIME_WAIT。代碼如下:

__inet_hash_connect
	|->__inet_check_established
static int __inet_check_established(......)
{
	......	
	/* Check TIME-WAIT sockets first. */
	sk_nulls_for_each(sk2, node, &head->twchain) {
		tw = inet_twsk(sk2);
		// 如果在time_wait中找到一個match的port,就判斷是否可重用
		if (INET_TW_MATCH(sk2, net, hash, acookie,
					saddr, daddr, ports, dif)) {
			if (twsk_unique(sk, sk2, twp))
				goto unique;
			else
				goto not_unique;
		}
	}
	......
}

如上面代碼中寫的那樣,如果在一堆TIME-WAIT狀態的Socket里面能夠有當前要搜索的port,則判斷是否這個port可以重復利用。如果是TCP的話這個twsk_unique的實現函數是:

int tcp_twsk_unique(......)
{
	......
	if (tcptw->tw_ts_recent_stamp &&
	 (twp == NULL || (sysctl_tcp_tw_reuse &&
			 get_seconds() - tcptw->tw_ts_recent_stamp > 1))) {
		tp->write_seq = tcptw->tw_snd_nxt + 65535 + 2
		......
		return 1;
	}
	return 0;	
}

上面這段代碼邏輯如下所示:

在開啟了tcp_timestamp以及tcp_tw_reuse的情況下,在Connect搜索port時只要比之前用這個port的TIME_WAIT狀態的Socket記錄的最近時間戳>1s,就可以重用此port,即將之前的1分鐘縮短到1s。同時為了防止潛在的序列號沖突,直接將write_seq加上在65537,這樣,在單Socket傳輸速率小于80Mbit/s的情況下,不會造成序列號沖突。
同時這個tw_ts_recent_stamp設置的時機如下圖所示:

所以如果Socket進入TIME_WAIT狀態后,如果一直有對應的包發過來,那么會影響此TIME_WAIT對應的port是否可用的時間。我們可以通過下面命令開始tcp_tw_reuse:

echo '1' > /proc/sys/net/ipv4/tcp_tw_reuse

ESTABLISHED狀態端口號搜索

ESTABLISHED的端口號搜索就簡單了許多

/* And established part... */
	sk_nulls_for_each(sk2, node, &head->chain) {
		if (INET_MATCH(sk2, net, hash, acookie,
					saddr, daddr, ports, dif))
			goto not_unique;
	}

以(網絡命名空間,對端ip,對端port,本端port,Socket綁定的dev)當做唯一鍵進行匹配,如果匹配成功,表明此端口無法重用。

端口號迭代搜索

Linux內核在[low,high]范圍按照上述邏輯進行port的搜索,如果沒有搜索到port,即port耗盡,就會返回-EADDRNOTAVAIL,也即Cannot assign requested address。但還有一個細節,如果是重用TIME_WAIT狀態的Socket的端口的話,就會將對應的TIME_WAIT狀態的Socket給銷毀。

__inet_hash_connect(......)
{
		......
		if (tw) {
			inet_twsk_deschedule(tw, death_row);
			inet_twsk_put(tw);
		}
		......
}

尋找路由表

在我們找到一個可用端口號port后,就會進入搜尋路由階段:

ip_route_newports
	|->ip_route_output_flow
			|->__ip_route_output_key
				|->ip_route_output_slow
					|->fib_lookup

這也是一個非常復雜的過程,限于篇幅,就不做詳細闡述了。如果搜索不到路由信息的話,會返回。

-ENETUNREACH,對應描述為Network is unreachable

Client端的三次握手

在前面一大堆前置條件就緒后,才進入到真正的三次握手階段。

tcp_connect
 |->tcp_connect_init 初始化tcp socket
 |->tcp_transmit_skb 發送SYN包
 |->inet_csk_reset_xmit_timer 設置SYN重傳定時器

tcp_connect_init初始化了一大堆TCP相關的設置,例如mss_cache/rcv_mss等一大堆。而且如果開啟了TCP窗口擴大選項的話,其窗口擴大因子也在此函數里進行計算:

tcp_connect_init
	|->tcp_select_initial_window
int tcp_select_initial_window(...)
{
	......
	(*rcv_wscale) = 0;
	if (wscale_ok) {
		/* Set window scaling on max possible window
		 * See RFC1323 for an explanation of the limit to 14
		 */
		space = max_t(u32, sysctl_tcp_rmem[2], sysctl_rmem_max);
		space = min_t(u32, space, *window_clamp);
		while (space > 65535 && (*rcv_wscale) < 14) {
			space >>= 1;
			(*rcv_wscale)++;
		}
	}
	......
}	

如上面代碼所示,窗口擴大因子取決于Socket最大可允許的讀緩沖大小和window_clamp(最大允許滑動窗口大小,動態調整)。搞完了一票初始信息設置后,才開始真正的三次握手。
在tcp_transmit_skb中才真正發送SYN包,同時在緊接著的inet_csk_reset_xmit_timer里設置了SYN超時定時器。如果對端一直不發送SYN_ACK,將會返回-ETIMEDOUT。

重傳的超時時間和

/proc/sys/net/ipv4/tcp_syn_retries

息息相關,Linux默認設置為5,建議設置成3,下面是不同設置的超時時間參照圖。

在設置了SYN超時重傳定時器后,tcp_connnect就返回,并一路返回到最初始的inet_stream_connect。在這里我們就等待對端返回SYN_ACK或者SYN定時器超時。

int __inet_stream_connect(struct socket *sock,...,)
{
	// 如果設置了O_NONBLOCK則timeo為0
	timeo = sock_sndtimeo(sk, flags & O_NONBLOCK);
	......
	// 如果timeo=0即O_NONBLOCK會立刻返回
	// 否則等待timeo時間
	if (!timeo || !inet_wait_for_connect(sk, timeo, writebias))
		goto out;
}

Linux本身提供一個SO_SNDTIMEO來控制對connect的超時,不過Java并沒有采用這個選項。而是采用別的方式進行connect的超時控制。僅僅就C語言的connect系統調用而言,不設置SO_SNDTIMEO,就會將對應用戶進程進行睡眠,直到SYN_ACK到達或者超時定時器超時才將次用戶進程喚醒。

如果是NON_BLOCK的話,則是通過select/epoll等多路復用機制去捕獲超時或者連接成功事件。

對端SYN_ACK到達

在Server端SYN_ACK到達之后會按照下面的代碼路徑傳遞,并喚醒用戶態進程:

tcp_v4_rcv
	|->tcp_v4_do_rcv
		|->tcp_rcv_state_process
			|->tcp_rcv_synsent_state_process
				|->tcp_finish_connect
					|->tcp_init_metrics 初始化度量統計
					|->tcp_init_congestion_control 初始化擁塞控制
					|->tcp_init_buffer_space 初始化buffer空間
					|->inet_csk_reset_keepalive_timer 開啟包活定時器
					|->sk_state_change(sock_def_wakeup) 喚醒用戶態進程
				|->tcp_send_ack 發送三次握手的最后一次握手給Server端
			|->tcp_set_state(sk, TCP_ESTABLISHED) 設置為ESTABLISHED狀態

總結

Client(TCP)端進行Connect的過程真是跋山涉水,從一開始文件描述符的限制到端口號的搜索再到路由表的搜索再到最后的三次握手,任何一個環節有問題就會導致創建連接失敗,筆者詳細的描述了這些機制的源碼實現。希望本篇文章可以對讀者在以后遇到Connect失敗問題時候有所幫助。

到此這篇關于從Linux源碼看Socket(TCP)Client端的Connect的文章就介紹到這了,更多相關Linux源碼看Socket內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

標簽:日照 東莞 克拉瑪依 棗莊 鹽城 96 渭南 常州

巨人網絡通訊聲明:本文標題《從Linux源碼看Socket(TCP)Client端的Connect的示例詳解》,本文關鍵詞  從,Linux,源碼,看,Socket,TCP,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《從Linux源碼看Socket(TCP)Client端的Connect的示例詳解》相關的同類信息!
  • 本頁收集關于從Linux源碼看Socket(TCP)Client端的Connect的示例詳解的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美理论在线播放| 久久国产综合精品| 91麻豆自制传媒国产之光| 国产精品电影院| 99精品久久只有精品| 亚洲日本成人在线观看| 欧美唯美清纯偷拍| 免费看黄色91| 久久久777精品电影网影网 | 亚洲天堂久久久久久久| 99re这里只有精品视频首页| 亚洲美女免费视频| 欧美美女黄视频| 精东粉嫩av免费一区二区三区| 久久综合丝袜日本网| www.成人网.com| 亚洲电影第三页| 26uuu亚洲| 成人app下载| 亚洲一区av在线| 日韩美女视频一区二区在线观看| 国产成人精品免费网站| 一区二区三区免费看视频| 日韩欧美成人一区| 99久久婷婷国产综合精品电影 | 国产拍揄自揄精品视频麻豆| 99久久精品99国产精品| 一区二区三区资源| 精品日韩一区二区三区 | 成人免费视频视频在线观看免费| 自拍视频在线观看一区二区| 91精品一区二区三区在线观看| 欧美日韩大陆一区二区| 久久99热国产| 亚洲欧美日韩在线| 日韩欧美123| 色老汉av一区二区三区| 精品在线免费视频| 亚洲一区二区三区视频在线| 精品国产99国产精品| 91女厕偷拍女厕偷拍高清| 极品少妇一区二区| 亚洲主播在线播放| 亚洲国产精品t66y| 欧美一区二区三区四区高清| 色综合久久天天综合网| 国产资源在线一区| 午夜视频一区在线观看| 亚洲欧美一区二区在线观看| 精品三级在线观看| 91精品在线一区二区| 在线观看日韩毛片| 99re热视频这里只精品| 国产成人av电影免费在线观看| 亚洲国产wwwccc36天堂| 亚洲欧美日韩综合aⅴ视频| 久久综合国产精品| 日韩小视频在线观看专区| 在线精品视频免费观看| 91首页免费视频| 国产成人99久久亚洲综合精品| 毛片av中文字幕一区二区| 亚洲成av人**亚洲成av**| 亚洲欧美另类久久久精品2019| 国产三区在线成人av| 精品盗摄一区二区三区| 欧美一区二区三区视频免费| 欧美日韩另类国产亚洲欧美一级| 色婷婷综合久久久| 色8久久精品久久久久久蜜| 成人动漫一区二区三区| 国产盗摄视频一区二区三区| 国产美女久久久久| 国产福利不卡视频| 国产成人在线网站| 国产精品一区二区三区四区| 国产精品1区2区| 国产精品亚洲一区二区三区在线| 极品少妇一区二区| 国产福利电影一区二区三区| 成人综合在线观看| 97se狠狠狠综合亚洲狠狠| 91尤物视频在线观看| 色香蕉成人二区免费| 在线观看一区二区视频| 欧美日本韩国一区二区三区视频| 欧美在线啊v一区| 欧美美女黄视频| 91精品国产高清一区二区三区蜜臀| 日韩亚洲欧美成人一区| 精品久久国产字幕高潮| 国产亚洲成年网址在线观看| 国产精品色婷婷| 怡红院av一区二区三区| 亚洲成人在线免费| 久久99国产精品麻豆| 经典一区二区三区| 成人不卡免费av| 欧美中文字幕一二三区视频| 欧美电影免费观看高清完整版在| 精品女同一区二区| 中文字幕av免费专区久久| 夜夜爽夜夜爽精品视频| 欧美中文字幕一区| 日韩免费成人网| 国产精品视频第一区| 亚洲.国产.中文慕字在线| 国产一区二区三区综合| 91影院在线观看| 日韩免费高清视频| 亚洲人成在线播放网站岛国| 日韩 欧美一区二区三区| 国产精品亚洲а∨天堂免在线| 97久久久精品综合88久久| 91精品国产福利| 欧美高清在线一区二区| 亚洲www啪成人一区二区麻豆| 国产精品乡下勾搭老头1| 欧美专区日韩专区| 中文一区二区完整视频在线观看| 亚洲午夜激情网站| 国产激情偷乱视频一区二区三区| 欧美日韩精品一区二区| 欧美国产禁国产网站cc| 日本欧美久久久久免费播放网| 成人午夜电影久久影院| 7777精品伊人久久久大香线蕉的| 国产精品青草综合久久久久99| 日韩极品在线观看| 91丝袜呻吟高潮美腿白嫩在线观看| 日韩午夜在线观看视频| 亚洲伦在线观看| 精品一区二区三区不卡| 欧美日韩亚州综合| 亚洲欧美怡红院| 丁香婷婷深情五月亚洲| 欧美大黄免费观看| 午夜a成v人精品| 在线观看成人小视频| 国产精品拍天天在线| 国产另类ts人妖一区二区| 538在线一区二区精品国产| 亚洲综合免费观看高清完整版| 国产成人亚洲精品狼色在线| 欧美日本高清视频在线观看| 亚洲一区二区三区影院| 不卡一区二区中文字幕| 国产日产精品一区| 国产一区二区久久| 日韩欧美在线网站| 日韩二区在线观看| 欧美日韩午夜在线视频| 亚洲老司机在线| bt7086福利一区国产| 久久精品亚洲乱码伦伦中文| 久久综合综合久久综合| 91精品福利在线一区二区三区| 亚洲国产精品一区二区尤物区| 色婷婷国产精品综合在线观看| 日韩一区在线看| 波多野结衣中文字幕一区| 国产精品亲子伦对白| eeuss鲁片一区二区三区在线观看 eeuss鲁片一区二区三区在线看 | 97精品久久久午夜一区二区三区| 国产亚洲一本大道中文在线| 国产一区二区三区黄视频| 久久久综合九色合综国产精品| 久久精品国产在热久久| 精品乱人伦小说| 国产乱人伦偷精品视频免下载| 国产亚洲精品超碰| 成a人片国产精品| 亚洲欧洲制服丝袜| 在线观看国产一区二区| 亚洲国产精品久久不卡毛片 | 99久久精品免费看| 一区二区三区四区五区视频在线观看| 色欧美日韩亚洲| 亚洲成人激情综合网| 日韩欧美一区在线| 国产丶欧美丶日本不卡视频| 国产精品久久777777| 欧美主播一区二区三区美女| 日韩成人免费看| 国产三级一区二区| 色素色在线综合| 日韩中文字幕一区二区三区| 2023国产精品自拍| 99精品热视频| 免费在线观看日韩欧美| 国产日韩精品一区二区浪潮av | 激情另类小说区图片区视频区| 日韩三级视频中文字幕| 国产精品一二三区在线| 亚洲精品成a人| 欧美一区二区三区免费在线看| 国产91精品一区二区麻豆网站| 亚洲少妇30p| 精品国产一二三区| 99久久精品免费看国产免费软件|