孙靖 2009.5.5
Email : jing_sun999@126.com QQ : 272964426
前段时间实现了一个小型的 C/S 架构的多人在线即时通信工具, JIGQQ 。其中对使用 TCP 通信有点心得。 记得在我大学时代,就用 VB 做过 TCP 的通信。当然那时候是很初级的,发送的数据量也很小的应用。当时就觉得,有时候发送的数据接收端不能接收到,有时候呢觉得一次性没有接受完毕。
前段时间实现了一个小型的 C/S 架构的多人在线即时通信工具, JIGQQ 。其中对使用 TCP 通信有点心得。
记得在我大学时代,就用 VB 做过 TCP 的通信。当然那时候是很初级的,发送的数据量也很小的应用。当时就觉得,有时候发送的数据接收端不能接收到,有时候呢觉得一次性没有接受完毕,总会丢失一些内容。这和我从书本学到的 TCP/IP 可靠通信协议的知识完全不匹配,这让我疑惑了很久。直到后来接触的东西越来越多,眼界也逐渐开拓才慢慢意识到问题出在哪。
应用平台: WindowsXP
开发工具: C++Builder6.0
问题描述
我在使用
Socket
接收消息时,将会触发一个接收函数。(
BCB
中的是
ClientRead
函数)所以我在此函数处接收信息,并做相应处理。那问题来了:由于传输的数据包都是我自定义的,我明确的知道长度为多多少。可实际效果却是,有时候接不够我期待的长度,而甚至有时候一次接收的数据包长度竟然比我预期的要长
10
个字节。当时只有设定条件将不满足我预期长度的数据包丢弃。
问题分析
看了上面描述,想必大家也明白我的错误在哪了吧?实际是我对 Socket 的接收机制理解有误。 TCP/IP 只保证发送包按顺序到达目的地,但可能由于网络状况他会自动分包发送,这样就导致接收端的接受函数每次提交时只有若干数据,不一定是我预期的一个完整的包。可以这样理解,发过来的实际是一个 ‘ 流 ’ 。
看来要很好的解决这个问题,那就只有先将接收的数据保存起来,再来做处理。
处理模型
为了要保存接收数据,我们首先就要建立一个缓冲区。那第一个问题来了:由于我们要接收的信息是不可预知的,那难道这个缓冲区要无限的扩容?
可我们的实际 PC 内存肯定是有限的,所以我们必须建立一套内存缓冲区可以被反复利用的机制 —— 环形队列。
我们用图来说明环形队列的工作原理:
图 1 蓝色为写入的数据,绿色为已经读取处理的数据
看上图 1 ,在正常状态下: Write 指针在写入数据,而 Read 指针在 Write 指针之前,说明缓冲区后端还有空余空间。
在指针回滚状态下: Write 指针在 Read 指针之前,说明缓冲区的前端已经有空闲的空间。
除了这两种状态外,我们不得不再考虑一种即将错误状态:
图 2 蓝色为写入的数据,棕红色为未处理的数据
看图 2 ,无足够空间:当 Write 指针回滚,发现无足够空间,将和 Read 指针发生交集(虚点部分)这显然是不合理的。一部分未处理数据将被覆盖破环。所以我们必须重新调整整个缓冲区。
重新分配调整:当遇到空间不足,不能实现 Write 指针回滚的情况,我们只有重新开辟一个更大一点的缓冲区,并把未处理数据(棕红色)和写入数据(蓝色)按顺序复制到新的缓冲区内,并调整好 Read 和 Write 指针的位置。最后释放掉原来的缓冲区。
我们可以看到,经过这样一个过程,我们的缓冲区,将在 Read 指针处理速度较慢并在处理信息量增大时,逐渐扩容。但是,当扩容到一定程度,将达到一个平衡。因为信息量不可能无限增大,当需处理信息量达到最大值再结合 Read 指针的不断处理,缓冲区的大小也将稳定下来。
我们一开头就给此缓冲区命名为 ‘ 环形队列 ’ 。从以上的图和文字,我们可以形象的理解:由于缓冲区大小最终将稳定, Write 和 Read 指针将无障碍的在缓冲区中不断循环回滚,其运行轨迹,将是一个环形。
其他知识
为了要实现上述模型,我们必须要具备一些知识。
( Write 和 Read 是相对缓冲区而言的!)
首先, Wirte 指针部分 ,应该在 Socket 接收函数中去实现。他什么都不干,只管将接收到的数据往环形队列中存放就行了。
再一个,就是我们的 Read 指针部分 。他需要尽可能快的在环形队列中读取已经储存好的数据,并解析数据后进行相关的操作。最重要一点是,这个过程必须是独立的,在主线程之外运行。
所以,我们的 Write 指针部分应该是在主线程,而 Read 指针部分就必须建立一个额外的线程来进行工作。
下面我们就看看 C++ Builder 6.0 下如何实现多线程和需注意的相关事宜。
1. 深浅相关全局或私有变量
HANDLE DealInfHanld ; // 处理各类信息线程句柄
DWORD DealInfID ; // 处理各类信息线程 ID
CRITICAL_SECTION m_csLock ; // 用于临界变量互锁
2. 编写好一个线程处理函数实体
// 处理环形队列中各类信息
DWORD __stdcall DealInf( LPVOID )
{
// ……
}
3. 利用 CreateThread 函数创建线程
在窗体开被创建时就创建好线程处理函数:
void __fastcall TForm_Main ::FormCreate( TObject * Sender )
{
// ……
:: InitializeCriticalSection (& m_csLock );
// 开辟各类信息处理线程
DealInfHanld = CreateThread ( NULL , 0, DealInf, NULL , 0, & DealInfID );
}
进过上面 3 个步骤,函数 DealInf(LPVOID) 将被创建为一个线程函数,他将独立在主线程之外独立运行。
我们还需要注意一个很重要的问题:由于线程函数中操作的有关内存,很可能也是主线程中要操作的。比如我们的环形队列就是这样。其中 Read 指针在线程中读取数据进行处理,而 Write 指针却在主线程中储存数据。所以此两指针应该要是‘不可见’的,即他们不应该同时去操作同一数据区,总不可能要 CPU 同时对同一个内存地址又读又写吧?所以我们必须利用 互锁机制 ,让 Write 和 Read 操作互斥。
这点很好实现,比如 DealInf(LPVOID) 函数,我们只需在函数主体的开始和结束处加锁定和解锁代码即可:
// 处理环形队列中各类信息
DWORD __stdcall DealInf( LPVOID )
{
:: EnterCriticalSection (& m_csLock ); // 锁定
// ……
:: LeaveCriticalSection (& m_csLock ); // 解锁
}
当然我们应该在主线程 Sockte 接收函数处也这样锁定和解锁。
说明:
下文代码中, DealInfMem 为缓冲区, MemcpySize 为缓冲区大小, ReadIndex 为读游标, WriteIndex 为写游标。 SocketUS 为数据包开头的 TCustomWinSocket 信息, BufferSize 为数据包长度。
具体 Write 部分实现
首先我们还需要来讨论下,如何实现自定义数据包能在我们实际编码的时带来便利,并最好做到自定义数据包能无限扩展。
我个人认为,在自定义数据包时,必须将此数据包的实际长度信息包含进去,这样可以有利于信息在接收时能有判断的依据。
举例说明:
// 加为好友命令
typedef struct QQMAKEFRIEND
{
UINT32 BufferLeng ; // 本数据包长度
UINT8 Order ; // 命令 ID
UINT32 QQNumMy ; // 自己的 QQ 号码
UINT32 QQNumFD ; // 好友的 QQ 号码
} QQMakeFriend ;
如上面的一个加好友命令,我们应该在数据包的最前端 4 字节用来标记数据包长度。这样我们在信息接收函数时,就可以有效判断我们是否已经将此数据包接收完毕。代码如下:
// 接收各客户端信息
// 获取此次接收到的全部数据
do
{
t ++;
LengBuffer = Socket -> ReceiveLength ();
Socket -> ReceiveBuf ( ReadBuffer + LengOff + sizeof( TCustomWinSocket *), LengBuffer );
LengOff += LengBuffer ; // 累计接收到的数据长度
// 获取此次数据包长度,并把 Soket 连接记录在数据包中去
if ( t == 1)
{
memcpy ( ReadBuffer , & Socket , sizeof( TCustomWinSocket *));
memcpy (& ReLeng , ReadBuffer + sizeof( TCustomWinSocket *), 4);
}
}while ( LengOff != ReLeng ); // 若此数据包接收完毕,跳出
LengBuffer = LengOff + sizeof( TCustomWinSocket *);
经过上面的代码,我们就可以将每次发送来的数据包完整的记录在字节数组 ReadBuffer 中,以便后面使用。
而且这样将数据包长度信息加在数据包中,还便于变长数据包的传输。比如当发送聊天信息的时候,由于我们的信息是不定长的,如果知道数据包长度便于我们完整接收数据包。并且这些信息在 Read 指针读取的时候也发挥巨大作用,后面我们将看到。
接下来,我们就是将接收到的数据合理的储存到环形队列中。
通过图 1 和图 2 我们清楚的知道在将数据包放入环形队列的时候,有 3 种情形:
1. 环形队列后面还有足够空余空间( R 追 W )
2. 环形队列后面没有足够空余空间但前端有,这样实现回滚( W 超 R 不足一圈)
3. 环形队列前后都没有足够的空余空间,这样重新开辟更大的缓冲区。复制好数据调整读写指针,并释放原来缓冲区。( W 超 R 一圈)
我们就根据上面三中 2 情形实现代码如下:
// 向环形队列填塞信息
:: EnterCriticalSection (& m_csLock ); // 锁定
if ( WriteIndex >= ReadIndex ) // Write 指针在 Read 指针之后
{
if (( MemcpySize - WriteIndex ) >= LengBuffer ) // 说明环行队列后面有空闲位置
{
memcpy ( DealInfMem + WriteIndex , ReadBuffer , LengBuffer );
WriteIndex += LengBuffer ;
}
else // 后面没有空闲位置,往前面找
{
if (( MemcpySize - WriteIndex + ReadIndex ) > LengBuffer ) // 如果前面有空闲位置
{
memcpy ( DealInfMem + WriteIndex , ReadBuffer , MemcpySize - WriteIndex );
memcpy ( DealInfMem , ReadBuffer + ( MemcpySize - WriteIndex ), LengBuffer - ( MemcpySize - WriteIndex ));
WriteIndex = LengBuffer - ( MemcpySize - WriteIndex );
}
else // 说明没有空余空间,重新开辟缓冲区
{
while (( DealInfMem2 = ( UINT8 *) malloc ( MemcpySize + MEMSIZE + LengBuffer )) == NULL );
memcpy ( DealInfMem2 , DealInfMem , MemcpySize );
MemcpySize += ( MEMSIZE + LengBuffer );
free ( DealInfMem );
DealInfMem = DealInfMem2 ;
memcpy ( DealInfMem + WriteIndex , ReadBuffer , LengBuffer );
WriteIndex += LengBuffer ;
}
}
}
else // Write 指针在 Read 指针之前
{
if (( ReadIndex - WriteIndex ) > LengBuffer ) // 有空余空间
{
memcpy ( DealInfMem + WriteIndex , ReadBuffer , LengBuffer );
WriteIndex += LengBuffer ;
}
else // 无空余空间,重新开辟缓冲区
{
while (( DealInfMem2 = ( UINT8 *) malloc ( MemcpySize + MEMSIZE + LengBuffer )) == NULL );
memcpy ( DealInfMem2 , DealInfMem + ReadIndex , MemcpySize - ReadIndex );
memcpy ( DealInfMem2 + MemcpySize - ReadIndex , DealInfMem , WriteIndex );
memcpy ( DealInfMem2 + MemcpySize - ReadIndex + WriteIndex , ReadBuffer , LengBuffer );
WriteIndex = MemcpySize - ReadIndex + WriteIndex + LengBuffer ;
MemcpySize += ( MEMSIZE + LengBuffer );
ReadIndex = 0;
free ( DealInfMem );
DealInfMem = DealInfMem2 ;
}
}
:: LeaveCriticalSection (& m_csLock ); // 解锁
这样,我们就实现了 Write 指针储存数据的部分。
具体 Read 部分实现
首先我们要看看 Read 指针在读取数据时,有不有特别指出。
1. 按顺序读取数据;
2. 如果数据有一部分在环形队列尾部,而其余回滚到前端,那我们必须获取这两部分合并成一个数据包再来使用;
3. 如何确定当前数据包应该有多长?我们本来就记录当前数据包长度,我们只要根据此信息在环形队列中读取对应长度的数据就可以。
我们来看看具体代码实现:
while (1)
{
:: EnterCriticalSection (& m_csLock ); // 锁定
TimeSendHand ++;
// 此处为定时挂起此线程,以便主线程响应消息,不然 CPU 占用比将飙升
if ( TimeSendHand >= 100000)
{
TimeSendHand = 0;
Sleep (1);
}
// 若发现读写指针重叠,说明当前没有可处理的数据,放回等待
if ( WriteIndex == ReadIndex )
{
:: LeaveCriticalSection (& m_csLock ); // 解锁
Sleep (1);
continue;
}
if ( WriteIndex > ReadIndex ) // 说明读取指针在写入指针之前( W > R )
{
// 若目前接收的数据不够,返回等待
if (( WriteIndex - ReadIndex ) <= (sizeof( TCustomWinSocket *) + 4))
{
:: LeaveCriticalSection (& m_csLock ); // 解锁
Sleep (1);
continue;
}
// 摘取 Socket 连接记录,用于对应发送
memcpy (& SocketUS , DealInfMem + ReadIndex , sizeof( TCustomWinSocket *));
// 摘取实际数据包长度记录(后续 4 个字节为长度信息)
memcpy (& BufferSize , DealInfMem + ReadIndex +sizeof( TCustomWinSocket *), 4);
// 实际数据包内容不完整,返回等待
if (( WriteIndex - ReadIndex - sizeof( TCustomWinSocket *)) < BufferSize )
{
:: LeaveCriticalSection (& m_csLock );
Sleep (1);
continue;
}
memcpy ( XCBuffer , DealInfMem + ReadIndex + sizeof( TCustomWinSocket *), BufferSize ); // 摘取实际数据包内容(包括长度信息)
ReadIndex = ReadIndex + sizeof( TCustomWinSocket *) + BufferSize ; // 读指针后移
}
else // 说明读取指针在写入指针之后 (W <= R 则反超,若 W == R 则重叠,若 W < R 则 W 反追 R)
{
// 若目前接收的数据不够,返回等待
// MemcpySize - ReadIndex + WriteIndex 为后面未读的加前面未读的
if (( MemcpySize - ReadIndex + WriteIndex ) <= (sizeof( TCustomWinSocket *) + 4))
{
:: LeaveCriticalSection (& m_csLock );
Sleep (1);
continue;
}
// 将 sizeof(TCustomWinSocket *)+4 的信息先放入 XCBuffer ,以便利用
if (( MemcpySize - ReadIndex ) < (sizeof( TCustomWinSocket *) + 4)) // 后不够
{
memcpy ( XCBuffer , DealInfMem + ReadIndex , MemcpySize - ReadIndex ); // 后
memcpy ( XCBuffer + MemcpySize - ReadIndex , DealInfMem , sizeof( TCustomWinSocket *) + 4 - ( MemcpySize - ReadIndex )); // 前
}
else // 后够
{
memcpy ( XCBuffer , DealInfMem + ReadIndex , sizeof( TCustomWinSocket *) + 4);
}
// 摘取 Socket
memcpy (& SocketUS , XCBuffer , sizeof( TCustomWinSocket *));
// 摘取实际数据包长度记录
memcpy (& BufferSize , XCBuffer + sizeof( TCustomWinSocket *), 4);
if (( MemcpySize - ReadIndex + WriteIndex - sizeof( TCustomWinSocket *)) < BufferSize ) // 实际数据包内容不完整,返回等待
{
:: LeaveCriticalSection (& m_csLock );
Sleep (1);
continue;
}
// 摘取实际数据包内容
// 若数据就完整的在一起
if (( MemcpySize - ReadIndex ) <= (sizeof( TCustomWinSocket *)))
{
memcpy ( XCBuffer , DealInfMem + sizeof( TCustomWinSocket *) - ( MemcpySize - ReadIndex ), BufferSize );
ReadIndex = sizeof( TCustomWinSocket *) - ( MemcpySize - ReadIndex ) + BufferSize ;
}
else // 数据一部分在缓冲区后端,其他部分在缓冲区前端
{
memcpy ( XCBuffer , DealInfMem + ReadIndex + sizeof( TCustomWinSocket *),
MemcpySize - ReadIndex - sizeof( TCustomWinSocket *));
memcpy ( XCBuffer + MemcpySize - ReadIndex - sizeof( TCustomWinSocket *), DealInfMem , BufferSize - ( MemcpySize - ReadIndex - sizeof( TCustomWinSocket *)));
ReadIndex = BufferSize - ( MemcpySize - ReadIndex - sizeof( TCustomWinSocket *));
}
}
XCBufferOff = 0;
// ……
// 根据信息获取命令号处理
memcpy (& Order , XCBuffer + 4 + XCBufferOff , 1);
switch ( Order )
{
case QQMSGHEAD_ORDER : // 接收消息命令
// ……
break; // Break;
// ……
}
:: LeaveCriticalSection (& m_csLock ); // 解锁
}
经过上面的代码,一个个实际数据包将被放入字节数组 XCBuffer 中。并获取了此条信息对应的 Socket 记录 SocketUS 。
好了,经过以上的讲解,我们这个 TCP 通信处理模型就建好了。这个模型可以固定不变的应用于 C/S 架构的通信。上面代码红色部分就是各命令信息处理的部分,并且我们的命令数据包可以任意自定义,只要确保数据包的前 4 字节记录好当前数据包长度。
下面给出具体的实际代码:( C++ Builder 6.0 实现)
全局变量
HANDLE DealInfHanld ; // 处理各类信息线程句柄
DWORD DealInfID ; // 处理各类信息线程 ID
// 环行队列指针
UINT8 * DealInfMem ; // 环形队列指针
UINT32 MemcpySize = MEMSIZE ; // 环行队列尺寸
UINT32 WriteIndex = 0, ReadIndex = 0; // 读写游标
CRITICAL_SECTION m_csLock ; // 用于临界变量互锁
UINT8 ReadBuffer [1024*1024]; // 用于接收消息的缓存( 1M )
UINT8 XCBuffer [1024*1024]; // 用于线程中的数据包摘取( 1M )
Write 指针部分
void __fastcall TForm_Main ::ServerSocket1ClientRead( TObject * Sender , TCustomWinSocket * Socket )
{
// 接收各客户端信息
UINT32 LengBuffer , LengOff = 0;
UINT32 ReLeng ;
UINT8 t = 0;
UINT8 * DealInfMem2 ;
// 获取此次接收到的全部数据
do
{
t ++;
LengBuffer = Socket -> ReceiveLength ();
Socket -> ReceiveBuf ( ReadBuffer + LengOff + sizeof( TCustomWinSocket *), LengBuffer );
LengOff += LengBuffer ;
if ( t == 1)
{
memcpy ( ReadBuffer , & Socket , sizeof( TCustomWinSocket *));
memcpy (& ReLeng , ReadBuffer + sizeof( TCustomWinSocket *), 4);
}
}while ( LengOff != ReLeng );
LengBuffer = LengOff + sizeof( TCustomWinSocket *);
// 向环形队列填塞信息
// 以下同具体 Write 部分实现中的代码
}
Read 指针部分
// 处理环形队列中各类信息
DWORD __stdcall DealInf( LPVOID )
{
AnsiString AddSQL ;
static UINT32 TimeSendHand = 0;
UINT32 BufferSize , XCBufferOff = 0;
UINT8 Order ;
TCustomWinSocket * SocketUS ;
// 以下同具体 Read 部分实现中的代码
}
感兴趣的朋友,可以直接把以上代码复制到 C++ Builder 6.0 中去实验。几乎不用该任何代码,就能为你实现一个使用 TCP/IP 协议接收处理的信息的通信系统。
通信模块的使用说明
( 1 )应用平台及开发工具:
WindowsXP , C++builder6.0
( 2 )代码组成:
头文件: MyThread.h
Cpp : MyThread.cpp
( 3 )功能描述:
以环形队列为储存基础和类 MyThread 为多线程基础的通信模块。由于有环形队列实现,以保证完全无遗漏的接收数据并等待处理。 MyThread 多线程类由 BCB 提供的类派生,保证了可操作性和稳定性。
( 4 )使用要点
数据写入:用户在自己的数据接收函数处,调用 MyThread 类成员函数 MyThread_WriteData(UINT32SocketUSAdr,UINT8*Buffer,UINT32LengBuffer); 即可将数据写入到环形队列中。
SocketUSAdr :用于接收的 Socket 控件的地址值
Buffer :接收到的数据
LengBuffer :接收到的数据长度
数据摘取使用: MyThread 类中的函数指针 MyThread_ReadData 将被处理子线程自动调用。所以,用户需要在自己的程序中,声明一个函数实现,并将函数地址赋给 MyThread_ReadData 。如:
void __fastcall MyReadData ( UINT32 SocketUSAdr , UINT8 * XCBuffer ); // 声明的函数
mythread -> MyThread_ReadData = MyReadData ; // 将函数地址赋给函数指针
SocketUSAdr :记录了发送此信息的 Socket 地址
XCBuffer :实际信息数据包
( 5 )备注
1>. 使用此通信模块,发送的数据包必须满足以下格式:
typedef struct QQMSGHEAD
{
UINT32 BufferLeng ; // 本数据包长度
// ……
// ……
} QQMsgHead ;
即首 4 字节必须为此次数据包的长度,以实现报文定界。数据摘取模块就是通过此信息准确提取出每个完整的数据包,并提交给 mythread->MyThread_ReadData 所指向的函数。
2>. 环形队列中数据以以下形式存放:
Socket 地址: 4 字节,是发送此消息的 Socket 地址。
实际数据: N 个字节,建议不超过 64K
数据包字节数: 4 字节
有用信息: N-4 字节
由于记录了发送消息的 Socket 地址,所以此通信模块可以很轻易应用于多人即时在线聊天系统。(本人的 JIGQQ 已成功实现)
注意:环形队列中的数据是不用用户自己操作的,这里给以说明只是为了用户更好的理解本通信模块
3>. 数据摘取函数 MyThread_ReadData 的实际实现不建议申请临时变量,最好不要。如果要用到变量,请将其申请为全局,或申请为所在类模块的内部成员。
环形队列多线程模块
对堆的申请释放操作需要用互斥量加锁,软件中所有的线程的 malloc,free,new,delete 都要加锁。
原文:
《 TCP 通信 处理 浅谈 》
参考:
《 应用层通 信协议开发浅析 》