你好,我是LMOS。
通过前面两节课的学习,我们已经组织好了内存页,也初始化了内存页和内存区。我们前面做了这么多准备工作,就是为了实现分配和释放内存页面,达到内存管理的目的。
那有了前面的基础,我想你自己也能大概实现这个分配和释放的代码。但是,根据前面我们设计的数据结构和对其初始化的工作,估计你也可以隐约感觉到,我们的内存管理的算法还是有一点点难度的。
今天这节课,就让我们一起来实现这项富有挑战性的任务吧!这节课的配套代码,你可以通过这里下载。
如果让你实现一次只分配一个页面,我相信这个问题很好解决,因为你只需要写一段循环代码,在其中遍历出一个空闲的msadsc_t结构,就可以返回了,这个算法就可以结束了。
但现实却不容许我们这么简单地处理问题,我们内存管理器要为内核、驱动,还有应用提供服务,它们对请求内存页面的多少、内存页面是不是连续,内存页面所处的物理地址都有要求。
这样一来,问题就复杂了。不过你也不必担心,我们可以从内存分配的接口函数下手。
下面我们根据上述要求来设计实现内存分配接口函数。我们还是先来建立一个新的C语言代码文件,在cosmos/hal/x86目录中建立一个memdivmer.c文件,在其中写一个内存分配接口函数,代码如下所示。
//内存分配页面框架函数msadsc_t *mm_divpages_fmwk(memmgrob_t *mmobjp, uint_t pages, uint_t *retrelpnr, uint_t mrtype, uint_t flgs){//返回mrtype对应的内存区结构的指针memarea_t *marea = onmrtype_retn_marea(mmobjp, mrtype);if (NULL == marea){*retrelpnr = 0;return NULL;}uint_t retpnr = 0;//内存分配的核心函数msadsc_t *retmsa = mm_divpages_core(marea, pages, &retpnr, flgs);if (NULL == retmsa){*retrelpnr = 0;return NULL;}*retrelpnr = retpnr;return retmsa;}//内存分配页面接口//mmobjp->内存管理数据结构指针//pages->请求分配的内存页面数//retrealpnr->存放实际分配内存页面数的指针//mrtype->请求的分配内存页面的内存区类型//flgs->请求分配的内存页面的标志位msadsc_t *mm_division_pages(memmgrob_t *mmobjp, uint_t pages, uint_t *retrealpnr, uint_t mrtype, uint_t flgs){if (NULL == mmobjp || NULL == retrealpnr || 0 == mrtype){return NULL;}uint_t retpnr = 0;msadsc_t *retmsa = mm_divpages_fmwk(mmobjp, pages, &retpnr, mrtype, flgs);if (NULL == retmsa){*retrealpnr = 0;return NULL;}*retrealpnr = retpnr;return retmsa;}
我们内存管理代码的结构是:接口函数调用框架函数,框架函数调用核心函数。可以发现,这个接口函数返回的是一个msadsc_t结构的指针,如果是多个页面返回的就是起始页面对应的msadsc_t结构的指针。
为什么不直接返回内存的物理地址呢?因为我们物理内存管理器是最底层的内存管理器,而上层代码中可能需要页面的相关信息,所以直接返回页面对应msadsc_t结构的指针。
还有一个参数是用于返回实际分配的页面数的。比如,内核功能代码请求分配三个页面,我们的内存管理器不能分配三个页面,只能分配两个或四个页面,这时内存管理器就会分配四个页面返回,retrealpnr指向的变量中就存放数字4,表示实际分配页面的数量。
有了内存分配接口、框架函数,下面我们来实现内存分配的核心函数,代码如下所示。
bool_t onmpgs_retn_bafhlst(memarea_t *malckp, uint_t pages, bafhlst_t **retrelbafh, bafhlst_t **retdivbafh){//获取bafhlst_t结构数组的开始地址bafhlst_t *bafhstat = malckp->ma_mdmdata.dm_mdmlielst;//根据分配页面数计算出分配页面在dm_mdmlielst数组中下标sint_t dividx = retn_divoder(pages);//从第dividx个数组元素开始搜索for (sint_t idx = dividx; idx < MDIVMER_ARR_LMAX; idx++){//如果第idx个数组元素对应的一次可分配连续的页面数大于等于请求的页面数,且其中的可分配对象大于0则返回if (bafhstat[idx].af_oderpnr >= pages && 0 < bafhstat[idx].af_fobjnr){//返回请求分配的bafhlst_t结构指针*retrelbafh = &bafhstat[dividx];//返回实际分配的bafhlst_t结构指针*retdivbafh = &bafhstat[idx];return TRUE;}}*retrelbafh = NULL;*retdivbafh = NULL;return FALSE;}msadsc_t *mm_reldivpages_onmarea(memarea_t *malckp, uint_t pages, uint_t *retrelpnr){bafhlst_t *retrelbhl = NULL, *retdivbhl = NULL;//根据页面数在内存区的m_mdmlielst数组中找出其中请求分配页面的bafhlst_t结构(retrelbhl)和实际要在其中分配页面的bafhlst_t结构(retdivbhl)bool_t rets = onmpgs_retn_bafhlst(malckp, pages, &retrelbhl, &retdivbhl);if (FALSE == rets){*retrelpnr = 0;return NULL;}uint_t retpnr = 0;//实际在bafhlst_t结构中分配页面msadsc_t *retmsa = mm_reldpgsdivmsa_bafhl(malckp, pages, &retpnr, retrelbhl, retdivbhl);if (NULL == retmsa){*retrelpnr = 0;return NULL;}*retrelpnr = retpnr;return retmsa;}msadsc_t *mm_divpages_core(memarea_t *mareap, uint_t pages, uint_t *retrealpnr, uint_t flgs){uint_t retpnr = 0;msadsc_t *retmsa = NULL;cpuflg_t cpuflg;//内存区加锁knl_spinlock_cli(&mareap->ma_lock, &cpuflg);if (DMF_RELDIV == flgs){//分配内存retmsa = mm_reldivpages_onmarea(mareap, pages, &retpnr);goto ret_step;}retmsa = NULL;retpnr = 0;ret_step://内存区解锁knl_spinunlock_sti(&mareap->ma_lock, &cpuflg);*retrealpnr = retpnr;return retmsa;}
很明显,上述代码中onmpgs_retn_bafhlst函数返回的两个bafhlst_t结构指针,若是相等的,则在mm_reldpgsdivmsa_bafhl函数中很容易处理,只要取出bafhlst_t结构中对应的msadsc_t结构返回就好了。
问题是很多时候它们不相等,这就要分隔连续的msadsc_t结构了,下面我们通过mm_reldpgsdivmsa_bafhl这个函数来处理这个问题,代码如下所示。
bool_t mrdmb_add_msa_bafh(bafhlst_t *bafhp, msadsc_t *msastat, msadsc_t *msaend){//把一段连续的msadsc_t结构加入到它所对应的bafhlst_t结构中msastat->md_indxflgs.mf_olkty = MF_OLKTY_ODER;msastat->md_odlink = msaend;msaend->md_indxflgs.mf_olkty = MF_OLKTY_BAFH;msaend->md_odlink = bafhp;list_add(&msastat->md_list, &bafhp->af_frelst);bafhp->af_mobjnr++;bafhp->af_fobjnr++;return TRUE;}msadsc_t *mm_divpages_opmsadsc(msadsc_t *msastat, uint_t mnr){ //单个msadsc_t结构的情况if (mend == msastat){//增加msadsc_t结构中分配计数,分配标志位设置为1msastat->md_indxflgs.mf_uindx++;msastat->md_phyadrs.paf_alloc = PAF_ALLOC;msastat->md_indxflgs.mf_olkty = MF_OLKTY_ODER;msastat->md_odlink = mend;return msastat;}msastat->md_indxflgs.mf_uindx++;msastat->md_phyadrs.paf_alloc = PAF_ALLOC;//多个msadsc_t结构的情况下,末端msadsc_t结构也设置已分配状态mend->md_indxflgs.mf_uindx++;mend->md_phyadrs.paf_alloc = PAF_ALLOC;msastat->md_indxflgs.mf_olkty = MF_OLKTY_ODER;msastat->md_odlink = mend;return msastat;}bool_t mm_retnmsaob_onbafhlst(bafhlst_t *bafhp, msadsc_t **retmstat, msadsc_t **retmend){//取出一个msadsc_t结构msadsc_t *tmp = list_entry(bafhp->af_frelst.next, msadsc_t, md_list);//从链表中删除list_del(&tmp->md_list);//减少bafhlst_t结构中的msadsc_t计数bafhp->af_mobjnr--;bafhp->af_fobjnr--;//返回msadsc_t结构*retmstat = tmp;//返回当前msadsc_t结构连续的那个结尾的msadsc_t结构*retmend = (msadsc_t *)tmp->md_odlink;if (MF_OLKTY_BAFH == tmp->md_indxflgs.mf_olkty){//如果只单个msadsc_t结构,那就是它本身*retmend = tmp;}return TRUE;}msadsc_t *mm_reldpgsdivmsa_bafhl(memarea_t *malckp, uint_t pages, uint_t *retrelpnr, bafhlst_t *relbfl, bafhlst_t *divbfl){msadsc_t *retmsa = NULL;bool_t rets = FALSE;msadsc_t *retmstat = NULL, *retmend = NULL;//处理相等的情况if (relbfl == divbfl){//从bafhlst_t结构中获取msadsc_t结构的开始与结束地址rets = mm_retnmsaob_onbafhlst(relbfl, &retmstat, &retmend);//设置msadsc_t结构的相关信息表示已经删除retmsa = mm_divpages_opmsadsc(retmstat, relbfl->af_oderpnr);//返回实际的分配页数*retrelpnr = relbfl->af_oderpnr;return retmsa;}//处理不等的情况//从bafhlst_t结构中获取msadsc_t结构的开始与结束地址rets = mm_retnmsaob_onbafhlst(divbfl, &retmstat, &retmend);uint_t divnr = divbfl->af_oderpnr;//从高bafhlst_t数组元素中向下遍历for (bafhlst_t *tmpbfl = divbfl - 1; tmpbfl >= relbfl; tmpbfl--){//开始分割连续的msadsc_t结构,把剩下的一段连续的msadsc_t结构加入到对应该bafhlst_t结构中if (mrdmb_add_msa_bafh(tmpbfl, &retmstat[tmpbfl->af_oderpnr], (msadsc_t *)retmstat->md_odlink) == FALSE){system_error("mrdmb_add_msa_bafh fail\n");}retmstat->md_odlink = &retmstat[tmpbfl->af_oderpnr - 1];divnr -= tmpbfl->af_oderpnr;}retmsa = mm_divpages_opmsadsc(retmstat, divnr);if (NULL == retmsa){*retrelpnr = 0;return NULL;}*retrelpnr = relbfl->af_oderpnr;return retmsa;}
这个代码有点长,我写出了完成这个逻辑的所有函数,好像很难看懂。别怕,难懂很正常,因为这是一个分配算法的核心逻辑。你之所以看不懂只是因为不懂这个算法,之前我们确实也没提过这个算法。
下面我就举个例子来演绎一下这个算法,帮助你理解它。比如现在我们要分配一个页面,这个算法将执行如下步骤:
1.根据一个页面的请求,会返回m_mdmlielst数组中的第0个bafhlst_t结构。
2.如果第0个bafhlst_t结构中有msadsc_t结构就直接返回,若没有msadsc_t结构,就会继续查找m_mdmlielst数组中的第1个bafhlst_t结构。
3.如果第1个bafhlst_t结构中也没有msadsc_t结构,就会继续查找m_mdmlielst数组中的第2个bafhlst_t结构。
4.如果第2个bafhlst_t结构中有msadsc_t结构,记住第2个bafhlst_t结构中对应是4个连续的msadsc_t结构。这时让这4个连续的msadsc_t结构从第2个bafhlst_t结构中脱离。
5.把这4个连续的msadsc_t结构,对半分割成2个双msadsc_t结构,把其中一个双msadsc_t结构挂载到第1个bafhlst_t结构中。
6.把剩下一个双msadsc_t结构,继续对半分割成两个单msadsc_t结构,把其中一个单msadsc_t结构挂载到第0个bafhlst_t结构中,剩下一个单msadsc_t结构返回给请求者,完成内存分配。
我画幅图表示这个过程,如下图所示。
代码、文字、图,三管齐下,你一看便明白了。
理解了内存页的分配,掌握内存页的释放就是水到渠成的事儿。其实,内存页的释放就是内存页分配的逆向过程。我们从内存页分配过程了解到,可以一次分配一个或者多个页面,那么释放内存页也必须支持一次释放一个或者多个页面。
我们同样在cosmos/hal/x86/memdivmer.c文件中,写一个内存释放的接口函数和框架函数,代码如下所示。
//释放内存页面核心bool_t mm_merpages_core(memarea_t *marea, msadsc_t *freemsa, uint_t freepgs){bool_t rets = FALSE;cpuflg_t cpuflg;//内存区加锁knl_spinlock_cli(&marea->ma_lock, &cpuflg);//针对一个内存区进行操作rets = mm_merpages_onmarea(marea, freemsa, freepgs);//内存区解锁knl_spinunlock_sti(&marea->ma_lock, &cpuflg);return rets;}//释放内存页面框架函数bool_t mm_merpages_fmwk(memmgrob_t *mmobjp, msadsc_t *freemsa, uint_t freepgs){//获取要释放msadsc_t结构所在的内存区memarea_t *marea = onfrmsa_retn_marea(mmobjp, freemsa, freepgs);if (NULL == marea){return FALSE;}//释放内存页面的核心函数bool_t rets = mm_merpages_core(marea, freemsa, freepgs);if (FALSE == rets){return FALSE;}return rets;}//释放内存页面接口//mmobjp->内存管理数据结构指针//freemsa->释放内存页面对应的首个msadsc_t结构指针//freepgs->请求释放的内存页面数bool_t mm_merge_pages(memmgrob_t *mmobjp, msadsc_t *freemsa, uint_t freepgs){if (NULL == mmobjp || NULL == freemsa || 1 > freepgs){return FALSE;}//调用释放内存页面的框架函数bool_t rets = mm_merpages_fmwk(mmobjp, freemsa, freepgs);if (FALSE == rets){return FALSE;}return rets;}
我们的内存释放页面的代码的结构依然是:接口函数调用框架函数,框架函数调用核心函数,函数的返回值都是bool类型,即TRUE或者FALSE,来表示内存页面释放操作成功与否。
我们从框架函数中可以发现,内存区是由msadsc_t结构中获取的,因为之前该结构中保留了所在内存区的类型,所以可以查到并返回内存区。
在释放内存页面的核心mm_merpages_core函数中,会调用mm_merpages_onmarea函数,下面我们来实现这个函数,代码如下。
sint_t mm_merpages_opmsadsc(bafhlst_t *bafh, msadsc_t *freemsa, uint_t freepgs){msadsc_t *fmend = (msadsc_t *)freemsa->md_odlink;//处理只有一个单页的情况if (freemsa == fmend){//页面的分配计数减1freemsa->md_indxflgs.mf_uindx--;if (0 < freemsa->md_indxflgs.mf_uindx){//如果依然大于0说明它是共享页面 直接返回1指示不需要进行下一步操作return 1;}//设置页未分配的标志freemsa->md_phyadrs.paf_alloc = PAF_NO_ALLOC;freemsa->md_indxflgs.mf_olkty = MF_OLKTY_BAFH;freemsa->md_odlink = bafh;//指向所属的bafhlst_t结构//返回2指示需要进行下一步操作return 2;}//多个页面的起始页面和结束页面都要减一freemsa->md_indxflgs.mf_uindx--;fmend->md_indxflgs.mf_uindx--;//如果依然大于0说明它是共享页面 直接返回1指示不需要进行下一步操作if (0 < freemsa->md_indxflgs.mf_uindx){return 1;}//设置起始、结束页页未分配的标志freemsa->md_phyadrs.paf_alloc = PAF_NO_ALLOC;fmend->md_phyadrs.paf_alloc = PAF_NO_ALLOC;freemsa->md_indxflgs.mf_olkty = MF_OLKTY_ODER;//起始页面指向结束页面freemsa->md_odlink = fmend;fmend->md_indxflgs.mf_olkty = MF_OLKTY_BAFH;//结束页面指向所属的bafhlst_t结构fmend->md_odlink = bafh;//返回2指示需要进行下一步操作return 2;}bool_t onfpgs_retn_bafhlst(memarea_t *malckp, uint_t freepgs, bafhlst_t **retrelbf, bafhlst_t **retmerbf){//获取bafhlst_t结构数组的开始地址bafhlst_t *bafhstat = malckp->ma_mdmdata.dm_mdmlielst;//根据分配页面数计算出分配页面在dm_mdmlielst数组中下标sint_t dividx = retn_divoder(freepgs);//返回请求释放的bafhlst_t结构指针*retrelbf = &bafhstat[dividx];//返回最大释放的bafhlst_t结构指针*retmerbf = &bafhstat[MDIVMER_ARR_LMAX - 1];return TRUE;}bool_t mm_merpages_onmarea(memarea_t *malckp, msadsc_t *freemsa, uint_t freepgs){bafhlst_t *prcbf = NULL;sint_t pocs = 0;bafhlst_t *retrelbf = NULL, *retmerbf = NULL;bool_t rets = FALSE;//根据freepgs返回请求释放的和最大释放的bafhlst_t结构指针rets = onfpgs_retn_bafhlst(malckp, freepgs, &retrelbf, &retmerbf);//设置msadsc_t结构的信息,完成释放,返回1表示不需要下一步合并操作,返回2表示要进行合并操作sint_t mopms = mm_merpages_opmsadsc(retrelbf, freemsa, freepgs);if (2 == mopms){//把msadsc_t结构进行合并然后加入对应bafhlst_t结构return mm_merpages_onbafhlst(freemsa, freepgs, retrelbf, retmerbf);}if (1 == mopms){return TRUE;}return FALSE;}
为了节约篇幅,也为了帮你抓住重点,这段代码我删除了很多检查错误的代码,你可以在源代码中查看。
显然,在经过mm_merpages_opmsadsc函数操作之后,我们并没有将msadsc_t结构加入到对应的bafhlst_t结构中,这其实是在下一个函数完成的,那就是mm_merpages_onbafhlst这个函数。下面我们来实现它,代码如下所示。
bool_t mpobf_add_msadsc(bafhlst_t *bafhp, msadsc_t *freemstat, msadsc_t *freemend){freemstat->md_indxflgs.mf_olkty = MF_OLKTY_ODER;//设置起始页面指向结束页freemstat->md_odlink = freemend;freemend->md_indxflgs.mf_olkty = MF_OLKTY_BAFH;//结束页面指向所属的bafhlst_t结构freemend->md_odlink = bafhp;//把起始页面挂载到所属的bafhlst_t结构中list_add(&freemstat->md_list, &bafhp->af_frelst);//增加bafhlst_t结构的空闲页面对象和总的页面对象的计数bafhp->af_fobjnr++;bafhp->af_mobjnr++;return TRUE;}bool_t mm_merpages_onbafhlst(msadsc_t *freemsa, uint_t freepgs, bafhlst_t *relbf, bafhlst_t *merbf){sint_t rets = 0;msadsc_t *mnxs = freemsa, *mnxe = &freemsa[freepgs - 1];bafhlst_t *tmpbf = relbf;//从实际要开始遍历,直到最高的那个bafhlst_t结构for (; tmpbf < merbf; tmpbf++){//查看最大地址连续、且空闲msadsc_t结构,如释放的是第0个msadsc_t结构我们就去查找第1个msadsc_t结构是否空闲,且与第0个msadsc_t结构的地址是不是连续的rets = mm_find_cmsa2blk(tmpbf, &mnxs, &mnxe);if (1 == rets){break;}}//把合并的msadsc_t结构(从mnxs到mnxe)加入到对应的bafhlst_t结构中if (mpobf_add_msadsc(tmpbf, mnxs, mnxe) == FALSE){return FALSE;}return TRUE;}
这段代码的注释,已经写出了整个释放页面逻辑,最核心的还是要对空闲页面进行合并,合并成更大的连续的内存页面,这是这个释放算法的核心逻辑。
还是老规矩,我同样举个例子来演绎一下这个算法。比如,现在我们要释放一个页面,这个算法将执行如下步骤。
1.释放一个页面,会返回m_mdmlielst数组中的第0个bafhlst_t结构。
设置这个页面对应的msadsc_t结构的相关信息,表示已经执行了释放操作。
开始查看第0个bafhlst_t结构中有没有空闲的msadsc_t,并且它和要释放的msadsc_t对应的物理地址是连续的。没有则把这个释放的msadsc_t挂载第0个bafhlst_t结构中,算法结束,否则进入下一步。
把第0个bafhlst_t结构中的msadsc_t结构拿出来与释放的msadsc_t结构,合并成2个连续且更大的msadsc_t。
继续查看第1个bafhlst_t结构中有没有空闲的msadsc_t,而且这个空闲msadsc_t要和上一步合并的2个msadsc_t对应的物理地址是连续的。没有则把这个合并的2个msadsc_t挂载第1个bafhlst_t结构中,算法结束,否则进入下一步。
把第1个bafhlst_t结构中的2个连续的msadsc_t结构,还有合并的2个地址连续的msadsc_t结构拿出来,合并成4个连续且更大的msadsc_t结构。
继续查看第2个bafhlst_t结构,有没有空闲的msadsc_t结构,并且它要和上一步合并的4个msadsc_t结构对应的物理地址是连续的。没有则把这个合并的4个msadsc_t挂载第2个bafhlst_t结构中,算法结束。
上述步骤,我们只要在一个循环中执行就行。我用一幅图表示这个过程,如下所示。
这个是不是很熟悉,这正是前面的内存分配图反过来了的结果。最终我们验证了,释放内存就是分配内存的逆向过程。
好了,到这里,一个优秀的物理内存页面管理器就实现了。
今天我们依赖上节课设计好的数据结构,实现了内存页面管理算法。下面来回顾一下本课的重点。
1.我们实现了内存分配接口、框架、核心处理函数,其分配算法是:如果能在dm_mdmlielst数组中找到对应请求页面数的msadsc_t结构就直接返回,如果没有就寻找下一个dm_mdmlielst数组中元素,依次迭代直到最大的dm_mdmlielst数组元素,然后依次对半分割,直到分割到请求的页面数为止。
2.对应于内存分配过程,我们实现了释放页面的接口、框架、核心处理函数,其释放算法则是分配算法的逆向过程,会查找相邻且物理地址连续的msadsc_t结构,进行合并,合并工作也是迭代过程,直到合并到最大的连续msadsc_t结构或者后面不能合并为止,最后把这个合并到最大的连续msadsc_t结构,挂载到对应的dm_mdmlielst数组中。
你是不是感觉我们的内存管理器还有缺陷,这只能分配页面?是的,只能分配页面是不行的,你有什么更好的方案吗?下一课我们一起讨论。
在内存页面分配过程中,是怎样尽可能保证内存页面连续的呢?
欢迎你在留言区记录你的收获或疑问。如果这节课对你有启发,也欢迎分享给你的同事、朋友。
好,我是LMOS,我们下节课见!