Small RTOS51中的一个典型问题及其解决方法
扫描二维码
随时随地手机看文章
small rtos5l是一款专门为80c5l系列单片机设计的实时操作系统(实际上应该称其为实时内核),大部分代码用c语言编写,易于移植,十分适合于资源紧张的8位机。同时,它也是学习嵌入式操作系统原理极好的入门材料。本人就是在学习完smallrtos5l的基础上进一步学习了著名的uc/0s-ii,受益颇多。 1 问题描述 在将smau rtos51应用于实验室某项目时,发现了一个奇怪的问题。简单说来,就是一个以无条件方式申请消息的任务竟然在没有取到消息的情况下,以指示“等待超时”的代码返回了。 在这里,首先解释一下任务申请消息的两种方式:无条件方式和超时方式。所谓五条件方式是指任务申请消息时,如果暂时没有消息可取,则任务将一直等待消息,直至取到为止;而超时方式是指任务等待消息是有时间限制的,超过所设定的最大时间,即便没有取到消息,函数也可以正常返回,只是返回值不是消息,而是“超时代码”(此方式可以防止任务因取不到消息而被永久性挂起)。可见,如果任务以无条件方式申请消息,那么函数若能够返回,则说明任务一定是取到消息了,而返回值又怎么可能是“等待超
时”呢?经过仔细分析smallrts5l的源代码,找到了问题产生的根源。 假定有任务idx以超时方式调用osqpend()函数申请消息。osqpend()函数首先会把idx放到此消息队列的等待任务表中,然后再去判断队列中是否有消息。最佳情况是队列中确实有消息,则osqpend()再把idx从此消息队列的等待任务表中删除,接着osqpend()返回,任务取到消息。 此刻,假定消息队列中设有消息。那么,osqpend()就会调用osclearsigna1(osrunningtaskid())和os-sched()这两个系统函数,迫使idx进入休眠态,同时调度器调度下一个最高优先级的就绪任务来运行。假定任务idy被选中,且idy在运行中通过调用osqintpost()函数向此消息队列发送了一则消息。则osintpost()将把所有等待这个消息队列的任务中优先级最高的那个任务唤醒,并且把它从该消息队列的等待任务表中删除,假定它就是idx。 当任务idy进入休眠态后,操作系统才会调度idx来运行。于是idx从上次被强迫休眠的地方开始运行,即从osqpend()函数中紧接着ossched()的那条指令开始执行。具体来说,osqpend()将首先查看idx是否满足超时条件(用来判断任务是因为等待超时被唤醒的还是因为确实取到消息而被唤醒的),若超时时限尚未到达,osqpend()再接着检查消息队列中是否已经有了消息。根据上面的假定,可以知道任务idx确实是因为取到消息而被唤醒的。于是,osqpend()把idx从此消息队列的等待任务表中删除,osqpend()正常返回。这样,任务idx取到消息,接着运行。 以上都没有什么问题,但是,有一种情况被忽略了,而正是这种情况的出现导致了任务idx被长时间挂起,就算队列中有消息存在,idx也无法被唤醒,只能等到其超时为止。 为讨论方便,不妨仍按上述假定情况来分析。当任务idx被唤醒且idy进入休眠状态后,系统必将调度下一个优先级最高的就绪任务来运行。在前面,认为这个任务就是idx,然而此时,假定它是另一个比idx优先级更高的任务idz(因为有可能是中断把idz唤醒的,所以中断退出时,操作系统强制idy进入休眠态,转而调度idz运行)。非常巧合的是,idz在运行的过程中向同一个消息队列也申请了消息。由于之前idy已经向消息队列发送过一条消息,则idz将正常取到此条消息。于是,消息队列中的消息数减为o(buf[0]==0)。在任务idz进入休 眠后,任务idx被操作系统调入cpu运行。同样,函数osqpend()首先查看idx是否等待超时。如果没有超时再检查消息队列中是否存在消息。注意到先前已经假定消息被任务idz给取走了,所以检查的结果当然是队列中不存在消息。idx就只好再次进入休眠,函数ossched()调度别的任务运行。 于是问题出现了。idx是因为暂时取不到消息而被挂起的,但此时这个消息队列的等待任务表中已经投有idx的踪影了,它之前就已被那个发送消息的idy在osqintpost()函数中给删除了。 结果,即使后面有任务再次向队列中发送消息,idx也取不到了,因为消息发送函数osqintpost()已经无法从消息队列的等待任务表中找到idx了,它将被长时间挂起,直至超时。也就是说,任务idx明明可以取到消息的,却取不到,最后只能以指示其等待超时的代码返回。 这还是一种相对来说不太严重的错误,无非就是任务没取到消息,以超时返回而已.如果任务idx以无条件方式申请消息,而又恰恰发生了上面的情况,会有什么样的后果呢?由于osqpend()函数自身的特性,所谓五条件等待就是把超时时间设为0。结果任务idx被唤醒后,osqpend()必然会检测到其已超时,然后又会检测到队列中没有消息,所以就必然以“超时代码”返回。结果就发生了文章开头所说的一幕;一个必须在取到消息后才能返回的任务,居然在没有取到消息的情况下以指示其等待超