下面提到的一些技巧可以幫助開發(fā)一種解決嵌入式系統(tǒng)問題的邏輯方法和分析思維。
嵌入式系統(tǒng)由硬件、固件和應(yīng)用軟件組成。有時(shí),當(dāng)報(bào)告問題時(shí),并不清楚問題出現(xiàn)在系統(tǒng)中的什么位置。這可能是由于硬件、固件代碼或應(yīng)用軟件。
步驟1-了解設(shè)置并正確重現(xiàn)問題
首先,我們需要做的是正確再現(xiàn)問題。有時(shí)問題是在本地看到的,工程師能夠很容易地重現(xiàn)問題。然而,有時(shí)問題是在遠(yuǎn)程位置或客戶現(xiàn)場發(fā)現(xiàn)的,工程師不得不完全依靠可用的日志來了解設(shè)置和重現(xiàn)問題。在第二種情況下,工程師正確理解設(shè)置非常重要,因?yàn)檫@將有助于成功重現(xiàn)問題。如果工程師未能做到這一點(diǎn),那么將來該問題可能會在遠(yuǎn)程位置或客戶現(xiàn)場再次出現(xiàn)。這主要是因?yàn)楣こ處熆赡軟]有正確理解問題,因此沒有制定正確的解決方案。因此,這將導(dǎo)致修復(fù)問題的多次迭代。
對于我們的例子,讓我們考慮一個(gè)視頻顯示器,其中噪聲只出現(xiàn)在某些監(jiān)視器上。因?yàn)樵O(shè)備安裝在遠(yuǎn)程位置,所以只有視頻日志可用于調(diào)試。從日志中很難找出噪音的根本原因。最初,我們嘗試使用不同的剪輯,但無法在我們這邊重現(xiàn)問題。在嵌入式開發(fā)中,我們不確定為什么問題無法重現(xiàn)。我們不清楚這是由于使用的視頻文件還是由于設(shè)置。最后,我們通過使用與客戶使用的完全相同的夾子和一臺顯示器重現(xiàn)了問題。
第2步-將問題分成更小的問題
一旦問題被正確再現(xiàn),下一步就是將整個(gè)問題分解成更小的問題。這是非常重要的,可以通過理解整個(gè)數(shù)據(jù)流來完成。第一步是在應(yīng)用層與固件層的接口處中斷數(shù)據(jù)流,然后是固件層與硬件層的接口。這樣,每一層都可以針對任何問題進(jìn)行獨(dú)立的審查和測試。此外,我們不需要就此止步,我們可以根據(jù)邏輯理解將整個(gè)數(shù)據(jù)流路徑分解為更多的子級別。
對于我們的示例,我們將視頻幀數(shù)據(jù)的整個(gè)路徑從應(yīng)用程序劃分到硬件層。我們了解了編碼視頻數(shù)據(jù)如何被接收、解碼以及如何被傳遞到固件層的整個(gè)過程。在這里,我們了解了如何為每個(gè)視頻幀分配指針,以及固件如何通過硬件層發(fā)送每個(gè)幀。在硬件層,我們了解視頻幀如何在物理線路上發(fā)送的協(xié)議。一旦我們理解了整個(gè)路徑,我們就把它分成邏輯塊。一個(gè)模塊用于應(yīng)用層,其中編碼的視頻數(shù)據(jù)被解碼為原始視頻并存儲在視頻緩沖區(qū)中。另一個(gè)模塊是固件層,我們檢查視頻緩沖區(qū)是如何分配給硬件的。最后一個(gè)模塊用于硬件,我們檢查視頻數(shù)據(jù)是如何在實(shí)際物理線路上給出的。
步驟3–解決每個(gè)較小的問題
一旦我們將整個(gè)數(shù)據(jù)路徑分成每一層的邏輯塊,我們需要單獨(dú)測試每個(gè)塊,并以各自的方式進(jìn)行驗(yàn)證。在嵌入式開發(fā)中,這將有助于找到問題的根源所在。有時(shí)一個(gè)系統(tǒng)問題可以通過只改變一層來解決,而有時(shí)需要改變不止一層。通過在邏輯上斷開整個(gè)路徑,我們可以正確地找到所有需要更改的地方,然后相應(yīng)地修復(fù)它們。
對于我們的示例,在應(yīng)用層,我們使用讀寫文件來驗(yàn)證數(shù)據(jù)路徑流。將解碼后生成的視頻數(shù)據(jù)緩沖區(qū)與預(yù)期值進(jìn)行比較。在固件級,固定模式被用作數(shù)據(jù)輸入,而不是來自應(yīng)用層的數(shù)據(jù)。這里,我們觀察到視頻數(shù)據(jù)是按照場而不是幀提供給固件層的,但是場信息(頂部或底部)沒有從應(yīng)用層正確地提供給固件層。因此,我們必須相應(yīng)地修改代碼,使緩沖區(qū)包含正確的字段信息。
在硬件層面,使用邏輯分析儀按照規(guī)范驗(yàn)證這些固定模式和接口的相應(yīng)控制信號。在我們的例子中,我們使用的協(xié)議是BT.1120,我們發(fā)現(xiàn)協(xié)議計(jì)時(shí)不符合規(guī)范。所以我們意識到這就是為什么有些顯示器工作正常而有些不正常的原因。一旦我們按照規(guī)范制定了協(xié)議,我們看到所有的監(jiān)視器都工作正常。我們還意識到,噪聲的整個(gè)問題實(shí)際上是錯誤的字段信息和錯誤的協(xié)議計(jì)時(shí)的組合。這就是為什么一些顯示器能夠工作而另一些不能工作的原因。
第4步-消極測試
測試當(dāng)然是解決問題的一個(gè)非常重要的方面,重要的是測試問題是否得到了正確的解決并且不會再出現(xiàn)。因此,在修復(fù)問題后,我們在進(jìn)行常規(guī)測試的同時(shí)進(jìn)行負(fù)面測試是非常重要的。消極測試基本上意味著確保問題被強(qiáng)加到系統(tǒng)中,然后按照設(shè)計(jì)的解決方案驗(yàn)證系統(tǒng)的響應(yīng)。在嵌入式開發(fā)中,這基本上意味著,如果我們通過給出正確的輸入從系統(tǒng)得到錯誤的輸出,并且我們想出了一個(gè)解決方案,那么我們應(yīng)該能夠產(chǎn)生一個(gè)錯誤的輸入并饋送給系統(tǒng),以便它將產(chǎn)生正確的輸出。如果發(fā)生這種情況,這意味著根本原因已被正確識別,修復(fù)已得到驗(yàn)證。
對于我們的例子,我們用下面的方式測試。對于協(xié)議計(jì)時(shí),我們看到在按照規(guī)范進(jìn)行計(jì)時(shí)之后,所有的監(jiān)視器都出現(xiàn)了噪聲問題。即使是對規(guī)范的一個(gè)微小修改也會導(dǎo)致監(jiān)視器行為的改變。這證實(shí)了硬件層錯誤的協(xié)議時(shí)序是監(jiān)視器不同行為的根本原因。接下來,對于我們發(fā)現(xiàn)問題的顯示器,我們故意在應(yīng)用層交換了頂部和底部字段。然后我們看到問題沒有發(fā)生。這證實(shí)了不正確的頂部和底部字段指針是噪音問題的根本原因。通過這種方式,我們測試了該解決方案實(shí)際上解決了根本原因,并且在應(yīng)用程序和硬件層都進(jìn)行了修復(fù)。
通過使用上述步驟,在嵌入式開發(fā)中,任何問題都可以以更好的方式解決。