四維醫(yī)學成像設備的架構設計
對所有最新或重新設計的醫(yī)學成像系統(tǒng)來說,這些應用目標意味著需要最大的計算能力,以便在最短時間內提供最高分辨率的圖像。這通常也意味著應最大化內核和線程數(shù)量以支持目標形狀系數(shù),因為許多成像算法是支持并行處理的。
但在決定使用哪種多核處理器之前,需要仔細考慮系統(tǒng)的可擴展性和可升級性。由于半導體和存儲領域中器件性能和數(shù)據(jù)速率的飛速發(fā)展,能夠方便地使用下一代器件或在系統(tǒng)中增加更多節(jié)點(當使用集群計算時)而無需重新設計和重新測試整個系統(tǒng)十分重要。如果你僅通過一次再編譯便能成功,那你就太厲害了。
“解決方案的可擴展性是使用戶能夠在不同產品中復用軟件和算法的關鍵。”Intel公司醫(yī)療部門經理Bob Ghaffari指出,“為使芯片架構能夠滿足從高端CT設備到低功耗便攜式超聲波產品的各種性能和功率要求,就必須采用可擴展的架構。”
![]() |
設計的主要構建模塊包括模擬前端、數(shù)字后端、圖形顯示渲染器以及具有可選網(wǎng)絡功能的系統(tǒng)控制器等。 |
當試圖確定需要采用多少內核和線程時,可以將數(shù)據(jù)通路視為處理瓶頸,因為數(shù)據(jù)的處理速度超過存儲速度將是毫無意義的。如果使用本地硬盤,那么串行ATA(SATA)或串行連接SCSI可能就是制約因素。此外,如果需要將數(shù)據(jù)寫到網(wǎng)絡上的設備,那么網(wǎng)絡連接(以太網(wǎng)或無線網(wǎng)絡)則有一個已知的最大帶寬。
對于選擇處理器數(shù)量和類型以及如何有效利用它們,Intel公司提出了一些指導方針:首先確定電路板性能和外形要求;然后運行代碼;接著不斷優(yōu)化代碼,直到經過合理次數(shù)的設計反復后才停止優(yōu)化;最后調整系統(tǒng)性能,如果性能達到目標,則完成了架構的選擇,如果需要更高的系統(tǒng)性能,就需要增加用于加速卸載的外部器件。
從少量三維圖像創(chuàng)建四維圖像可能需要給每個病人準備約500MB~5GB的數(shù)據(jù)空間。隨著分辨率和圖像片數(shù)量的增加,這個數(shù)字肯定還要提高??紤]到每天的病人數(shù)量,能在快速中央服務器上存儲所有病人數(shù)據(jù),并使用本地PC來顯示圖像的瘦型客戶機網(wǎng)絡開始變得越來越有吸引力了。
當便攜性成為必備性能時,基于MicroTCA架構的系統(tǒng)可能是最好的選擇。MicroTCA可以在很小的外形尺寸下提供強大的計算能力、帶寬和內置網(wǎng)絡連接性能。同時,四維圖像顯示需要數(shù)千兆字節(jié)的臨時存儲器。設計工程師必須考慮圖形存儲器(如圖形雙倍數(shù)據(jù)速率(GDDR)內存)的容量、類型和速度。
設計的主要構建模塊包括模擬前端、數(shù)字后端、圖形顯示渲染器以及具有可選網(wǎng)絡功能的系統(tǒng)控制器(圖1)。模擬前端執(zhí)行數(shù)據(jù)采集和圖像預處理功能,它們很大程度上依賴于可能需要使用一個或更多的DSP、FPGA或ASIC芯片的成像模態(tài)。數(shù)字后端包括圖像重構和后處理模塊,根據(jù)成像模態(tài)的復雜程度,該模塊可能是一個簡單處理器(GPU),或是一個(或更多)包含多核多線程功能的高級處理器(CPU/GPU)。對于圖像處理和重構等苛刻任務而言,當需要最高的性能時,像Cell Broadband Engine這樣的處理器可能更合適。
如果今后要用到多個內核,那就需要認真考慮與軟件相關的選擇,例如操作系統(tǒng)、消息傳遞接口、并行編程語言等。即使其它一些瑣碎的決定(如使用哪種文件系統(tǒng))也會變得十分重要,需要仔細考慮。