PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Software implemented fault detection and fault tolerance mechanisms. Part 1, Concepts and algorithms

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
PL
Programowe mechanizmy detekcji i tolerowania błędów sprzętu. Cz. 1, Koncepcje i algorytmy
Języki publikacji
EN
Abstrakty
EN
The paper discusses the problem of eliminating hardware fault effects by means of software. We describe various error detection and fault handling software schemes, show their limitations and capabilities. On the basis of this analysis, we propose original fault handling procedures, which integrate hardware and software mechanisms. Special attention is paid to exception handling and error recovery procedures. The presented solutions have been verified for a wide spectrum of applications running on IBM PC environment.
PL
W artykule przedstawiono programowe metody zwiększania odporności systemów mikroprocesorowych na błędy sprzętu. Omówiono różne techniki detekcji i tolerowania błędów, ich ograniczenia oraz możliwości. Na bazie przeprowadzonej analizy przedstawiono oryginalne procedury obsługi błędów, które integrują mechanizmy sprzętowe i programowe. Szczególną uwagę poświęcono problemowi obsługi wyjątków i mechanizmom odtwarzania. Zaproponowane rozwiązania zostały zweryfikowane dla szerokiego spektrum aplikacji.
Rocznik
Strony
291--303
Opis fizyczny
Bibliogr. 24 poz.
Twórcy
autor
  • Institute of Computer Science, Warsaw University of Technology, ul. Nowowiejska 15/19, 00-665 Warsaw
autor
  • Institute of Computer Science, Warsaw University of Technology, ul. Nowowiejska 15/19, 00-665 Warsaw
Bibliografia
  • 1. A. Avizienis, J. C. Laprie, B. Randel and C. Landwehr: Basic concepts and taxonomy of dependable and secure computing. IEEE Trans, on Dependable and Secure Com­puting, vol. 1, no. 2, pp. 11-33, Jan.- Mar. 2004.
  • 2. A. Benso, S. Di Carlo, G. Di Nartale, P. Prinetto and L. Tagliaferr i: Control flow checking via regular expressions. Proc, of the 10th Asian Test Symposium, pp. 299-303, 2001.
  • 3. A. Bondavalli, S. Chiaradonna, F. Di Giandomenico and F. Grandoni: Threshold-based mechanisms to discriminate transient from intermittent faults. IEEE Trans, on Computers, vol. 49, no. 3, pp. 230-245, March 2000.
  • 4. D. C. Bossen, A. Kitamorn, K. F. Reick and S. Floyd: Fault tolerant design of the IBM pSeries 690 system using Power 4 processor technology. IBM J. Res.& Dev., vol. 46, no. 1, pp. 77-86, Jan. 2002.
  • 5. P. Cheynet, et al.: Experimentally evaluating an automatic approach for generating safety critical software with respect to transient errors. IEEE Trans, on Nuclear Science, vol. 47, no. 6, pp. 231-236, Dec. 2000.
  • 6. P. E. Dodd, L. W. Massengill: Basic mechanisms and modelling of single-event upset in digital microelectronics. IEEE Trans, on Nuclear Science, vol. 49, pp. 583-602, June 2003.
  • 7. P. Gawkowski, J. Sоsnowski: Experimental evaluation of fault handling mechanisms. Proc, of 20th Int. Conference SAFECOMP, Springer Verlag, LNCS 2187, pp. 109-118, 2001.
  • 8. P. Gawkowski, J. Sosnowski: Dependability evaluation with fault injection experiments. IEICE Trans. Inf. & Syst., vol. E86D, no. 12, pp. 2642-2649, Dec. 2003.
  • 9. P. Gawkowski, J. Sosnowski: Software Implemented Fault Detection and Fault Tolerance Mechanisms, Part II, Experimental evaluation of error coverage. Kwartalnik Elektroniki i Telekomunikacji, nr 3, 2005 (w druku).
  • 10. В. W. Johnson: Design and analysis of fault tolerant digital systems. Addison Wesley, 1989.
  • 11. G. Latif-Shabgahi, J. M. Bass and S. Вennett: A taxonomy for software voting algorithms used in safety critical systems. IEEE Trans, on Reliability, vol. 63, no. 3, pp. 319-328, Sept. 2004.
  • 12. M. Lyu: Software fault tolerance. John Wiley & Sons, 1995.
  • 13. B. Nicolescu, R. Velazco and M. S. Reorda: Effectiveness and limitations of various software techniques for soft error detection, a comparative study. Proc, of 7th IEEE Int. On-line Testing Workshop, pp. 172-177, 2001.
  • 14. N. Oh, P. P. Shirvani and E. J. McCluskey: Control flow checking by software signature. IEEE Trans, on Reliability, vol. 51, no. 1, pp. 111-122, March 2002.
  • 15. N. Oh, S. Mitra and E. J. McCluskey: EDI Error detection by diverse data and duplicated instructions: IEEE Trans, on Computers, vol. 51, no. 2, pp. 180-199, Feb. 2002.
  • 16. N. Oh, P. P. Shirvani and E. J. McCluskey: Error detection by duplicated instructions in super scalar processors. IEEE Trans, on Reliability, vol. 51, no. 1, pp. 63-75, March 2002.
  • 17. F. Piedad M. Hawkins: High Availability, design techniques and processes. Prentice Hall Inc., 2001.
  • 18. S. J. Piestrak: Design of Self-Testing Checkers for Unidirectional Error Detecting Codes. Scientific Papers of the Inst, of Tech. Cybern. of the Tech. Univ. of Wroclaw, no. 92, Ser.: Monographs No. 24, Oficyna Wyd. Polit. Wrocl., Wroclaw 1995.
  • 19. M. Rebaudengo, M. S. Reorda and M. Violante: A new software based technique for low cost fault tolerant application. Proc, of Annual Reliability and Maintainability Symposium, pp. 25-28, 2003.
  • 20. N. Seifert, Z. Xiaowei, L. W. Massengill: Impact of scaling on soft-error rates in commercial microprocessors. IEEE Trans, on Nuclear Science, vol. 49, pp. 3100-3106, Dec. 2002.
  • 21. D. P. Siewiorek and R. S. Swarz: Reliable Computer Systems: Design and Evaluation. AK Peters, 1998.
  • 22. J. Sosnowski: Transient fault tolerance in digital systems. IEEE Micro, pp. 24-35, February 1994.
  • 23. F. Vargas, R. D. R. Fagundes, D. Barros and D. R. Вrum: Briefing a new approach to improve EMI immunity of DSP systems. Proc, of the 12th IEEE Asian Test Symposium, pp. 468-471, 2003.
  • 24. R. Velazco, S. Rezgui: Assessing the soft error rate of digital architectures devoted to operate in radiation environment: a case study. Journal of Electronic Testing, vol. 19, pp. 83-90, 2003.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWA6-0001-0042
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.