---
Jos malo zanimljive price i jedno konkretno pitanje, sto dan danas prave ECC memorije??
Za informaciju to su memorije sa kontrolom greske, imaju posebne dodatne memoriske lokacije pored onih koje korisnih vidi i koristi i koje sluze samo da drze "parity" informaciju i koje imaju mehanizam za povratak nekog dela informacije ukoliko se iz bilo kog razloga zagubi negde neki bit u memoriji, bez obzira koliko je ona moderna, brza ili tehnologija izrade, jednostavno ukazao se zahtev da i ta stvar mora da se provera i to tokom rada i da dodatno ako je moguce sama sebe koriguje i usput da javlja da se to desilo.
Vrlo ozbiljni sistemi upravljanja gde se barata velikom energijom, razne mlazne turbine, ubrzivaci cestica, nuklearni reaktori i sta ja znam sta sve, takvi sistemi kada se startuju oni su negde "krenuli" i takav sistem ako mu se bilo sta desi sa upravljackim procesorom, gubi se kontrola nas sistemom i taj sistem "ide" negde sam bez mogucnosti da ga ikako zaustavis (u slucaju da otkazu i ostali sigurnosni mehanizmi) i najcesce dolazi do katrastofalnih posledica.
Spomenuti Space Shutle sto je pao (video ga, ne taj sto pao, ceo jedan : ), nije pao zato sto se "zaglavio" procesor/i (ko zna koliko ih ima redudatnih - radili su svi do zadnje sekunde garantujem), nego je pao zato sto taj isti procesor nije imao informaciju o spornom dogodjaju u tom trenutku, nisu predvideli da je to moglo da se desi jer da su predvideli morali su da imaju i "escape plan" tj celu proceduru sta je trebalo da se uradi u slucaju takvog kvara makar ljude da spasu. Grantujem da su posle tog incedenta stavljali senzore na O-ring "dihtung gume" sa sve mikrokontrolerima koji direktno mere te neke pritiske i prave momentalni interapt sistemu iiiii ...
Isti slucaj i sa incidentom u Fukushimi sa nuklearnim reaktorom, njima nije otkazao ni jedan HW ili SW sistem, napravili su to najbolje sto znaju i ti sistemi su radili do zadnje sekunde, jednostavno nisu predvideli da moze da ih strefi cunami i sve to potopi, da su to predvideli mozda nebi ni gradili elektranu na tom mestu ili bi pravili neke visoke betoske brane ili sta vec ...
Suprotan primer je incident u Chernobilu, tamo je zakazao sistem, po prici zaglavila im se kazaljka na nekom instrumentu pa su operateri posledicno davali pogresne komande sistemu i na kraju je bilo sto je bilo ...
Garantujem vam da su posle toga poceli da uvode za takve banalne stvari na tako kriticnim mestima kao sto je kazaljka na instrumentu, fead-back kolo da vrati sistemu jel stavarno taj mrtvi kazaljkas pokazao to sto je trebalo, ta inzinjerska skola je placena ogromnim ljudskim zrtvama, nema opravdanja da se takve stvari vise ponavljaju! Svi mi smo platili tu skolu i sto je najgore jos uvek osecamo posledice, mnogo je to opak incident bio za neku "tehniku", sta treba jos da se desi da ukapiramo da MORAMO da razmisljamo drugacije?
Primer "ozbiljnih" kontolera je Texas Instruments Hercules, posebna serija ARM Cortex-R mikrokontolera predvidjena za najzahtevnije aplikacije:
http://www.ti.com/lsds/ti/microcontrolle...rview.page#
Ovo vam pricam da bi imali sliku koliko neke stvari moraju malo ozbiljnije da se sagledaju i da je na nama autorima nekakvih HW SW resenja vrlo bitno prvo da prepoznamo potencialne probloeme a onda da tekve probleme ako je moguce predupredimo i to izborom najboje dostupne tehnike u tom trenutku, posebno ako se radi o cenovnim rangovima "ovo kosta 3E a ovo 10E", to je zaaaadnji faktor koji treba da odlucuje neko resenje, pre toga mora da se ispostuju neke druge stvari o kojima nismo do skora uopste i razmisljali i to samo zato sto smo imali stavove "ma ne treba to meni, dobar meni 8 bita MCU" a za ove probleme nismo ni znali da ih imamo a kamoli kako da ih resimo.
Jos malo zanimljive price i jedno konkretno pitanje, sto dan danas prave ECC memorije??
Za informaciju to su memorije sa kontrolom greske, imaju posebne dodatne memoriske lokacije pored onih koje korisnih vidi i koristi i koje sluze samo da drze "parity" informaciju i koje imaju mehanizam za povratak nekog dela informacije ukoliko se iz bilo kog razloga zagubi negde neki bit u memoriji, bez obzira koliko je ona moderna, brza ili tehnologija izrade, jednostavno ukazao se zahtev da i ta stvar mora da se provera i to tokom rada i da dodatno ako je moguce sama sebe koriguje i usput da javlja da se to desilo.
Vrlo ozbiljni sistemi upravljanja gde se barata velikom energijom, razne mlazne turbine, ubrzivaci cestica, nuklearni reaktori i sta ja znam sta sve, takvi sistemi kada se startuju oni su negde "krenuli" i takav sistem ako mu se bilo sta desi sa upravljackim procesorom, gubi se kontrola nas sistemom i taj sistem "ide" negde sam bez mogucnosti da ga ikako zaustavis (u slucaju da otkazu i ostali sigurnosni mehanizmi) i najcesce dolazi do katrastofalnih posledica.
Spomenuti Space Shutle sto je pao (video ga, ne taj sto pao, ceo jedan : ), nije pao zato sto se "zaglavio" procesor/i (ko zna koliko ih ima redudatnih - radili su svi do zadnje sekunde garantujem), nego je pao zato sto taj isti procesor nije imao informaciju o spornom dogodjaju u tom trenutku, nisu predvideli da je to moglo da se desi jer da su predvideli morali su da imaju i "escape plan" tj celu proceduru sta je trebalo da se uradi u slucaju takvog kvara makar ljude da spasu. Grantujem da su posle tog incedenta stavljali senzore na O-ring "dihtung gume" sa sve mikrokontrolerima koji direktno mere te neke pritiske i prave momentalni interapt sistemu iiiii ...
Isti slucaj i sa incidentom u Fukushimi sa nuklearnim reaktorom, njima nije otkazao ni jedan HW ili SW sistem, napravili su to najbolje sto znaju i ti sistemi su radili do zadnje sekunde, jednostavno nisu predvideli da moze da ih strefi cunami i sve to potopi, da su to predvideli mozda nebi ni gradili elektranu na tom mestu ili bi pravili neke visoke betoske brane ili sta vec ...
Suprotan primer je incident u Chernobilu, tamo je zakazao sistem, po prici zaglavila im se kazaljka na nekom instrumentu pa su operateri posledicno davali pogresne komande sistemu i na kraju je bilo sto je bilo ...
Garantujem vam da su posle toga poceli da uvode za takve banalne stvari na tako kriticnim mestima kao sto je kazaljka na instrumentu, fead-back kolo da vrati sistemu jel stavarno taj mrtvi kazaljkas pokazao to sto je trebalo, ta inzinjerska skola je placena ogromnim ljudskim zrtvama, nema opravdanja da se takve stvari vise ponavljaju! Svi mi smo platili tu skolu i sto je najgore jos uvek osecamo posledice, mnogo je to opak incident bio za neku "tehniku", sta treba jos da se desi da ukapiramo da MORAMO da razmisljamo drugacije?
Primer "ozbiljnih" kontolera je Texas Instruments Hercules, posebna serija ARM Cortex-R mikrokontolera predvidjena za najzahtevnije aplikacije:
Quote:On-chip diagnostics
Hercules MCUs provide a high level of diagnostic coverage in hardware so that customers can optimize performance and code size by reducing complex safety software.
LockStep CPUs -- 1oo1D safety concept
CPU Built-In Self-Test (BIST) controller
ECC on FLASH and RAM
ECC calculation in CPU checks the interconnect
Memory BIST on CPU and peripheral RAMs
Clock and voltage monitoring
Error signaling module with error pin
http://www.ti.com/lsds/ti/microcontrolle...rview.page#
Ovo vam pricam da bi imali sliku koliko neke stvari moraju malo ozbiljnije da se sagledaju i da je na nama autorima nekakvih HW SW resenja vrlo bitno prvo da prepoznamo potencialne probloeme a onda da tekve probleme ako je moguce predupredimo i to izborom najboje dostupne tehnike u tom trenutku, posebno ako se radi o cenovnim rangovima "ovo kosta 3E a ovo 10E", to je zaaaadnji faktor koji treba da odlucuje neko resenje, pre toga mora da se ispostuju neke druge stvari o kojima nismo do skora uopste i razmisljali i to samo zato sto smo imali stavove "ma ne treba to meni, dobar meni 8 bita MCU" a za ove probleme nismo ni znali da ih imamo a kamoli kako da ih resimo.