Skip to main content

Šľak ma ide trafiť...

Obrázok používateľa Palo M.
Kategórie:

Pod týmto názvom uvádzal kedysi v rádiu svoju reláciu Julo Satinský. Rád som to počúval, bolo to zábavné. Ale teraz, teraz ma naozaj ide trafiť šľak!

Už je to týždeň, čo je Andromeda dole. Nie to súhvezdie na oblohe, to je našťastie stále tam hore, takisto aj hmlovina. Andromeda je jeden z mojich strojov. Teda, momentálne to nie je stroj, len kolekcia hardware, ktorý v tomto stave nie je schopný chodu.

 

Uptime
BOINC-projs

Takto smutne teraz vyzerajú grafy Andromedy...

 

Celé to začalo takto: Zakúpil som nový HW pre svoj desktop: Doska s AM785G (pätica AM3) od Gigabyte, DDR3 pamäte 2x2GB od OCZ, procesor Phenom II X4 965. Plus zdroj Antec a kisňa Silverstone, aby som svoj predchádzajúci hardware mohol "presunúť" na server. Diskov mám dosť, nový som kupovať nemusel.

Ale bola to trocha väčšia rošáda: Dosku zo starého servera (Q6600) som presunul do (nového) sekundárneho servera aj s jedným starším 80GB diskom a novým zdrojom. Dosku z desktopu (Phenom II X4 940) som presunul do starého servera (z toho prakticky zostali pôvodné len disky a zdroj, ale nebolo treba nič preinštalovávať a server po tejto zmene bežal ďalej). No a novú dosku som použil na desktop - tam zostali pôvodné disky, DVD-mechanika, grafika HD4870 a zdroj. Všetky moje stroje vlastne museli byť rozobrané, lebo všade sa niečo menilo. A keď už som to mal také rozmontované, tak som si urobil väčšiu údržbu a vyčistil som to dôkladne od prachu (a to bola teda riadna makačka). Tak som strávil jeden deň presunom komponentov do inej skrinky... S micro-ATX doskami a malými skrinkami to nie je jednoduché, ale výsledný efekt mi veľmi vyhovuje, tak už volím len micro-ATX riešenie. Tak som to jeden sobotný (či nedeľný? - už si presne nepamätám) večer skompletoval. A ako obvykle po skladaní novej mašiny, spustil som tradičné testy. A išiel som spať.

Memtest dopadol dobre, všetko frčalo. Nočný beh, niekoľko prechodov všetkých testov bez jedinej chyby. Tak som nahodil desktop do normálneho systému, nech to počíta. "Starý" server a desktop teda boli vybavené. Nový sekundárny server zo starého hardware ale musel byť kompletne nainštalovaný. Ako inak, Debian. Dva servery sú inak špica vec, ak chce niekto budovať spoľahlivú infraštruktúru. Tak som sa začal hrať s tým. Druhý DNS server, NTP server, sekundárny LDAP server, sekundárny Kerberos server a nakoniec aj sekundárny DHCP. Naučil som sa pritom veľa nových vecí... celkom dobrý pocit som z toho mal.

A potom to prišlo...

Andromeda je meno desktopového stroja. Teda toho s novou doskou, procesorom a pamäťou. Po asi 2 týždňoch chodu (a služby BOINCu) začal čudne padať. Niekedy zhučal len Firefox. Niekedy zase Thunderbird. Niekedy potom nešli znovu naštartovať až do rebootu, ale niekedy to išlo. No a jeden večer celá mašina vytuhla a tuhla potom už aj pri ďalších bootoch. Už sa to ani nerozbehlo...

To už som samozrejme tušil, že tie problémy neboli náhodné. Tak som opäť spustil memtest. Ten istý, čo som spúšťal po skompletovaní stroja. No a bolo to tam. Po pár minútach hlásil chyby. Skúsim Prime95, v nastavení na záťaž CPU - ten beží niekoľko hodín bez chyby. Takže pamäť. S opakovaním testov sa dokonca čas skracoval. Otváram skrinku, vyberám pamäte, prezerám, nič zvláštne nevidno. Poriadne zas nasadím do slotov, skontrolujem, že všetko dolieha. Rozbieham zase memtest - chyby. Mením v BIOSe časovanie modulov, frekvencie. Stále chyby. Zase otváram skrinku. Vyberám modul číslo 2 zo slotu číslo 2 a nechávam len modul číslo 1 v slote číslo 1. Rozbieham znova memtest. Žiadna chyba, 2 kolá memtestu bez problémov. Tak mením moduly - vyberám modul číslo 1 a dávam do slotu čislo 1 modul číslo 2. Memtest hlási chybu okamčite po spustení... Takže je to jasné - jeden pamäťový modul z dual-channel kitu je zlý. Ale nebol zlý hneď. No čo, veď sa môže stať, aj keď OCZ by mali byť ručne testované...

Tak ideme reklamovať. Smola. Je to jeden kit, takže obidva moduly musím dať na reklamáciu spolu. A Andromeda je bez pamäte. Druhé 2 stroje používajú totiž pamäte DDR2, takže dočasný presun neprichádza do úvahy.

No a do tohotu máme čínske špecifiká reklamácie. Je to síce čínsky NewEgg, takže na činske pomery celkom seriózna firma... ale po anglicky nekomunikujú, tak som tam musel vyslať manželku. A tak mi volá na mobil: Musia najprv zistiť, či to je naozaj zlé, lebo už uplynulo viac ako 7 dní od kúpy (asi do 7 dní by nič nezisťovali a predali to niekomu inému, alebo čo... radšej ani nechcem vedieť, lebo by to znamenalo, že s vysokou pravdepodobnosťou nie som prvý majiteľ). Hovorím: Na to som tam pribalil tam ten popis po anglicky, to môžu testnúť velice rýchlo. A žena, že keď to potvrdia, tak mi to vymenia za iný kus, ale bude to trvať 2 až 15(!) dní. No čas je fakt fasa, keď ja to tým testom viem zistiť do pár minút... Ale hovorím jej: ďalší problem je, že túto konkrétnu pamäť už nemajú na sklade (tak ju asi ani nemajú za čo vymeniť). A že čo potom, či sa to nedá nejako zameniť za iný tovar v približne rovnakej cene, keď pôvodný nemajú... Bla-bla-bla a žena hovorí do telefónu "my dear!", vraj keď to nemajú, tak to skúsia opraviť a až keď to nebudú môcť opraviť, tak vrátia peniaze. Tak to som si aj ja povedal "my dear", keď som si predstavil Číňana s letovačkou v ruke, ako sa skláňa nad DDR3 modulom od OCZ a skúša ho "opraviť". Koniec.

Tak a už je to týždeň a som bez pamätí. A zatiaľ vypredávajú aj tie iné pamäte, ktoré zatiaľ majú... Potom budem fakt vysmiaty jak lečo, keď mi vrátia 799 junákov a komp bude ďalej mŕtvy bez pamäte, lebo žiadna nebude na sklade. Idú Vianoce a Nový Rok, takže predpokladám, že výrobcovia prioritne zásobujú americký a európsky trh a do Číny idu teraz iba ohlodané koštiale (sem zas budú valiť tovar pred činskym novým rokom). Takže šanca, že sa tovar za 2 týždne minie a nový nebude, tu je. Mohol som síce zariskovať a kúpiť rovno tie iné pamäte s tým, že aj tak mi nakoniec tie peniaze vrátia, kedže reálne sa zlý pamäťový modul opraviť nedá... Ale zase možno to niekde vymenia u distribútora, alebo náhodou dostanú novú zasielku a za tie 2 týždne ich už fakt budú mať - a potom by som mal jedny pamäte navyše a 799 junákov v prdeli. Nie že by mi tie peniaze nejako extra chýbali, ale považujem to za plytvanie.

Najviac ma deprimuje tá bezmocnosť. Človek to aj nejako otestuje, keď je to nové, vtedy to beží a prdne to až neskôr. Jeden deň základných testov zjavne nestačí, až 2 týždne behu BOINC preklepnú mašinu poriadne. A to som mal možno ešte šťastie v nešťastí, že tak zaťažujem stroj, že to zlyhalo tak skoro (síce v mojom prípade mohlo radšej už do 7 dní, no ale čo už). Viem si predstaviť, že priemernému "pro-green" užívateľovi by to odišlo až mesiac po uplynutí záručnej doby... Zase sa raz potvrdilo, že kvalita dnešných produktov smeruje do riadnej... teda má klesajúcu tendenciu som chcel napísať.

A tak si čakám a čakám. Včera som poprosil manželku, nech ich pingne telefónom. Z odpovede nie som múdry. Niekam tie pamäte poslali. Žena sa vyjadrila v takom zmysle, že "do opravy", tak ja len dúfam, že to išlo k výrobcovi alebo distribútorovi a že najneskôr o týždeň dostanem také isté pamäte. Pod stromček. Tak uvidíme... Ak ma dovtedy netrafí šľak.

Your rating: Žiadna Average: 2 (3 votes)

Šľak ma ide trafiť - 2!!!

Obrázok používateľa Palo M.

Tak, to ešte nie je všetko. Poslednú noc mi zhučal aj 1.5 TB Seagate na serveri. Ten mám od februára tohto roku. Disk sa zdá byť na prvý pohľad OK, aj S.M.A.R.T. status je celkom v poriadku, ale disk sa z ničoho nič zrazu odpojí zo SATA portu, čím úplne zmizne zo systému. Systém ako taký mám síce na RAID1, ale niektoré iné časti súborového systému sú nemirrorované, tiež mi tam bežia virtuálne stroje cez Xen, takže to skončí zablokovaním systému a mašinu treba natvrdo vypnúť. Čo samozrejme nechá root-filesystém v nekonzistentnom stave a ďalší štart zase zbieha fsck, ktorý často vyžaduje manuálnu akciu...

Tie 2 grafy v tomto blogu boli linkované práve z toho servera, takže už nie sú vidieť.

Mňa asi naozaj trafí šľak!

No Palo tak to ti teda

Obrázok používateľa Duro Kotulic Bunta

No Palo tak to ti teda nezavidim, staci ked si spomeniem na moje trapenie s odchadzajucim zdrojom a (mozno) hardiskom pred tristvrte rokom, a hned ma prechadzaju vsetky chutky na upgrade, co funguje to nemenim.. Anyway, vyries, dufam, ze Cinosi ti neposlu "opravenu" RAMku... :)

It is by logic that we prove, but by intuition that we discover. [J. H. Poincaré, mathematician (1854-1912)]

eBay

Obrázok používateľa slavko.sk

A co tak kupit to radsej na eBay, sem to ide mesiac ale tam by to mohlo dojst hned.

Voľby prehliadania komentárov

Vyberte si, ako chcete zobrazovať komentáre a kliknite na "Uložiť zmeny".