Skocz do zawartości

Losowe BSoDy przy grach / Wystąpił krytyczny błąd sprzętowy. Składnik: mostek północny firmy AMD [ROZWIĄZANY]


Michal0z

Rekomendowane odpowiedzi

Witam

 

Podczas grania w Wiedźmina 3 występowały BSoDy. Początkowo było wszystko dobrze. Przeszedłem prolog i kilka pierwszych zadań gry bez przeszkód. W którymś momencie przerywniki realizowane na silniku gry przestały się ładować poprawnie i zaczęły powodować restarty. Jakiś czas później spowodowało to, że gra przestała być w żaden sposób grywalna co więcej - teraz restarty zdarzają się także w zupełnie losowych momentach po kilku minutach lub nawet mniej niż minucie po wejściu do gry. Co jeszcze gorsze - restartu doświadczyłem też podczas gry w GTA V - które do tej pory chodziło absolutnie pięknie.

 

TECHNIKALIA:

 

Zacznę od tych mniej specyfikacyjnych:

 

Wiedźmin 3 digital, wersja z gog.com, zaktualizowana

ustawienia uber, ilość klatek: nieograniczona, okluzje otoczenia: HBAO+, hairworks: wł. rozdziałka 1680 @ 1050

 

GTA V, retail, również aktualne. ustawienia bardzo wysokie, wysokie (ale nie najwyższe) dystansy widoczności,

 

I Specyfikacja:

 

OS: Windows 7 Ultimate x64 SP1

MOBO: ASUS M5A78L-M LX V2

Procesor: AMD FX-4100 @ 3,6GHz (4 rdzenie)

Dyski: WD Caviar Black 1TB oraz WD 500gb (na tym jest system)

RAM: 2x 4gb @ 1600mhz Kingston HyperX

Karta Graficzna: Gigabyte GeForce GTX 970 OC, 4GB GDDR5 (256 Bit)

Sterownik do karty: Game Ready (Witcher 3): 18.05.15 w wersji 352.86

PSU: Chieftec 550W (GPS-550AB A)

 

Monitor: NEC MultiSync EA221wm (1680 @ 1050, nie używam innej w żadnym wypadku)

Mysz USB: Sweep

Klawiatura bezprzewod.: LOGITECH

Kontroler typu gamePAD:  HAMA Combat Bow

DVD: DVD RW ROM

AVG: Kaspersky Internet Security 2014 + MBAM - wszystko bez infekcji

 

Dodatkowe komentarze:

W dzienniku zdarzeń powstają wpisy Kernel-Power, WHEA-Logger ID 20:

 

Wystąpił krytyczny błąd sprzętowy.

Składnik: mostek północny firmy AMD
Źródło błędu: Wyjątek sprawdzenia komputera
Typ błędu: Przekroczenie limitu czasu oczekiwania licznika alarmowego funkcji HyperTransport
Identyfikator procesora: 0

 

Wcześniej miałem kartę graficzną Radeon HIS HD 5770. GTX 970 kupiłem z linku podanego wyżej na okazję premiery GTA V na pc, Wiedźmę dostałem do karty. Ponieważ zmieniłem producenta karty, za pomocą programu Driver Fusion usunąłem poprzednie sterowniki AMD, czego program nie usunął, doczyściłem ręcznie (DF podaje listę wpisów w rejestrze, które należy usunąć). Ostały się jedynie LEGACY AMDKMDAG oraz LEGACY AODDRIVER4.3, których nie można usunąć.

 

Jeśli chodzi o ocenę "na pierwszy rzut oka" - wydaje mi się, że sprzętowo wszystko jest (lub do przedwczoraj było) dobrze. System chodzi szybko, nie zawiesza się, dyski są we wzorowym stanie, GPU jest nowa, procesor też daje radę, brak overheatingu (przy okazji wymiany karty prezprowadzony został całkowity remont jednostki, włącznie z demontowaniem radiatorów, nakładaniem nowej pasty i uporządkowywaniem przewodów).

 

Jeśli miałbym strzelać, to widzę w tym: problem z procesorem (zupełnie oczywisty strzał), problem z ramem (minidumpy wskazują na NTOSKRNL.exe), za mało dostępnej mocy (kalkulator PSU podliczył całość pod obciążeniem na ok. 470 - 525W teoria) lub problem z mobo (wydaje mi się najmniej prawdopodobne, choć pewnie głównie dlatego, że to najbardziej kosztowna opcja).

 

Oczywiście wszystkie startowe informacje: log z sensors, screeny, minidumpy, zdarzenia z dziennika zdarzeń załączam (spakowane razem w .zip):

 

logi.zip

 

Dziękuję i oczekuję szybkiej odpowiedzi. Już nie raz korzystałem z tego forum i szybko uzyskiwałem fachową pomoc, liczę, że nic się na gorsze nie zmieniło :)

 

---------EDIT--------

Dziś otrzymałem odpowiedź z supportu CD Projekt RED:

 

Dzień Dobry!

 
Z tego co wynika z Pańskiego opisu, jest to problem z zainstalowanym software'm od Nvidii. 
Proszę spróbować odinstalować Nvidia Geforce Experience z panelu sterowania (nie cały sterownik, a tylko jego fragment jakim jest Geforce Experience), oczyścić rejestr z zalegających plików .dll po instalacji, zresetować komputer i włączyć grę jeszcze raz.
 
Proszę dać znać czy ta solucja pomogła, jeżeli nie, to poszukamy innego rozwiązania.

 

 

Mój oryginalny ticket:

 

 

Gra z rzadka minimalizuje się bez rzadnego ostrzeżenia ani powodu i pozostaje w takim stanie na zawsze. Jedynym sposobem na powrót do Temerii jest zakończenie procesu i ponowne uruchomienie gry. Jest to jednakowoż mniejszy problem, z którym ewentualnie da się żyć. Znacznie gorsze jest zawieszenie się i zrestartowanie systemu przy niemal każdej próbie załadowania się cutscenki. Czasem restartuje się tylko raz i przy następnej próbie wszystko działa, innym razem nim się uda, trzeba kilku prób, jest też jedno miejsce w lesie, po dotarciu do którego najprawdopodobniej powinna odgrywać się jakaś scenka, lecz ta nawet nie podejmuje próby załadowania się (inne pojawiają się na sekundę) - restartuje system za każdym jednym razem, co czyni to miejsce absolutnie niegrywalnym. Zresztą, wszystkie powyższe crashe czynią grę niegrywalną. Nie zauważyłem, żeby działo się to losowo podczas przemierzania terenu - problem występuje tylko przy cutscenkach i
sekcjach dialogowych. Za niemal każdym razem.
 Z początku było dobrze - bez problemu przeszedłem prolog i kilka początkowych zadań. Restarty zaczęły się od cutscenki znalezienia zniszczonego gniazda gryfa w Białym Sadzie i od tamtego czasu nieustępuje. Ustawienia graficzne na początku ustawiłem na UBER i nie zmieniałem ich, jedynie przy ostatnim patchu przestawiłem zmodyfikowane/nowo dodane opcje na to ustawienie. Gra chodzi bardzo dobrze i płynnie (~45-60 fps) nawet mimo mojego prehistorycznego procesora. Procesor nie przegrzewa się, jestem w stanie np. grać przez kilka godzin biegając po terenie lub grać w GTA V na najwyższych ustawieniach i nie uświadczam restartów.
Sterownik NVidia pobrany jest najnowszy Wicher 3 ready. Jestem prawie pewien, że problem ten ma związek z samą grą lub sterownikiem. W załączniku przesyłam również w pis z dziennika zdarzeń utworzony po ostatnim crashu, jeśli w czymś to pomoże.

 

Tak, wiem, że robi się z tego TL:DR...

 

Może powinienem spróbować sugerowanego przez support rozwiązania? (Tak, wiem, że będę musiał zrobić nowe, aktualne logi).

 

EDIT2: Wykonałem dezinstalację Nvidia GeForce Expirience + oczyszczenie rejestru (ccleaner) i wyniki są obiecujące. 10-15 min gry, biegania, ładowania cutscenek i... nic :) jakby delikatnie mniej FPS w niektórych momentach, ale ogólnie żadne niespodzianki nie wystąpiły sprawiając, że na 5 minut zapomniałem, że tylko testuję potencjalne rozwiązanie :)

 

Potestuję dalej - może trochę dłużej - lecz problem nadal pozostaje otwarty, tym bardziej, że usunięcie GeForce Expirience (którego używałem) jest bardzo nieurządzającym mnie, doraźnym obejściem, niż faktycznym naprawieniem problemu i bardzo liczę na to, że ów program jednak szybko powróci na mój sprzęt.

 

Log HWinfo sensors z próby po deinstalacji NGE: KLIK

 

EDIT3: Jednak po 30 minutach w losowym momencie wystąpił restart. Minidump dokładnie taki, jak poprzednie, w event logu też to samo. Rzuciłem okiem na logi z HWinfo - nie widzę, by coś się bardzo psuło z temperaturą, napięciami czy taktowaniami. Logi + dwa eventy dotyczące jakiejś usługi Nvidii: KLIK

Odnośnik do komentarza
Pomoc jest darmowa, ale proszę rozważ przekazanie dotacji na utrzymanie serwisu: klik.

Po krótkiej wymianie mailowej z działem pomocy technicznej CD Projekt RED, mój problem został przekazany developerom do testów i znalezienia potencjalnego rozwiązania. Gorąco polecam support "Redów" :) Jeśli macie jakiś ich produkt, to zaiste nie macie czego się obawiać! (In fact - uzyskałem od nich lepsze zainteresowanie, niż ze strony fixitpc, a myślałem że to właśnie Wasze forum jest jedynym zbawieniem w przypadku różnych kłopotów - tym bardziej na plus dla supportu "Redów")

 

Poza tym - zaktualizowałem sterowniki do chipsetu oraz BIOS w swojej płycie głównej (Asus M5A78L-M LX V2), w tym uaktualniłem sterownik AMD Northbridge oraz jeden ze składników Catalyst, który mogłem przez przypadek uszkodzić/usunąć przy okazji czyszczenia sterowników ATI (jak już wspominałem - wszystko powyższe dla spokojnej instalacji karty NVidii). Problem wydaje się już niewystępować a przynajmniej nie na tyle często, bym mógł to wykryć. Z braku czasu (a po 8 godzinach pracy fizycznej także i chęci) do gry niestety nie przetestowałem w pełni (tj np przez kilka godzin z rzędu), czy aktualizacje te odniosły skutek (w naprawieniu problemu, bo same w sobie jak najbardziej odniosły :) ).

Odnośnik do komentarza

Tu jest sporo problemów. Nie mam czasu i jestem zrypany po powrocie z pracy.

 

1. Dysk systemowy 500 GB - zarejestrowany jeden błąd transmisji danych na kablu sygnałowym - do sprawdzenia.

2. "Ostały się jedynie LEGACY AMDKMDAG oraz LEGACY AODDRIVER4.3, których nie można usunąć." - uruchom Usługi (services.msc) - AMD FUEL Service - Właściwości - Zatrzymaj - Typ uruchomienia Wyłączony - zastosuj - Enter. To powinno zablokować problem.

3. W BIOS (UEFI) włącz Virtualization - Czerwony opis SystemSummary.

4. W zdarzeniach Systemowych występuje błąd NVidii NvStreamSvc - odinstaluj przez Programy i funkcje.

5. Pobierz Display Driver Uninstaller DDU - KLIK - zainstaluj i nie uruchamiaj.

6. Deinstalacja sterowników grafiki (AMD, NV) robisz przez Programy i funkcje - restart do trybu awaryjnego przez F8 i odpalasz DDU - zaznaczasz co ma być wyczyszczone i postępujesz zgodnie z zaleceniami.

7. Twój największy problem - napięcie na linii +12 V spada do +9,8 V pod obciążeniem - do sprawdzenia przy pomocy miernika. Jeżeli potwierdzi wartość to zacznij od wymiany zasilacza.

 

I to by było na tyle pokrótce. Nie korzystam z żadnych gier.

Odnośnik do komentarza

Trochę czasu minęło, zanim mogłem pożyczyć miernik i miałem chwilę czasu na zrobienie testów i pomiarów.

 

Sprawa rysuje się następująco:

 

 

(...) zaktualizowałem sterowniki do chipsetu oraz BIOS w swojej płycie głównej (Asus M5A78L-M LX V2), w tym uaktualniłem sterownik AMD Northbridge oraz jeden ze składników Catalyst, który mogłem przez przypadek uszkodzić/usunąć przy okazji czyszczenia sterowników ATI (jak już wspominałem - wszystko powyższe dla spokojnej instalacji karty NVidii). Problem wydaje się już niewystępować (...)

 

To zrobiło swoje - BSODy już nie występują - potwierdziłem to kilkoma sesjami gry po 3-4 godziny każda + grałem przez dwie i pół godziny w Euro Truck Simulator 2 na najwyższych ustawieniach z nowym renderem oświetlenia - trochę "chrupie" raz na jakiś czas choć nie mogłem ustalić szczególnego powiązania z czymś, co się wtedy działo na ekranie ani też nie ustaliłem przyczyny (podejrzewam po prostu archaiczny procesor) ale BSODy również tu nie występują.

 

Jeśli chodzi o ten błąd transmisji - nie znalazłem jego źródła pochodzenia ani przyczyny. Nie szczególnie mnie on też martwi na razie. Skupiam się na lini +12 V.

 

I teraz - wskazania miernika. Nie wiem, może coś zrobiłem źle (korzystałem z pomocy TEJ instrukcji mierzenia napięć). Miernik to MASTECH MAS838 - pożyczony z pracy. Pomiar prowadziłem przez ok. pół minuty i zapisałem wartości, jakie zaobserwowałem. Wyniki mocno rozbieżne ze wskazaniami HWinfo:

 

IDLE:

Linia +3,3 V - 3,4 V

Linia +12 V - 12,02 V [zanotowałem też przez jakieś pół sekundy 11,84, ale może to być przez to, że mam bardzo drżące dłonie]

 

Obciążenie Wiesiek 3 (ok. 5 min po uruchomieniu gry - chodzenie, użycie znaku ognia, kręcenie kamerą)

 

Linia +3,3 V - 3,37 V [bez najmniejszych skoków]

Linia +12 V - 11,51 - 11,53 V

 

Jak widać, po 9,8 V ani śladu, choć mówię - mój pomiar do szczytu umiejętności technicznych nie należał, może pomierzyłem nie to, co trzeba. Napięcia mierzyłem na wtyczkach 20/24 PIN oraz 4 PIN, perfekcyjnie zgodnie z podaną instrukcją.

 

Dajcie znać, czy to wystarczy, aby uznać pomiar za wiarygodny. W razie czego dzisiaj mogę jeszcze pobawić się miernikiem. Jutro będzie potrzebny w miejscu, z którego pochodzi.

 

BTW: HW Info nadal upiera się przy swoim - w idle pokazuje nieco ponad 10V a w wieśku 9,8. Pomiar: KLIK (BSOD nie wystąpił)

 

Dziękuję za zainteresowanie

Odnośnik do komentarza

Wskazania HWInfo operują na wbudowanym w płytę czujniku a ten czasami nie jest wiarygodny. Zależy to od zastosowanego układu.

Stąd propozycja pomiaru miernikiem.

Skoro wyniki pomiaru są takie jak podałeś proponuję jeszcze sprawdzić +12 V na wtyku 4-pinowym przy procesorze (żółty + a czarny masa) oraz analogicznie na wtyku zasilania grafiki. Nie sądzę aby były inne ale warto to potwierdzić.

Odnośnik do komentarza

pobrać takowe należy ze strony producenta płyty głównej

 

Moje zdanie w tym przypadku jest odmienne.

Asus generalnie olewa aktualizacje sterowników. Twoje pochodzą z kwietnia 2010 roku.

Aktualne dla tego zestawu (AMD) - KLIK. Ale miałem z nimi problem na innym zestawie.

Pokaż jeszcze System Summary z HWInfo. Chcę zobaczyć wersję BIOS bo to również jest bardzo ważne.

Odnośnik do komentarza

Jeśli chcesz dodać odpowiedź, zaloguj się lub zarejestruj nowe konto

Jedynie zarejestrowani użytkownicy mogą komentować zawartość tej strony.

Zarejestruj nowe konto

Załóż nowe konto. To bardzo proste!

Zarejestruj się

Zaloguj się

Posiadasz już konto? Zaloguj się poniżej.

Zaloguj się
  • Ostatnio przeglądający   0 użytkowników

    • Brak zarejestrowanych użytkowników przeglądających tę stronę.
×
×
  • Dodaj nową pozycję...