Problème de stabilité introuvable du kernel 3.6.8 sur ASUS P53E

Au hasard, mais pas plus tard qu'après 10 heures de travail, l'ordinateur portable se fige. Il suffit de geler. Sachant que toutes les erreurs matérielles ne sont pas signalées à l'user, j'ai essayé netconsole. Malheureusement, le netconsole n'a pas produit quoi que ce soit au moment du gel.

La combinaison «BUSIER» ne fonctionne pas non plus lorsque le système se bloque.

La seule corrélation que j'ai trouvée est que d'habitude, à la prochaine mise sous tension (après la mise hors tension forcée), l'ordinateur portable consum 10W de plus de puissance. Mais je soupçonne qu'il pourrait par une concidence; ce comportement n'est pas limité aux time, lorsque le système a été mis sous tension après le gel. Après 1,5 (en moyenne) fois redémarrage, la consommation d'énergie est revenue à la normale.

  • Le problème persiste sur tous les kernelx 3.5.x – 3.7.1.
  • Le problème persiste avec WiFi désactivé.
  • L'ordinateur portable fonctionne très bien avec Windows XP (je n'ai jamais essayé 7 dessus)
  • Je n'ai jamais essayé Linux 32 bits sur cette machine.
  • J'utilise VirtualBox et VMWare. La suspension se produit également lorsqu'aucune machine virtuelle n'est activée, mais je sais que les deux programmes insèrent des modules du kernel.
  • J'utilise btrfs, dm-crypt, modem Huwavei E220, bluetooth et une tonne d'autres choses typiques pour un ordinateur portable.

  • Je collerai n'importe quel journal / file de configuration que vous jugerez nécessaire.

Quel est le prochain plan d'action pour résoudre ce problème de congélation?

Ne connaissant exactement rien sur les causes du problème, il y a un nombre presque infini de combinaisons à essayer. Mais peut-être certains d'entre vous sont plus expérimentés avec le matériel de debugging et peuvent suggérer des suspects habituels?

METTRE À JOUR:

Soupçonnant que le kernel principal non standard d'Ubuntu est un coupable, j'ai réinstallé tout le système, cette fois avec Mint14 qui est basé sur Ubuntu 12.10, qui à son tour est basé sur la famille de kernelx 3.5.x. Malheureusement, le même problème 🙁

MISE À JOUR 2:

La dissortingbution des events pendants semble être non-Poisson (c'est-à-dire parfois plus fréquemment, parfois less fréquemment), mais jusqu'à présent, je ne sais pas comment la corréler avec n'importe quel type d'événement. Cela arrive à la fois lorsque le portable est utilisé de façon interactive ou non. Cela se produit à la fois lorsque la memory est utilisée (et la page système est utilisée – zram dans mon cas) et lorsque la memory n'est utilisée qu'à 30%.

    Finalement, je suis entré dans quelque chose. Je ne suis pas sûr à 100%, mais il semble, que c'est un mauvais fonctionnement de la carte graphique embeddede Intel GMA HD3000. Le problème peut être déclenché lors de l'utilisation de capacités 3D pendant longtime.

    Le taux d'échec non-Poisson s'explique par le fait que parfois j'utilisais le compositing, et parfois non. J'ai juste échoué à corréler la composition avec les events suspendus.

    La raison pour laquelle je n'ai pas eu les problèmes sous Windows XP est maintenant évidente: Windows XP n'utilise pas le compositing, et je n'ai pas joué à des jeux dessus. Donc, aucune 3D n'était utilisée. Une fois que j'ai commencé un jeu, après quelques heures, l'adaptateur graphique s'est écrasé. Heureusement, Windows XP (contrairement à Linux) était capable de gérer le problème avec plus ou less de facilité et avec des parameters minimaux (16 colors, 480×640 resoultion), il m'a informé de la condition.

    Et maintenant, les pièces du puzzle vont bien, et rétrospectivement, je pense pouvoir confirmer que les problèmes sous Linux n'étaient présents que lorsque le compositing était activé.

    Je vais postr une autre question distincte sur la façon de diagnostiquer l'erreur de la carte graphique sous Linux.