2009-09-23 5 views
6

Je suis confronté à un énorme problème depuis quelques semaines. J'ai une application asp.net hébergée sous IIS7 (W2008 SP1), et toutes les deux heures, elle commence à consommer près de 50% du CPU quand il n'y a peut-être plus d'utilisateurs connectés. Il est compréhensible que nous utilisions Quartz.net pour effectuer des recopies d'application, mais nous n'avons pas encore réussi à reproduire le problème.ASP.NET: Utilisation élevée du processeur sans charge

Voici une trace faite avec JetBrains dotTrace 3.1 alors que la CPU était élevée: http://mycenter.info/tmp/DotTraceSnapshot.zip

Habituellement, la CPU est le processus de perdre w3wp.exe, mais dans les derniers jours couple SQLServer (2008) et memcached (1.2. 1, et mis à jour lundi à 1.2.4 bêta) étaient également en train de tuer le CPU. Il est bizarre qu'à certains moments, memcached commence à consommer 100% et que ses statistiques montrent qu'il est silencieux, mais cela fonctionne très bien lorsqu'une requête est faite.

Here's un vidage sur incident (ou vidage de la trace de la pile) de w3wp, en utilisant Windbg: (sur la base de ce guide: http://blogs.technet.com/marcelofartura/archive/2006/09/15/troubleshooting-iis-100-cpu-issues-step-by-step-intermediary.aspx)

0:000> ~ 
. 0 Id: 1be4.1d3c Suspend: 1 Teb: 7ffdf000 Unfrozen 
    1 Id: 1be4.b1c Suspend: 1 Teb: 7ffde000 Unfrozen 
    2 Id: 1be4.12a0 Suspend: 1 Teb: 7ffdd000 Unfrozen 
    3 Id: 1be4.19d0 Suspend: 1 Teb: 7ffdc000 Unfrozen 
    4 Id: 1be4.1714 Suspend: 1 Teb: 7ffd7000 Unfrozen 
    5 Id: 1be4.1a18 Suspend: 1 Teb: 7ffd6000 Unfrozen 
    6 Id: 1be4.12ac Suspend: 1 Teb: 7ffd5000 Unfrozen 
    7 Id: 1be4.dec Suspend: 1 Teb: 7ffd4000 Unfrozen 
    8 Id: 1be4.1e48 Suspend: 1 Teb: 7ffd8000 Unfrozen 
    9 Id: 1be4.1ca8 Suspend: 1 Teb: 7ffd3000 Unfrozen 
    10 Id: 1be4.1508 Suspend: 1 Teb: 7ffaf000 Unfrozen 
    11 Id: 1be4.1bc0 Suspend: 1 Teb: 7ffae000 Unfrozen 
    12 Id: 1be4.1f48 Suspend: 1 Teb: 7ffad000 Unfrozen 
    13 Id: 1be4.1994 Suspend: 1 Teb: 7ffac000 Unfrozen 
    14 Id: 1be4.1a48 Suspend: 1 Teb: 7ffab000 Unfrozen 
    15 Id: 1be4.12c8 Suspend: 1 Teb: 7ffa8000 Unfrozen 
    16 Id: 1be4.e44 Suspend: 1 Teb: 7ffa7000 Unfrozen 
    17 Id: 1be4.19e0 Suspend: 1 Teb: 7ffa6000 Unfrozen 
    18 Id: 1be4.19b0 Suspend: 1 Teb: 7ffa2000 Unfrozen 
    19 Id: 1be4.1b30 Suspend: 1 Teb: 7ffd9000 Unfrozen 
    20 Id: 1be4.1bfc Suspend: 1 Teb: 7ffa3000 Unfrozen 
    21 Id: 1be4.1be8 Suspend: 1 Teb: 7ffa1000 Unfrozen 
    22 Id: 1be4.1a54 Suspend: 1 Teb: 7ffa5000 Unfrozen 
    23 Id: 1be4.b74 Suspend: 1 Teb: 7ff3d000 Unfrozen 
    24 Id: 1be4.19b4 Suspend: 1 Teb: 7ff3c000 Unfrozen 
    25 Id: 1be4.1460 Suspend: 1 Teb: 7ffdb000 Unfrozen 
    26 Id: 1be4.1eac Suspend: 1 Teb: 7ffaa000 Unfrozen 
    27 Id: 1be4.1b90 Suspend: 1 Teb: 7ffa4000 Unfrozen 


0:023> #23s 
Search address set to 77dc9a94 
*** WARNING: Unable to verify checksum for SMDiagnostics.ni.dll 
*** WARNING: Unable to verify checksum for System.Data.ni.dll 
*** ERROR: Module load completed but symbols could not be loaded for Microsoft.Web.Services3.DLL 
*** WARNING: Unable to verify checksum for System.Windows.Forms.ni.dll 
*** WARNING: Unable to verify checksum for System.Web.ni.dll 
*** WARNING: Unable to verify checksum for Ademy.UI.Web.DLL 
*** ERROR: Module load completed but symbols could not be loaded for AjaxControlToolkit.DLL 
*** ERROR: Module load completed but symbols could not be loaded for 7zSharp.DLL 
*** WARNING: Unable to verify checksum for mscorlib.ni.dll 
*** ERROR: Module load completed but symbols could not be loaded for Iesi.Collections.DLL 
*** WARNING: Unable to verify checksum for System.Design.ni.dll 
*** WARNING: Unable to verify checksum for System.Core.ni.dll 
*** WARNING: Unable to verify checksum for Ademy.Event.DLL 
*** WARNING: Unable to verify checksum for System.ServiceModel.ni.dll 
*** ERROR: Module load completed but symbols could not be loaded for System.ServiceModel.ni.dll 
*** WARNING: Unable to verify checksum for App_Theme_Ocean.wgubmrqt.dll 
*** WARNING: Unable to verify checksum for NHibernate.Burrow.AppBlock.DLL 
*** ERROR: Module load completed but symbols could not be loaded for NHibernate.Burrow.AppBlock.DLL 
*** WARNING: Unable to verify checksum for NHibernate.Caches.SysCache2.DLL 
*** ERROR: Module load completed but symbols could not be loaded for NHibernate.Caches.SysCache2.DLL 
*** WARNING: Unable to verify checksum for Ademy.UI.Web.Controls.DLL 
*** WARNING: Unable to verify checksum for Microsoft.JScript.ni.dll 
*** WARNING: Unable to verify checksum for System.Web.Mobile.ni.dll 
*** WARNING: Unable to verify checksum for System.Runtime.Serialization.ni.dll 
     ^Memory access error in '#23s' 

0:023> kb 
ChildEBP RetAddr Args to Child    
11c6ede4 77dc8ed4 766bc622 0000038c 00000000 ntdll!KiFastSystemCallRet 
11c6ede8 766bc622 0000038c 00000000 11c6ee20 ntdll!NtSetEvent+0xc 
11c6edf8 011011ef 0000038c 7f52be6e 0fda4888 kernel32!SetEvent+0x10 
WARNING: Frame IP not in any known module. Following frames may be wrong. 
11c6ee20 71b26ffe 060c5f9c 010039b0 010628a0 0x11011ef 
*** WARNING: Unable to verify checksum for System.ni.dll 
11c6ee4c 712c4b14 02528958 060c5f9c 11c6ee94 mscorlib_ni+0x216ffe 
11c6ee5c 712c4abe 060c5fb0 02528958 060c600c System_ni+0x144b14 
11c6ee94 71679260 060c5d24 7167926d 060c5d24 System_ni+0x144abe 
11c6eec8 717d8373 060c5d24 11c6f3e8 712c4ce4 System_ni+0x4f9260 
11c6ef14 712c4ce4 00000000 02528930 11c6ef74 System_ni+0x658373 
11c6ef54 7129dbcb 098b6ac4 11c6efec 72f7eff8 System_ni+0x144ce4 
11c6efa4 71b26d66 02df349c 11c6efc0 71b45681 System_ni+0x11dbcb 
11c6efb0 71b45681 00000000 0dcfd2d8 11c6efd0 mscorlib_ni+0x216d66 
11c6efc0 72f11b4c 766b45f1 00000000 11c6f050 mscorlib_ni+0x235681 
11c6efd0 72f221f9 11c6f0a0 00000000 11c6f070 mscorwks!CallDescrWorker+0x33 
11c6f050 72f36571 11c6f0a0 00000000 11c6f070 mscorwks!CallDescrWorkerWithHandler+0xa3 
11c6f194 72f365a4 71a91ff0 11c6f2c8 11c6f1e8 mscorwks!MethodDesc::CallDescr+0x19c 
11c6f1b0 72f365c2 71a91ff0 11c6f2c8 11c6f1e8 mscorwks!MethodDesc::CallTargetWorker+0x1f 
11c6f1c8 7302a471 11c6f1e8 68e9b644 0dcfd2d8 mscorwks!MethodDescCallSite::CallWithValueTypes+0x1a 
11c6f394 7302a5c6 11c6f424 68e9b194 02df34e4 mscorwks!ExecuteCodeWithGuaranteedCleanupHelper+0x9f 
11c6f444 71b45577 11c6f3e8 02df17d0 01c177f8 mscorwks!ReflectionInvocation::ExecuteCodeWithGuaranteedCleanup+0x10f 

Merci d'avance pour toute pointe !!

MISE À JOUR:

Here's la pile réussi du fil pendu: je suis pensant qu'il ressemble fournisseur memcached, mais pas encore sûr que dois-je faire.

0:023> !clrstack 
OS Thread Id: 0xb74 (23) 
ESP  EIP  
11c6ee38 77dc9a94 [NDirectMethodFrameStandaloneCleanup: 11c6ee38] Microsoft.Win32.Win32Native.SetEvent(Microsoft.Win32.SafeHandles.SafeWaitHandle) 
11c6ee48 71b26ffe System.Threading.EventWaitHandle.Set() 
11c6ee54 712c4b14 System.Net.TimerThread.Prod() 
11c6ee64 712c4abe System.Net.TimerThread+TimerQueue.CreateTimer(Callback, System.Object) 
11c6eea0 71679260 System.Net.ConnectionPool.CleanupCallbackWrapper(Timer, Int32, System.Object) 
11c6eed4 717d8373 System.Net.TimerThread+TimerNode.Fire() 
11c6ef1c 712c4ce4 System.Net.TimerThread+TimerQueue.Fire(Int32 ByRef) 
11c6ef5c 7129dbcb System.Net.TimerThread.ThreadProc() 
11c6efac 71b26d66 System.Threading.ThreadHelper.ThreadStart_Context(System.Object) 
11c6efb8 71b45681 System.Threading.ExecutionContext.runTryCode(System.Object) 
11c6f3e8 72f11b4c [HelperMethodFrame_PROTECTOBJ: 11c6f3e8] System.Runtime.CompilerServices.RuntimeHelpers.ExecuteCodeWithGuaranteedCleanup(TryCode, CleanupCode, System.Object) 
11c6f450 71b45577 System.Threading.ExecutionContext.RunInternal(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object) 
11c6f46c 71b301c5 System.Threading.ExecutionContext.Run(System.Threading.ExecutionContext, System.Threading.ContextCallback, System.Object) 
11c6f484 71b26ce4 System.Threading.ThreadHelper.ThreadStart() 
11c6f6b0 72f11b4c [GCFrame: 11c6f6b0] 
11c6f9a0 72f11b4c [ContextTransitionFrame: 11c6f9a0] 

SOLUTION TROUVE:

Il est dû à un bogue dans 1.2.1 memcached pour Win32, lors de l'exécution sur Windows 2008. Je mis à jour v1.2.6 et tout fonctionnait. Je suppose que je voyais le processus w3wp parce que la bibliothèque que j'utilise pour me connecter à memcached a un processus de recyclage qui était suspendu, même si memcached répondait toujours.

SOLUTION 2 TROUVE:

Si la première solution ne fonctionne pas, s'il vous plaît lire THIS POST. Je suppose que la solution memcached cache juste le vrai problème, qui était un bug dans le SmtpClient.

Répondre

2

En windbg question:

~ * e clrstack

Cela videra toutes les piles de threads gérés et devrait vous donner une idée de ce qui se passe dans ce processus.

Également essayer un! Runaway, qui va vous montrer combien de temps chaque thread a été en cours d'exécution. Concentrez-vous sur les piles des fils supérieurs qui sont les plus longs.

+0

Merci! Le "~ * e! Clrstack" affiche "No export clrstack found" environ 20 fois, et le! Runaway montre que le thread (# 23/Id: 1be4.b74) a fonctionné pendant 10 minutes. Je ne connaissais pas cette commande, mais je pouvais comprendre que c'était la mauvaise suite aux étapes décrites dans l'article. Une autre idée? Comment puis-je faire fonctionner le ~ * e! Clrstack? –

+0

Merci! J'ai ajouté la pile managée à la question, mais ce n'est pas mon code qui consomme du CPU .. :( –

+0

J'ai trouvé la solution (voir ci-dessus), merci pour votre aide !! –

0

Est-ce que cela est peut-être dû à un problème de cache? Par exemple, disposez-vous d'un jeu de données mis en cache pour le recharger automatiquement à partir de la base de données à l'expiration?

Nous avons eu cette situation une fois. Nous avions un grand ensemble de données que nous voulions être toujours disponible. Les données ne changeaient pas si souvent, donc nous l'avons mis dans le cache avec une expiration de 1 heure, puis dans notre global.asax, nous avons manipulé la suppression (comme décrit here sans faire attention à l'avertissement décrit dans le lien.Nous avons rechargé l'ensemble de données dans le cache après l'heure écoulée, ce qui a entraîné une utilisation élevée du processeur et une utilisation élevée de la base de données toutes les heures.

modifier - a ajouté

Inutile de dire que nous avons vu rapidement et appris de notre erreur.

Questions connexes