بررسی آیتم ها و گراف های وضعیت سرور زبیکس
مقدمه
داده هایی در مورد نگهداری از زبیکس در خودش وجود دارد که آنها را درقالب آیتم، نمودار، تریگر نگهداری می کند و با برررسی آنها پایداری سیستم قابل دستیابی است. یک مدیرسیستم که از زبیکس نگهداری می کند باید پیاپی وضعیت سیستم مانیتورینگ خود را ضبط کرده و بررسی کند تا بتواند در مورد آیندهآن تصمیم گیری کند.
از طرفی زمانی که Agent های متنوع را به زبیکس متصل می کنید لازم است تا زودتر متوجه کمبود منابع آن شوید. ما در این مقاله قصد داریم به بررسی آیتم ها و گراف های وضعیت سرور زبیکس بپردازیم. پس با مجموعه تحلیل یار همراه باشید.
فضای مورد استفاده دیسک boot
همان طور که از نمودار کیکی بالا مشهود می باشد فضای استفاده شده ی یک پارتیشن به نام boot در حال نمایش است. این پارتیشن زمانی در گرافهای زبیکس دیده می شود که هنگام نصب سیستم عامل فضای پارتیشن boot را از فضای root (/) جدا کرده باشید.
میزان حافظه موقت استفاده شده (RAM/Memory Usage)
گراف زیر مجموع کل حافظه موقت موجود و حافظه استفاده نشده (خالی) را در یک نمودار نشان می دهد. از دیدن تصویر زیر تعجب نکنید. مخصوصا این تصویر قرار داده شده است. در ساعت 15:25 مقدار RAM اختصاص یافته به ماشین اضافه شده است(4GB). از این رو یک پرش در این مقدار ها داشته ایم. ماشین مورد نظر مجازی است پس نیاز به خاموش کردن نداشته است.
از این تصویر پیداست که عملیات Tuning در میزان فضای مورد استفاده از RAM انجام شده است.
فرایند ها در صف انتظار
تصویر زیر گویای این مطلب است که در زمان های متنوع چه تعداد فرایند (از فرایند های خود زبیکس) در صف انتظار قرار دارند. تا پردازنده در اختیار آنها قرار گیرد و بتوانند وظایف محول شده را به خوبی انجام دهند.
اگر فرایند های سرور زبیکس شما زیاد درصف انتظار باشند سرور شما کارایی خوبی در زمینه مانیتورینگ نخواهد داشت. چرا که اگر درخواست ها دیر سرور برسند باعث می شود در پارامتر های دریافت شده دقت کمتری مشاهده شود.
متریک های وضعیت پهنای باند عبوری کارت شبکه سرور زبیکس
پهنای باند سرور زبیکس بسیار مهم است. اگر پهنای باند عبوری زیاد باشد بهتر است چند کارت شبکه را با یکدیگر replicate یا همجوار کنیم تا پهنای باند عبوری را با یکدیگر به اشتراک بگذاریند.
متریک های کاربرد پردازنده سرور زبیکس (CPU Utilization)
این پارامتر میزان استفاده از CPU را بیان میکند و این مقدار بصورت تقریبی است که نشان میدهد که در هر لحظه چند درصد از زمان CPU درگیر فعالیت می باشد. از طرف دیگر در بازه زمانی فیلتر شده میانگین، حداقل و حداکثر استفاده را نشان می دهد.
متریک های مصرف پردازنده سرور زبیکس
میزان استفاده از زمان CPU را به تفکیک بیان میکند. مثلا اگر زمان CPU برای هسته (Kernel) سیستم عامل بیشتر استفاده شده باشد این سیستم در بخش پردازش های هسته سیستم سنگین می باشد اما اگر در حالت User بیشتر باشد متوجه می شویم که نرم افزار هایی که روی سیستم نصب شده و بر بستر هسته سیستم عامل در حال اجرا می باشند بار سنگینی را بر سیستم تحمیل می کنند. از این رو می توانیم محدوده پر مصرف را شناسایی کنیم.
یکی از تجربیات خود بنده زمانی بود که حافظه مجازی ساز دچار کمبود منابع گردید. و چیزی که مشاهده می شد افزایش زمان سیستم (system time) در این نمودار بود. چون سایر منابع تغییری نکرده بودند به این نتیجه رسیدم که اشکال از مجازی ساز است. CPU برای ادامه فعالیت خود نیاز به دیسک مجازی ساز داشت که آن هم منابع نداشت پس تنها انتظار می کشید که به این حافظه دسترسی پیدا کند. از این رو بیشتر زمان خود را صرف عوامل بیرونی میکرد و User Mode را درگیر نمی کرد.
متریک های جابجای پردازنده سرور زبیکس بین کارها
میزان پرش یا جابجایی پردازنده بین سایر پردازش ها از این نمودار بدست می آید. اگر این پرش ها زیاد باشند یعنی سیستم خیلی شلوغ می باشند و نیاز مند سبک تر شدن سیستم یا افزایش منابع سیستمی (پردازنده) هستیم. شاید هم نیاز باشد برخی پردازش های مخرب که کاربردی نیستند حذف گردند.
متریک های کارایی سرور زبیکس
تعداد پردازش در درثانیه و صف انتظار پردازش ها مواردی است که در این نمودار مشهود می باشد و کارایی پردازنده سیستم را به خوبی نشان می دهد.
متریک های درصد فعالیت پردازش های داخلی سرور زبیکس
سرور زبیکس پردازشی است که خود زیر پردازش هایی دارد و آن زیر پرداز ها (هرکدام) وظایف مستقلی دارند. از این رو برای هر کدام میزان حافظه و در صد فعالیت آن زیر پردازش مهم می باشد. از تصویر زیر میتوان درصد فعالیت پردازنده برای هرکدام را بدست آورد.
به عنوان نمونه Housekeeper پردازشی است که مسئول پاکسازی داده های قدیمی و بهینه سازی پایگاه داده می باشد. درواقع همان خانم خانه دار سرور زبیکس می باشد.
متریک های درصد فعالیت پردازش های داخلی جمع آوری کننده سرور زبیکس
مانند مورد قبل یکسری پردازش های مخصوص جمع آوری داده هستند و به دلیل اهمیت آنها نموداری مخصوص پردازش های جمع آوری داده فراهم می شود و می توانید وضعیت پردازشی خود زبیکس در زمینه جمع آوری داده را از این نمودار بررسی نمایید.
پردازش های داخلی زبیکس به شدت برای tuning زبیکس کاربرد دارند.
متریک های درصد استفاده از حافظه کش سرور زبیکس
زبیکس حافظه های کش متنوعی دارد که داده هایی را بصورت موقت در آنجا نگهداری می کند و در زمان های مناسب آنها را روی دیسک دخیره می کند و یا آن داده ها را بروز می نماید. تنظیمات تمام این پارامتر ها در فایل تنظیمات زبیکس (zabbix_server.conf) می باشد. در صورتی که در این نمودار هرکدام از آنها را بالاتر از خط trigger دیدید میتوانید در فایل مورد نظر آن را افزایش دهید. تا سرور زبیکس مورد نظر tune گردد. هرگاه این کش ها دچار کمبود شوند پردازش سرور زبیکس Down می شود و مجددا اقدا به اجرای خود می کند. اگر به قسمت لاگهای systemd رجوع کنید خواهید دید که سعی در اجرای مجدد خود دارد اما به دلیل کمبود منابع برای این پردازش نمی تواند خود را مجددا اجرا کند. پس در این موارد به فایل تنظیمات زبیکس (zabbix_server.conf) مراجعه کرده و پارامتر آن را به میزان مورد نیاز افزایش دهید.
دقت بفرمایید که باید به میزان مورد نیاز منابع RAM به سرور زبیکس اضافه کرده باشید تا بتوانید این منابع را ارتقاء دهید.
متریک های میانگین بار سیستم در سرور زبیکس
در سیستم های شبهه یونیکس ، از جمله لینوکس ، بار سیستم (System Load) اندازه گیری کار محاسباتی است که سیستم در حال انجام آن می باشد. این اندازه گیری به صورت یک عدد نمایش داده می شود که برای یک رایانه کاملاً بیکار میانگین بار 0 را نشان می دهد. هر فرآیند، یا در حال اجرا توسط پردازنده وی یا در انتظار منابع CPU است در این موارد برای هر فرایند یک عدد 1 را به میانگین بار اضافه می کند. بنابراین ، اگر سیستم شما دارای میانگین بار 5 باشد ، بدین معنی است که 5 فرآیند از CPU استفاده می کنند یا منتظرند تا CPU به کار آنها رسیدگی کند.
متریک های میزان استفاده حافظه swap در سرور زبیکس
حافظه swap یک بخش از حافظه بلند مدت (دیسک) است که آن را در اختیار سیستم عامل قرار می دهند و اگر افظه RAM دچار کمبود منابع شد تعدادی از داده های درون حافظه RAM را به این حافظه انتقال می دهند. این کار به منظور عدم اختلال در کار سیستم عامل است. در صورتی که حافظه RAM موجود نباشد تمام پردازش ها در انتظار دریافت حافظه می مانند و سیستم به اصطلاح Crash می کند و یا به معنی دیگر قفل می کند. این حافظه کمک می کند تا سیستم به جای قفل کردن کند شود. پس اگر مشاهده نمودید سیستم شما زیاد از حافظه swap استفاده می کند ram خود را ارتقاء دهید. این پارامتر در سیستم هایی که عملیات پردازشی انجام می دهند بسیار مخرب و رسیدگی به هدف را کند می کند.
هدف در سیستم های پردازشی سرعت بالا است و کندی خلاف این هدف می باشد.
متریک های خواندن و نوشتن روی دیسک سرور زبیکس
این نمودار میزان مراجعه به دیسک برای خواندن و نوشتن را نشان می دهد. در مثال زیر 212 بار (بصورت میانگین) روی دیسک داده نوشته و 4 بار (بصورت میانگین) از روی دیسک داده خوانده شده است. اگر سیستم شما پردازشی است و مراجعه آن به دیسک زیاد می باشد، در این موارد حافظه خود را از نوع NVME یا حداقل SSD قرار دهید تا سرعت مراجعه به دیسک افزایش یابد و در سیستم شما کندی احساس نشود.
متریک های وضعیت انتظار پردازنده برای خواندن و نوشتن از و یا روی دیسک سرور زبیکس
زمانی که نیاز به خواندن داده ها یا نوشتن داده ها از دیسک باشد زمان انتظار نیز حائز اهمیت می شود. در این مواقع نیز می توانید روی سرور هایی که نیاز به پردازش زیاد دارند از دیسک های نوع NVME یا حداقل SSD استفاده کنید.
متریک های وضعیت استفاده از دیسک و صف انتظار دیسک سرور زبیکس
میزان کاربرد دیسک و صف انتظار دیسک در این قسمت بسیار کاربردی می باشد.
متریک های وضعیت حافظه پارتیشن ریشه سرور زبیکس
همان طور که از نمودار کیکی پایین مشهود است فضای استفاده شده یک پارتیشن به نام / یا Root مشخص است. این فضا در زبیکس بصورت پیشفرض هر ساعت یک بار بررسی می شود (زمان جمع آوری داده های دیسک).
متریک های وضعیت پردازشهای سرور زبیکس
تعداد پردازش هایی که سیستم عامل سرور زبیکس در حال اجرا و حالت انتظار دارد در این قسمت قابل مشاهده می باشد.
متریک های کارایی حافظه RAM سرور زبیکس
این پارامتر میزان استفاده از حافظه Ram را نشان می دهد. حافظه Ram حافظه گرانی است پس نباید هدر رود. اگر مشاهده نمودید از این حافظه گران کم استفاده می شود می توانید بخشی از Ram را آزاد نموده و در مجازی ساز خود استفاده کنید.
در تصویر زیر میزان Ram سیستم عامل 4 گیگابایت بود که چون نزدیک به خط تریگر بود به 8 گیگابایت افزایش یافته است. از این رو به خوبی می توان زمان کمبود Ram و ارتقاع آن را مشاهده کرد.