Data Smoothing Definition & Example
Maths Tutorial: Smoothing Time Series Data (statistics)
جدول المحتويات:
ما هو:
تجانس البيانات هي تقنية إحصائية تنطوي على إزالة القيم المتطرفة من مجموعة بيانات من أجل جعل نمط أكثر وضوحا.
كيف يعمل (مثال):
على سبيل المثال ، دعنا نقول أن الجامعة تقوم بتحليل بيانات الجريمة الخاصة بها على مدى السنوات العشر الماضية. يبدو أن عدد جرائم العنف شيء من هذا القبيل:
كما ترون ، في معظم الأوقات ، تمر الجامعة بأقل من 15 جريمة في السنة. ومع ذلك ، في عام 2006 و 2007 ، واجهت 44 نتيجة لمتطلبات الإبلاغ التجريبية من قبل فريق السلامة العامة بالجامعة. غيرت تجربة الإبلاغ تعريف جريمة العنف لتشمل سرقة من أي نوع خلال تلك السنوات ، مما أدى إلى ارتفاع كبير في عدد الجرائم "العنيفة" في الحرم الجامعي. إذا قمنا بتضمين هذه السنوات في المتوسط - أي إذا قمنا ببعض تجانس البيانات - فقد واجهت الجامعة ما معدله حوالي 19 جريمة عنيفة في السنة. ولكن إذا تركنا تلك السنوات ، يمكننا أن نرى أن المتوسط الأكثر واقعية هو 13 جريمة عنيفة في السنة - فرق بنسبة 32٪.
لماذا الأمر يهم:
هناك العديد من الطرق لتسهيل البيانات ، بما في ذلك استخدام المتوسطات والخوارزميات. والفكرة هي أن تنعيم البيانات يجعل الأنماط أكثر وضوحًا وبالتالي يساعد في التنبؤ بالتغيرات في أسعار الأسهم أو اتجاهات العملاء أو أي معلومات أخرى متعلقة بالعمل. ومع ذلك ، فإن تجانس البيانات يمكن أن يغفل المعلومات الأساسية أو يجعل الحقائق المهمة أقل وضوحا ؛ وبعبارة أخرى ، يمكن أن يؤدي "تقريب الحواف" للبيانات إلى الإفراط في التركيز على بيانات معينة وتجاهل البيانات الأخرى.