எக்செல் இல் அவுட்லியர்ஸ் செயல்பாட்டை எவ்வாறு பயன்படுத்துவது (ஏன்)
உங்கள் தரவுகளில் உள்ள பெரும்பாலான மதிப்புகளை விட கணிசமாக அதிகமாகவோ அல்லது குறைவாகவோ இருக்கும் ஒரு மதிப்பு வெளிநாட்டவர். தரவைப் பகுப்பாய்வு செய்ய எக்செல் பயன்படுத்தும் போது, வெளிநாட்டவர்கள் முடிவுகளைத் தவிர்க்கலாம். எடுத்துக்காட்டாக, தரவு தொகுப்பின் சராசரி சராசரி உங்கள் மதிப்புகளை உண்மையாக பிரதிபலிக்கும். உங்கள் வெளியீட்டாளர்களை நிர்வகிக்க உதவுவதற்கு எக்செல் சில பயனுள்ள செயல்பாடுகளை வழங்குகிறது, எனவே பார்ப்போம்.
ஒரு விரைவான எடுத்துக்காட்டு
கீழேயுள்ள படத்தில், வெளியீட்டாளர்களைக் கண்டறிவது எளிதானது-எரிக்கு ஒதுக்கப்பட்ட இருவரின் மதிப்பு மற்றும் ரியானுக்கு ஒதுக்கப்பட்ட 173 மதிப்பு. இது போன்ற ஒரு தரவுத் தொகுப்பில், அந்த வெளியீட்டாளர்களை கைமுறையாகக் கண்டறிந்து கையாள்வது போதுமானது.
ஒரு பெரிய தரவுத் தொகுப்பில், அது அப்படி இருக்காது. வெளியீட்டாளர்களைக் கண்டறிந்து புள்ளிவிவரக் கணக்கீடுகளிலிருந்து அவற்றை அகற்றுவது முக்கியம் - இதுதான் இந்த கட்டுரையில் எப்படி செய்வது என்று நாங்கள் பார்ப்போம்.
உங்கள் தரவுகளில் வெளியீட்டாளர்களை எவ்வாறு கண்டுபிடிப்பது
தரவு தொகுப்பில் வெளியீட்டாளர்களைக் கண்டுபிடிக்க, பின்வரும் படிகளைப் பயன்படுத்துகிறோம்:
- 1 வது மற்றும் 3 வது காலாண்டுகளைக் கணக்கிடுங்கள் (அவை கொஞ்சம் கொஞ்சமாக இருப்பதைப் பற்றி நாங்கள் பேசுவோம்).
- இடைநிலை வரம்பை மதிப்பிடுங்கள் (நாங்கள் இதை இன்னும் கொஞ்சம் கீழே விளக்குவோம்).
- எங்கள் தரவு வரம்பின் மேல் மற்றும் கீழ் எல்லைகளைத் திருப்புக.
- வெளிப்புற தரவு புள்ளிகளை அடையாளம் காண இந்த எல்லைகளைப் பயன்படுத்தவும்.
இந்த மதிப்புகளைச் சேமிக்க கீழே உள்ள படத்தில் காணப்படும் தரவுத் தொகுப்பின் வலதுபுறத்தில் உள்ள செல் வரம்பு பயன்படுத்தப்படும்.
தொடங்குவோம்.
படி ஒன்று: காலாண்டுகளை கணக்கிடுங்கள்
உங்கள் தரவை காலாண்டுகளாகப் பிரித்தால், அந்த செட் ஒவ்வொன்றும் ஒரு காலாண்டு என்று அழைக்கப்படுகிறது. வரம்பில் மிகக் குறைந்த 25% எண்கள் 1 வது காலாண்டு, அடுத்த 25% 2 வது காலாண்டு மற்றும் பலவற்றை உருவாக்குகின்றன. இந்த நடவடிக்கையை நாங்கள் முதலில் எடுத்துக்கொள்கிறோம், ஏனென்றால் ஒரு வெளிநாட்டவரின் மிகவும் பரவலாகப் பயன்படுத்தப்படும் வரையறை ஒரு தரவு புள்ளியாகும், இது 1 வது காலாண்டுக்குக் கீழே 1.5 க்கும் மேற்பட்ட இடைநிலை வரம்புகள் (IQR கள்), மற்றும் 3 வது காலாண்டுக்கு மேலே 1.5 இடைநிலை வரம்புகள். அந்த மதிப்புகளைத் தீர்மானிக்க, முதலில் குவார்டைல்கள் என்ன என்பதைக் கண்டுபிடிக்க வேண்டும்.
குவார்டைல்களைக் கணக்கிட எக்செல் ஒரு QUARTILE செயல்பாட்டை வழங்குகிறது. இதற்கு இரண்டு தகவல்கள் தேவை: வரிசை மற்றும் குவார்ட்.
= QUARTILE (வரிசை, குவார்ட்)
தி வரிசை நீங்கள் மதிப்பிடும் மதிப்புகளின் வரம்பு. மற்றும் இந்த குவார்ட் நீங்கள் திரும்ப விரும்பும் குவார்டைலைக் குறிக்கும் எண் (எ.கா., 1 வது காலாண்டுக்கு 1, 2 வது காலாண்டுக்கு 2 மற்றும் பல).
குறிப்பு: எக்செல் 2010 இல், மைக்ரோசாப்ட் QUARTILE.INC மற்றும் QUARTILE.EXC செயல்பாடுகளை QUARTILE செயல்பாட்டின் மேம்பாடுகளாக வெளியிட்டது. எக்செல் பல பதிப்புகளில் பணிபுரியும் போது QUARTILE மிகவும் பின்தங்கிய இணக்கத்தன்மை கொண்டது.
எங்கள் எடுத்துக்காட்டு அட்டவணைக்கு வருவோம்.
1 வது காலாண்டில் கணக்கிட, செல் F2 இல் பின்வரும் சூத்திரத்தைப் பயன்படுத்தலாம்.
= QUARTILE (பி 2: பி 14,1)
நீங்கள் சூத்திரத்தை உள்ளிடுகையில், எக்செல் குவார்ட் வாதத்திற்கான விருப்பங்களின் பட்டியலை வழங்குகிறது.
3 வது காலாண்டைக் கணக்கிட, செல் F3 இல் முந்தையதைப் போன்ற ஒரு சூத்திரத்தை உள்ளிடலாம், ஆனால் ஒன்றிற்கு பதிலாக மூன்றைப் பயன்படுத்தலாம்.
= QUARTILE (பி 2: பி 14,3)
இப்போது, கலங்களில் காட்டப்படும் காலாண்டு தரவு புள்ளிகள் கிடைத்துள்ளன.
படி இரண்டு: இண்டர்கார்டைல் வரம்பை மதிப்பிடுங்கள்
உங்கள் தரவுகளில் 50% மதிப்புகளின் இடைநிலை வரம்பு (அல்லது IQR) ஆகும். இது 1 வது காலாண்டு மதிப்புக்கும் 3 வது காலாண்டு மதிப்புக்கும் உள்ள வித்தியாசமாக கணக்கிடப்படுகிறது.
1 வது காலாண்டில் இருந்து 3 வது காலாண்டில் இருந்து கழிக்கும் ஒரு எளிய சூத்திரத்தை செல் F4 இல் பயன்படுத்தப் போகிறோம்:
= F3-F2
இப்போது, எங்கள் இடைநிலை வரம்பு காட்டப்படுவதைக் காணலாம்.
படி மூன்று: கீழ் மற்றும் மேல் எல்லைகளைத் திருப்புக
கீழ் மற்றும் மேல் எல்லைகள் நாம் பயன்படுத்த விரும்பும் தரவு வரம்பின் மிகச்சிறிய மற்றும் மிகப்பெரிய மதிப்புகள். இந்த வரம்புக்குட்பட்ட மதிப்புகளை விட சிறியதாகவோ அல்லது பெரியதாகவோ இருக்கும் எந்த மதிப்புகளும் வெளிநாட்டவர்கள்.
IQR மதிப்பை 1.5 ஆல் பெருக்கி, அதை Q1 தரவு புள்ளியிலிருந்து கழிப்பதன் மூலம் செல் F5 இல் குறைந்த வரம்பைக் கணக்கிடுவோம்:
= F2- (1.5 * F4)
குறிப்பு: இந்த சூத்திரத்தில் உள்ள அடைப்புக்குறிகள் தேவையில்லை, ஏனெனில் கழித்தல் பகுதிக்கு முன் பெருக்கல் பகுதி கணக்கிடப்படும், ஆனால் அவை சூத்திரத்தை எளிதாக படிக்க வைக்கின்றன.
செல் F6 இல் உள்ள மேல் வரம்பைக் கணக்கிட, நாங்கள் மீண்டும் IQR ஐ 1.5 ஆல் பெருக்குவோம், ஆனால் இந்த முறை கூட்டு இது Q3 தரவு புள்ளியில்:
= F3 + (1.5 * F4)
படி நான்கு: வெளியீட்டாளர்களை அடையாளம் காணவும்
இப்போது எங்களுடைய அடிப்படை தரவு அனைத்தும் அமைக்கப்பட்டுள்ளதால், எங்கள் வெளிப்புற தரவு புள்ளிகளை அடையாளம் காண வேண்டிய நேரம் இது - குறைந்த வரம்புக்குட்பட்ட மதிப்பை விட குறைவாகவோ அல்லது மேல் வரம்புக்குட்பட்ட மதிப்பை விட அதிகமாகவோ இருக்கும்.
இந்த தர்க்கரீதியான சோதனையைச் செய்ய OR செயல்பாட்டைப் பயன்படுத்துவோம், மேலும் பின்வரும் சூத்திரத்தை செல் C2 இல் உள்ளிடுவதன் மூலம் இந்த அளவுகோல்களை பூர்த்தி செய்யும் மதிப்புகளைக் காண்பிப்போம்:
= அல்லது (பி 2 $ எஃப் $ 6)
அந்த மதிப்பை எங்கள் C3-C14 கலங்களில் நகலெடுப்போம். ஒரு உண்மையான மதிப்பு ஒரு வெளிநாட்டவரைக் குறிக்கிறது, நீங்கள் பார்க்கிறபடி, எங்கள் தரவில் இரண்டு கிடைத்துள்ளன.
சராசரி சராசரியைக் கணக்கிடும்போது வெளியீட்டாளர்களைப் புறக்கணித்தல்
QUARTILE செயல்பாட்டைப் பயன்படுத்தி, IQR ஐக் கணக்கிட்டு, வெளிநாட்டவரின் மிகவும் பரவலாகப் பயன்படுத்தப்படும் வரையறையுடன் செயல்படுவோம். இருப்பினும், மதிப்புகளின் வரம்பிற்கான சராசரி சராசரியைக் கணக்கிடும்போது மற்றும் வெளியீட்டாளர்களைப் புறக்கணிக்கும்போது, பயன்படுத்த விரைவான மற்றும் எளிதான செயல்பாடு உள்ளது. இந்த நுட்பம் முன்பு போல ஒரு வெளிநாட்டவரை அடையாளம் காணாது, ஆனால் இது எங்கள் வெளிப்புற பகுதியை நாம் கருத்தில் கொள்ளக்கூடியவற்றுடன் நெகிழ்வாக இருக்க அனுமதிக்கும்.
எங்களுக்கு தேவையான செயல்பாடு TRIMMEAN என அழைக்கப்படுகிறது, அதற்கான தொடரியல் கீழே காணலாம்:
= டிரிம்மியன் (வரிசை, சதவீதம்)
தி வரிசை நீங்கள் சராசரியாக விரும்பும் மதிப்புகளின் வரம்பு. தி சதவீதம் தரவு தொகுப்பின் மேல் மற்றும் கீழ் இருந்து விலக்க வேண்டிய தரவு புள்ளிகளின் சதவீதம் (நீங்கள் அதை ஒரு சதவீதம் அல்லது தசம மதிப்பாக உள்ளிடலாம்).
சராசரியைக் கணக்கிடவும், 20% வெளிநாட்டவர்களை விலக்கவும் எங்கள் எடுத்துக்காட்டில் செல் D3 இல் கீழே உள்ள சூத்திரத்தை உள்ளிட்டுள்ளோம்.
= டிரிம்மியன் (பி 2: பி 14, 20%)
வெளியீட்டாளர்களைக் கையாளுவதற்கு உங்களுக்கு இரண்டு வெவ்வேறு செயல்பாடுகள் உள்ளன. சில அறிக்கையிடல் தேவைகளுக்காக அவற்றை நீங்கள் அடையாளம் காண விரும்பினாலும் அல்லது சராசரி போன்ற கணக்கீடுகளிலிருந்து அவற்றை விலக்க விரும்பினாலும், எக்செல் உங்கள் தேவைகளுக்கு ஏற்ற ஒரு செயல்பாட்டைக் கொண்டுள்ளது.