Outliers, vyděděnci

Jsou lidé, kteří dosahují výsledků, nebo jich dosahují takovým způsobem, že se to se vymykají zdravému rozumu i statistikám. Nezapadají do normální společnosti (či skupiny lidí) a jejích pravidel. Ve statistice se nazývají termínem outliers (v češtině překládáno jako odlehlé body). Já je zde budu nazývat vyděděnci; tento název totiž slušně indikuje, že prostě nezapadají do normální většnové společnosti.

Samozřejmě, že odlišnost od normálu jde na obě strany. Existují vyděděnci, kteří jsou v něčem totální dřeva a existují vyděděnci, kteří jsou v něčem naprosto excelentními.

Hledáním vyděděnců se zabývají statistici, lovci talentů nebo lovci nových klientů do psychiatrické léčebny, lovci senzačních článků do bulváru, a, samozřejmě, také lídři či manažeři. Ti poslední proto, aby negativního vyděděnce eliminovali, a tomu pozitivnímu přidělili více práce. Ostatně leadership, a je jedno, zda na osobní nebo organizační úrovni, je obzvláště o tom, dosahování excelentních výsledků, nebo jejich dosahování takovým způsobem, že nad tím zůstává rozum stát.

Tento článek se zabývá tím, jak takového vyděděnce rozpoznat. Není to totiž zdaleka o tom, být nejlepší (nebo nejhorší). To není to správné kritérium.

Nalézt vyděděnce je ze statistického pohledu docela věda a jsou o tom napsány celé knihy (viz například Douglas M. Hawkins: Identification of Outliers). Úplně tím nejjednodušším postupem je postup, který zde ukáži a rovnou jej demonstruji na reálném příkladu.

Nedaleko Prahy se nachází jedna malá firma, která má 13 prodejců. Výkony prodejců (po jejich seřazení od nejmenšího k největšímu) za nějaké období jsou tyto: 0, 0, 0, 24, 80, 86, 110, 192, 195, 216, 252, 253, 480.

A teď otázka: patří extrémní výkony, tady 0 a 480, vyděděncům, nebo jsou to prostě jenom pouzí nejhorší a nejlepší prodejci?

V grafickém znázornění vypadají data a jejich histogram (četnost výsledků v určitých kategoriích) takto:

Výsledky prodejeHistogram prodeje

Z histogramu je na první pohled patrné, že prodeje od 0 do 300 jaksi zapadají do dané firmy, zatímco ten (ta) s prodejem 480 těm druhým docela utekl. Dá se však nazvat vyděděncem? Jedincem jakoby z jiné planety? Samozřejmě za předpokladu, že jsme si data ověřili a nejedná se o chybu.

Metoda explorativní analýzy dat, kterou v sedmdesátých letech minulého století vyvinul John Tukey jde na to poněkud vědečtěji, než jenom od oka.

Jak zjistit, zda se jedná o vyděděnce

1. krok: uspořádejte data od nejmenší po největší hodnotu.

0   0   0   24   80   86   110   192   195   216   252   253   480

2. krok: nalezněte kvartily. Jinak řečeno nalezněte takový bod (Q2), že polovina výsledků bude ležet vlevo a polovina vpravo. Totéž udělejte s levou a pravou polovinou a příslušné body označte Q1 (pro levou polovinu) a Q2 (pro pravou polovinu). (Poznámka: a právě body Q1, Q2, a Q3 se nazývají kvartily. Bráno zleva se do bodu Q1 nachází čtvrtina výsledků, do bodu Q2 polovina a do bodu Q3 tři čtvrtiny výsledků).

0   0   0   24   80   86   110   192   195   216   252   253   480
----------↑-----------------↑-----------------------↑------------------
            Q1                   Q2                            Q3

Q2 = 110. Šest hodnot je od Q2 vlevo a šest vpravo.

Q1 je bod vlevo od Q2, a to tam, kde jsou tři hodnotu od něj vlevo a tři vpravo. Leží na polovině cesty mezi 0 a 24, tedy Q1 = (0+24)/2 = 12.

Q3 je bod vpravo od Q2, a to tam, kde jsou tři hodnotu od něj vlevo a tři vpravo. Leží na polovině cesty mezi 216 a 252, tedy Q3 = (216+252)/2 = 468/2 = 234.

3. krok: vypočtěte tzv. interkvartilní rozsah IQR = Q3 - Q1. (Poznámka: Mezi body Q1 a Q3 se nachází 3/4-1/4 = 2/4 = 1/2 výsledků. Interkvartilní rozsah IQR tedy říká, jak je rozlehlá ta polovina výsledků, která se nachází okolo jakéhosi středu Q2. Právě v této oblasti o tomto rozsahu se nacházejí ty normální běžné výsledky.)

IQR = 234 - 12 = 222

4. krok: výsledky, které jsou menší, než Q1-1,5(IQR) nebo větší, než Q3 + 1,5(IQR), patří vyděděncům. (Poznámka: Jsou od normálních výsledků vzdáleni více, než 1,5(IQR). Statisticky vzato se jedná o extrémně nepravděpodobné výsledky vzhledem k tomu, kde se nachází jádro těch normálních.)

1,5.IQR = 333

Výsledky, které jsou menší, než 12 - 333 = - 321 (zřejmé tunelování) jsou na vyhození z firmy. Fuj vyděděncům! Naštěstí v dané firmě tací vyděděnci nejsou.

Výsledky, které jsou lepší, než 234 + 333 = 567 jsou na postavení pomníku za zásluhy. Sláva vyděděncům! Bohužel, v dané firmě tací vyděděnci nejsou. A není jím ani ten (ta) nejlepší.

Tak, a je to. Ve zkoumané firmě podle uvedeného kritéria žádní vyděděnci nejsou.

Pokud máte hodně dat, a nechcete se touto analýzou bavit ručně, využijte nějaký placený nebo volný statistický program. Počítání kvartilů má asi každý z nich. Určitě ty, které znám: SPSS, Statistica, Minitab.

Konec konců kvartily počítá i MS Excel či OpenOffice (LibreOffice) Calc s tím, že v nich se kvartily počítají trochu jiným způsobem, než bylo uvedeno výše, a než je standardem profesionálních statistických programů. Což pro praxi v zásadě moc nevadí, je však dobré to vědět.

Takže jsme to probrali teoreticky i prakticky na příkladu. Snad je to jasné. Pokud ne, zkuste si totéž přečíst jinde, třeba na wikipédii, nebo třeba tady. Ostatně takových článků je na internetu moc a moc. Pokud to nebude jasné ani pak, uvažte, zda náhodou v tomhle nejste vyděděncem, nebo vyděděnkyní; normální sdělení v určité oblasti jdou zcela mimo Vás :-)

Pojďme dál. Asi stojí za to se zabývat i tím, jak se stát pozitivním vyděděncem a jaké důsledky to může mít. Některé náměty k zamyšlení uvádím níže.

Jak se (ne)stát vyděděncem a jaké důsledky to může mít

Někteří lidé se domnívají, že nejlépe to jde tak, že jsou jedinými exempláři svého druhu. Guinessova kniha rekordů je takových unikátů plná. Není těžké být nejlepším v tom, co nikdo jiný nedělá. Zároveň však platí, že daný unikát je zároveň nejhorším i průměrným. V jedné jediné instanci totiž zcela ztrácí smysl hovořit o nějakém porovnávání s druhými.

Takže například nabarvit si vlasy na žluto fialovo puntíkované je sice jedinečné, unikátní, ale nejedná se o toho, kdo se v něčem měřitelném odpoutal od normálního davu. Směrem dolu (dozadu), nebo nahoru (dopředu).

Typicky velký problém nastává u lídrů. Ve sportu jednoznačně platí, že jsou těmi nejlepšími. Pokud však hovoříme o lídrech ve smyslu vedení lidí, tak v daném případě se již nejedná o porovnávání svého výkonu s výkonem ostatních, ale o unikátnost: lídři dělají jinou práci, než druzí. Konkrétně tu, že napomáhají tomu, aby lidé dosahovali alespoň excelentních výsledků. Zápas o normální průměr není leadershipem, ale běžným provozem.

Být vyděděncem vlastním úsilím není, jak jsme viděli na příkladu výše, tak jednoduché, jako být jenom prvním. Ostatně vyděděnců může být i více. Takže se může stát, že někdo je třeba třetí a přitom je zároveň vyděděncem.

Nebýt vyděděncem alespoň v něčem, je, podle mě, deprimující. Dosahovat jenom normálních výsledků, dosahovat jich jenom normálním způsobe, žít jenom normální, průměrný = šedivý život, není, domnívám se, důvodem k jásotu. A kde není jásot, je místo pro co? Šeď až chmury.

Být vyděděncem nemusí být jenom příjemné. Například hodně moc, nebo hodně málo inteligentní lidé mají běžně problém s navazováním vztahů s normální, většinovou společností. Sdělují-li to, co mají na mysli způsobem, jak jim od přírody narostl zobák, málokdo jim rozumí. O jaké lidi jde? Přibližný výpočet (viz poznámka níže) Q1 = 90 Q3 = 110, to jest 1,5(IQR) = 30. To znamená, že podle našeho kritéria jsou vyděděnci lidé s IQ pod 60 a nad 140. Já takové vyděděnce ve své rodině mám, tedy sestru, pár dětí a zetě, a věřte mi, není pro ně úplně snadné se mnou, normálním člověkem, mluvit. Mě to problém nedělá; vždycky si řeknu, aby své IQ snížili a mluvili se mnou normálně. Což oni mohou, zatímco co já to svoje zvýšit nemohu. Takže já mám klid, protože nemohu, zatímco oni nepokoj, protože mohou. Opakuji, tedy, že být vyděděncem, třeba i pozitivním, nemusí být vždycky zcela příjemné či pohodlné.

Výpočet kvartilů u IQ vychází z toho, že rozdělení IQ populace je konstruováno s předpokladem, že jde o normální rozdělení (ve skutečnosti není, je na chvostech trochu jiné), a normováno tak, že má střední hodnotou 100 a směrodatnou odchylku 15. Z těchto údajů si lze ověřit správnost výpočtu IQR provedeného výše.

IQ distribuce

Poznámka: při porovnávání rozdílných věkových kategorií je navíc vhodné brát do úvahy tzv. Flynnův efekt. Dokladuje, že za posledních šedesát let, tj. od doby, kdy se měření IQ provádí, inteligenční kvocient u populace neustále narůstá. Tak o deset bodů za generaci. Proto se IQ testy neustále přizpůsobují tomu, aby rozdělení inteligence stále odpovídalo standardu (Mean = 100, StDev = 15). Což mimo jiné znamená, že pokud porovnáváte nějakého lidi mezi nimiž je významnější věkový rozdíl, ubezpečte se, že dělali ty samé testy. Pokud ne, tedy pokud je ten starší člověk dělal před desetiletími, srazte mu Flynnově efektu odpovídající počet bodů dolů.

Dalším argumentem proč nebýt vyděděncem, je ekologie. Pokud totiž chce člověk vyčnívat, může toho dosáhnout i tak, že on sám se sebou nedělá nic, nezlepšuje se, ale zaměří se na to, aby se těm druhým moc nedařilo. Příklady neuvádím, je jich všude, v byznysu, politice i jinde, habaděj.

Nejedná se jenom o ekologii směrem ven, ale i směrem k sobě. Ukazuje se, že pokud se někdo neustále srovnává s těmi druhými, způsobuje mu to fyzickou a duševní újmu (stres, úzkostné stavy, ...). To je poškozování živé bytosti, to je neekologické.

Takže jak toho dosáhnout vlastním přičiněním, ekologicky, slušně a udržitelně? Jediným způsobem, který jsem kdy kde v literatuře objevil, je soustředit se ne na výsledek (cíl), ale na samotný proces. Danou věc dělat s plnou koncentrací (nemyslet na budoucnost - cíl - jak to dopadne, ani na minulost, ale jen na tady a teď) a s plným nasazením všech svých zdrojů působících v synergii. Měřit to a neustále se v tom zlepšovat. A přesně tohle většina lidí, zdá se, nedělá (a společnost jim v tom svými různými žebříčky pořadí pomáhá). Tohle dělají ti, kteří jsou, nebo se stanou, pozitivními, slušnými, ekologickými a udržitelnými vyděděnci.


Za účelem lepšího uživatelského komfortu, analýz návštěvnosti a čtenosti článků používá Vedeme.cz soubory cookies, které se uloží do vašeho zařízení.

Ještě nemáte účet uživatele? Vytvořit účet

Přihlásit se