Ulompi kaava | Poikkeamien laskeminen vaiheittain (esimerkin avulla)

Outlier-kaava tarjoaa graafisen työkalun tietolaskennan laskemiseksi, joka sijaitsee annetun jakelusarjan ulkopuolella, joka voi olla sisä- tai ulkopuoli muuttujista riippuen.

Mikä on outlier-kaava?

Poikkeama on tietyn näytteen tai havainnon tietopiste tai jakaumassa, jonka on oltava kokonaiskuvion ulkopuolella. Yleisesti käytetty sääntö, jonka mukaan datapistettä pidetään poikkeavana, jos sillä on yli 1,5 IQR ensimmäisen kvartiilin alapuolella tai kolmannen kvartiilin yläpuolella.

Toisin sanoen matalien poikkeavien on oltava alle Q1-1,5 IQR: n ja korkeiden poikkeavien on oltava Q3 + 1,5IQR

On laskettava mediaani, kvartilit mukaan lukien IQR, Q1 ja Q3.

Outlier-kaava on esitetty seuraavasti,

Kaava Q1 = ¼ (n + 1) kolmas termi Kaava Q3 = ¾ (n + 1) kolmas kaava Q2 = Q3 - Q1

Poikkeamien laskeminen askel askeleelta

Seuraavat vaiheet on noudatettava laskemaan poikkeama.

  • Vaihe 1: Laske ensin kvartilit eli Q1, Q2 ja interkvartiili
  • Vaihe 2: Laske nyt arvo Q2 * 1,5
  • Vaihe 3: Vähennä nyt Q1-arvo vaiheessa 2 lasketusta arvosta
  • Vaihe 4: Lisää tähän Q3 vaiheessa 2 lasketulla arvolla
  • Vaihe 5: Luo vaiheissa 3 ja 4 laskettujen arvojen alue
  • Vaihe 6: Järjestä tiedot nousevassa järjestyksessä
  • Vaihe 7: Tarkista, onko arvoja, jotka ovat alle tai suurempia kuin vaiheessa 5 luotu alue

Esimerkki

Harkitse seuraavien numeroiden tietojoukkoa: 10, 2, 4, 7, 8, 5, 11, 3, 12. Sinun on laskettava kaikki poikkeamat.

Ratkaisu:

Ensinnäkin meidän on järjestettävä tiedot nousevassa järjestyksessä, jotta löydetään mediaani, joka on meille Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Koska havaintojen lukumäärä on pariton, joka on 9, mediaani olisi 5. sijalle, joka on 7 ja sama on Q2 tässä esimerkissä.

Siksi Q1 lasketaan seuraavasti:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 tulee olemaan - 

Q1 = 2,5 termi

Tämä tarkoittaa, että Q1 on keskiarvo havainnon toisesta ja kolmannesta sijasta, joka on tässä 3 ja 4 ja saman keskiarvo on (3 + 4) / 2 = 3,5

Siksi Q3 lasketaan seuraavasti:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 tulee olemaan - 

Q3 = 7,5 termi

Tämä tarkoittaa, että Q3 on keskiarvo havainnon 7. ja 8. sijasta, joka on tässä 10 ja 11 ja saman keskiarvo on (10 + 11) / 2 = 10,5.

Nyt matalien poikkeavien on oltava alle Q1-1,5IQR ja korkeiden poikkeavien Q3 + 1,5IQR

Joten arvot ovat 3,5 - (1,5 * 7) = -7 ja korkeampi alue on 10,5 + (1,5 * 7) = 110,25.

Koska ei ole havaintoja, jotka olisivat joko 110,25 ja -7 ylä- tai alapuolella, tässä näytteessä ei ole poikkeamia.

Esimerkki Outlier-kaavasta Excelissä (Excel-mallilla)

Voit ladata tämän Outlier Formula Excel -mallin täältä - Outlier Formula Excel -malli

Luovat valmennustunnit harkitsevat 25 prosentin parhaiden opiskelijoiden palkitsemista. He haluavat kuitenkin välttää harhautuksia. Tiedot koskevat 25 opiskelijaa. Käytä Outlier-yhtälöä selvittääksesi onko outlier?

Ratkaisu:

Alla on annettu tiedot ulkopuolisten laskemiseksi

Havaintojen lukumäärä on 25, ja ensimmäinen askel olisi muuntaa edellä oleva raakatieto nousevaan järjestykseen.

Mediaani tulee olemaan -

Mediaani-arvo = ½ (n + 1)

= ½ = ½ (26)

= 13. vaalikausi

Q2 eli mediaani on 68,00

Mikä on 50% väestöstä.

Q1 tulee olemaan -

Q1 = ¼ (n + 1) kolmas termi

= ¼ (25 + 1)

= ¼ (26)

= 6,5. Kausi, joka vastaa seitsemättä lukukautta

Q1 on 56,00, mikä on alin 25%

Q3 tulee olemaan -

Lopuksi Q3 = ¾ (n + 1) kolmas termi

= ¾ (26)

= 19,50 termi

Tässä on otettava keskiarvo, joka on 19. ja 20. termi, jotka ovat 77 ja 77 ja saman keskiarvo on (77 + 77) / 2 = 77,00

 Q3 on 77, mikä on 25% alkuun

Matala kantama

Nyt matalien poikkeavien on oltava alle Q1-1,5IQR ja korkeiden poikkeavien Q3 + 1,5IQR

Korkea kantama -

Joten arvot ovat 56 - (1,5 * 68) = -46 ja korkeampi alue on 77 + (1,5 * 68) = 179.

Poikkeuksia ei ole.

Osuvuus ja käyttötarkoitukset

Outliers-kaava on erittäin tärkeä tietää, koska voi olla tietoa, joka vääristyy tällaisen arvon perusteella. Ota esimerkki havainnoista 2, 4, 6, 101, ja jos joku ottaa näiden arvojen keskiarvon, se on 28,25, mutta 75% havainnoista on alle 7, joten yksi olisi väärä päätös tämän otoksen havaintojen suhteen.

Voidaan huomata, että 101 näyttää selvästi hahmottuvan ja jos tämä poistetaan, keskiarvo olisi 4, mikä kertoo arvoista tai havainnoista, että ne ovat alueella 4. Siksi on erittäin tärkeää suorittaa tämä laskelma välttääksesi tietojen väärinkäyttö. Tilastotieteilijät ympäri maailmaa käyttävät näitä laajasti, kun he tekevät tutkimusta.


$config[zx-auto] not found$config[zx-overlay] not found