Kako izbjeći pogreške prilikom izračuna GMV-a međunarodnog tržišta?

U radu s tržištem trebat će izračunati bruto ukupni promet robe (GMV). U početku se čini jednostavno: sve što trebate je prikupiti cijene svih aktivnih oglasa u jedan stupac i kliknuti SUMM. Međutim, ako vaše tržište djeluje u različitim zemljama, stvari možda i nisu tako jednostavne.

Zašto je teško izračunati GMV?

Radim u Lalafou - tržištu tržišnog natjecanja koje pokreće AI. Platforma ima 3 milijuna aktivnih korisnika iz 4 zemlje svaki mjesec. Na kraju 2016. trebali smo izračunati ukupnu novčanu vrijednost svih oglasa postavljenih na Lalafo za tu godinu.

Prvo smo zbrojili sve cijene koje su predložili korisnici izuzev svih neplasiranih i blokiranih oglasa. To je rezultiralo GMV-om koji je bio veći od BDP-a države koju smo koristili za procjenu!

Čistili smo podatke i pretvorili valutu u realnom vremenu. To je sve skupa smanjilo, ali i dalje je bilo nerazumno veliko.

Najpopularniji način za uklanjanje anomalija u neurednom skupu podataka je korištenje interkvartilnog raspona (raspon podataka između 25. i 75. postotka). Ni ovaj pristup nije riješio problem, jer je obujam korisničkih cijena postao vrlo nizak nakon što je primijenjen interkvartilni raspon.

Obratite pažnju na postotke

Brza sesija mozga dala nam je ideju da je problem u postotnim vrijednostima: razlika između nule i prve bila je previše dramatična.

Percenttil (ili centil) je mjera koja se koristi u statistici koja pokazuje vrijednost ispod koje padne određeni postotak opažanja u grupi promatranja. Na primjer, 20. pertiletil je vrijednost (ili ocjena) ispod koje se može naći 20% opažanja. Percentili mogu djelovati linearno ili nelinearno, ovisno o tome ima li pogrešaka u skupu podataka. (Wikipedia)

Odlučili smo pregledati način na koji su postupili svi postotci između 1 i 100. Otkrili smo da su svi podaci između Percentile 1 i 99 linearni, dok između 99 i 100 pronašli smo veliki val koji pokazuje da se greška pojavljuje u ovom odjeljku. Uklonili smo sve podatke između 99. i 100. postotka koji su riješili problem.

Važnost kategorije proizvoda

Tržište Lalafo sadrži različite kategorije proizvoda. Najskuplje kategorije su nekretnine i vozila. Kako bismo dobili precizniji GMV, odlučili smo uzeti u obzir kategorije proizvoda prilikom izračunavanja postotaka. Na primjer, vozila i procenti nekretnina deseci su puta veći od onih odjevnih predmeta.

Kao rezultat toga:
- odredila je vrijednost postotka za svaku kategoriju.
- koriste se postotci samo u slučajevima nelinearnog GMV-a.
To nam je dalo precizan GMV.

Još jedna važna stvar - valuta

Korisnici često zaboravljaju postaviti valutu tijekom postavljanja svojih oglasa. To rezultira prodajom iPhonea 7S za samo 20 dolara ili štednjaka koja koštaju više od cijelog BDP-a Kolumbije!

Da bismo prilagodili valutu uz zadržavanje rezultata uređivanja skupa podataka za 99. postotak, odlučili smo učiniti sljedeće:

- postaviti zajedničku cijenu za svaku kategoriju koja je jednaka srednjoj (Percentil 50) kategorije.
- pregledajte skup podataka i prilagodite valutu, ako je vrijednost preniska ili previsoka.

Izračunavanje GMV. Opći savjet:

- uobičajene metode (srednji, interkvartilni raspon) rade samo pod linearnim GMV. Ako ne rade, dvaput provjerite vrijednosti svih postotaka.

- izračunati postotke odvojeno za svaku kategoriju.

- filtrirajte svoje podatke prije izračuna.

- provjeriti vrijednosti valute.