Mallivertailu
Mittaripankki · Liikenne · Mallivertailu

Ennustemallien tarkkuustesti.

Kolme mallia kilpailevat: kuinka hyvin 2022–2025 historiatiedot ennustavat 2026 todellista liikennettä? Toteuma haetaan Digitrafficin LAM-datasta reaaliajassa. Vertailuasema: vt4 Mäntsälä.

Haetaan 7 päivän toteumadata Digitrafficista — kestää hetken...

Miten mallit toimivat?

Kaikki kolme mallia käyttävät samaa 2022–2025 historiadataa, mutta eri logiikalla.

M1 · Päivätyyppikeskiarvo

Haetaan jokaiselta historiatilastovuodelta (2022–2025) sama viikonpäivä ±2 viikon sisältä samasta kohdasta kautta. Lasketaan tasainen aritmeettinen keskiarvo kaikista löydetyistä tuntiprofiileista.

Vahvuus: vakaa ja helppo tulkita. Heikkous: kohtelee kaikkia vuosia tasavertaisesti — ei reagoi pitkäaikaiseen trendiin.

M2 · Painotettu vuosikeskiarvo

Sama haku kuin M1, mutta tuoreemmille vuosille annetaan suurempi paino: 2025 → 40%, 2024 → 30%, 2023 → 20%, 2022 → 10%. Malli uskoo, että viime vuosi ennustaa parhaiten.

Vahvuus: seuraa liikenteen kasvua tai laskua. Heikkous: voi ylireagoida jos jokin vuosi oli poikkeuksellinen.

M3 · Lähin naapuri (k-NN)

Etsitään kaikilta historiatilastovuosilta yksi parhaiten vastaava päivä — sama viikonpäivä, mahdollisimman lähellä sama viikko kautta. Käytetään vain lähimpien viikkojen dataa, ei laajaa ikkunaa.

Vahvuus: poimii tarkimmin saman kausitilanteen. Heikkous: herkempi yksittäisille poikkeaville päiville.

Tarkkuusmitta MAPE (Mean Absolute Percentage Error) = Σ|toteuma − ennuste| / toteuma / n × 100 %
Lasketaan tunneille 6–22 (vähintään 30 ajon/h). Pienempi MAPE = parempi. Alle 10 % = erinomainen, 10–20 % = hyvä, yli 20 % = kohtalainen.
Huipputuntivirhe = kuinka monta tuntia pielessä on päivän liikennehuipun ajankohta.
Toteuma: Fintraffic Digitraffic LAM 2026 · Historia: 2022–2025 · Asema 110 (Mäntsälä) · Data CC BY 4.0.