En guide viser hvordan en Decision Tree Regressor kan bygges trinnvis i Excel ved å beregne MSE for alle mulige split og velge den som minimerer feilen.
Artikkelen beskriver modellen som et sett regler som deler datasettet og predikerer ved gjennomsnittet av målvariabelen i hver region. Treningsprosessen vokser treet fullstendig ved rekursive splittelser; et fullt voksent tre har løv med én observasjon og MSE lik null. For et enkelt datasett listes alle mulige split som midtpunktet mellom påfølgende x-verdier, og for hver split beregnes venstre og høyre gjennomsnitt, kvadrert feil og veid MSE. Den optimale splitten minimerer denne MSE; i eksempelet er det x=5.5, samme resultat som i Python. Modeltilpasning omtales som beskjæring (pruning) eller ved stoppkriterier som maksimal dybde eller minste antall prøver per løv. Teksten viser også hvordan alle split-beregningene kondenseres i en oppsummeringstabell ved bruk av variansforenklinger, og foreslår å prøve MAE i stedet for MSE som øvelse.
Norsk kontekst: Den visuelle, Excel-baserte fremstillingen gjør prinsippene etterprøvbare og egnet for undervisning og demonstrasjon i norske fagmiljøer. Forklarbarheten berører temaer innen kunstlig intelligens (KI) og kan være relevant for fagmiljøer i AI-Norge og for dekning i AI-nyheter.
Kilde: https://towardsdatascience.com/the-machine-learning-advent-calendar-day-6-decision-tree-regressor | Sammendraget er KI-generert med OpenAI API og kvalitetssikret av redaksjonen i Ainy.no
