Øving 9:

Datasettene vi skal jobbe med i denne øvingen finner du her. Dersom du vil slippe å taste inn disse dataene selv er det bare å laste ned filene til en katalog på din maskin/bruker, og åpne den filen du ønsker å jobbe med ved Fil -> Åpne i EXCEL.

En av de nye tingene vi får bruk for i denne øvingen er plotting av residualer og transformasjoner av variable. For beregning/plotting av residualer velg Verktøy -> Dataanalyse og Regresjon. Fyll ut dialogboksen som kommer opp på samme måte som tidligere, men kryss nå i tillegg av for Avvik og Tegn avvik, dette medfører at residualene blir beregnet og tegnet mot x-variabelen. De øvrige valgene under avvik trenger du ikke bry deg om (Standardiserte avvik beregner standardiserte residualer og Tilpass tegnelinjer lager et plott med dataene og estimert regresjonslinje i hvert datapunkt, vi får imidlertid et bedre plott ved å tegne dataene og legge inn hele regresjonslinja som forklart i tipsene til øving 7). Bry deg heller ikke om valget Tegn normalfordeling (det lager et meningsløst plott av y-dataene som ikke har noe med normalplott å gjøre siden y-data for ulike x-verdier (og dermed med ulik forventningsverdi) slås sammen). Du får nå, i tiliegg til samme informasjon som før, opp informasjon om predikerte y-verdier (=estimert forventningsverdi) for hvert datapunkt, residualene i hvert datapunkt og plott av residualene mot x-verdiene. Dette plottet må du trolig endre fasong (klikk på ramma rundt plottet ta tak i et hjørne og endre til ønsket fasong) og editere aksene på (som forklart i tipsene til øving 7) for å få et fint plott.
Videre bør man lage et normalplott av residualene. Last ned normalplottrutinen dersom du ikke allerede har gjort det, og start den (husk å trykke Aktiver makroer når du åpner fila). Velg Fjern data i normalplottarket og kopier deretter over residualene til normalplottarket. Dette gjøres enklest ved muskopiering, marker alle dataene som skal kopieres over, trykk Ctrl+c på tastaturet, flytt markøren over i øverste rute i Data-kolonnen i normalplottarket og trykk Ctrl+v på tastaturet (eventuelt kan bruke hhv Kopier og Lim inn valgene på høyre mustast i stedet for å bruke tastaturet). Trykk Sorter og lag normalplott og normalplottet blir genererert. Dette plottet kan man eventuelt kopiere over til arket hvor man har det andre plottet ved å trykke på ramma rundt plottet og kopiere det over på tilsvarende måte som man kopierte residualene.

En annen ting vi får bruk for å kunne gjøre i denne øvingen er transformasjoner av variable. Merk først at for å lage plott av variablen må de stå i to kolonner ved siden av hverandre, det kan derfor i oppgave 11.rev:9b) og c) før man begynner å transformere variablene være lurt å flytte y-dataene en kolonne til venstre dersom de i utgangspunktet står ved siden av x-dataene. Dette gjøres lett ved å markere hele kolonnen, høyreklikke og velge Klipp ut, flytte markøren ett hakk til høyre og høyreklikke på nytt og velge Lim inn. For å transformere alle x-dataene til ln(x), gjør vi nå følgende. Sett markøren i feltet ved siden av den øverste x-dataverdien (dersom x-dataene er i kolonne A og det står en overskrift i rad 1 blir dette feltet B2). Velg fx oppe på kommandolinja. I dialogboksen som kommer opp velg først Matem. og Trig. i venstre kolonne og deretter LN i høyre og trykk OK. For å fylle inn i boksen som kommer opp nå hvilket tall det skal tas logaritmen av klikker du ikke i boksen men på den øverste x-dataverdien (f.eks. felt A2), og trykker Ok. Du får da beregnet logaritmen til den første x-verdien. Heldigvis slipper du å gjenta denne prosedyeren for hver x-verdi! Det du gjør videre er i stedet (mens markøren fremdeles står på feltet der den første logaritmeverdien ble beregnet) å høyreklikke og velge Kopier, marker deretter resten av kolonna under der den første logaritmeverdien ble beregnet, høyreklikk på nytt og velge Lim inn. Da blir logaritmeoperasjonen gjentatt for hele kolonna nedover - logaritmen til alle x-verdiene blir beregnet. Den andre operasjonen vi trenger å gjøre, å beregne 1/y, kan gjøres helt tilsvarende ved bruk av OPPHØYD.I-funksjonen (opphøye i -1), eller enda enklere ved å i feltet ved siden av første y-datapunkt skrive rett inn =100/ og klikke på det første y-datapunktet (f.eks. C2 dersom y-dataene er i kolonne C og rad 1 er en overskrift) slik at referansen til dette kommer etter =100/ (f.eks. =100/C2) og trykk enter. Videre kopieres denne operasjonene nedover hele kolonnen på samme måte som over (husk å først flytte markøren opp igjen på feltet der den første 100/y ble beregnet).

Videre får vi i denne øvingen bruk for å kunne utføre multiple lineære regresjonsanalyser. Multiple regresjonsanalyser utføres på samme måte som enkle lineær regresjonsanalyser. Marker bare hele x-dataområdet samlet i Inndata X-område: i dialogboksen som kommer opp når du velger Verktøy -> Dataanalyse og Regresjon, ellers er alt som før.
I tillegg får vi i oppgave 12.3:7 og 12.5:9 bruk for å regne ut kvadratet av x-variabelen. Dette datasettet er så lite at dette er fort gjort å gjøre for hånd og skrive ned de kvadrerte verdiene i en kolonne ved siden av de opprinnelige verdiene. Alternativt kan du bruke fremgangsmåten for å transformere variable beskrevet over. Bruk f.eks. OPPHØYD.I-funksjonen beskrevet der og opphøy i 2. Merk at den kvadrerte x-variabelen må stå på siden av den opprinnelige x-variabelen i regnearket ellers blir det problemer når x-dataområdet skal markeres i regresjonsanalysedialogboksen.