Øving 9:
Datasettene vi skal jobbe med i denne øvingen finner du her.
Dersom du vil slippe å taste inn disse dataene selv er det bare å laste ned
filene til en katalog på din maskin/bruker, og åpne den filen du
ønsker å jobbe med ved Fil -> Åpne i EXCEL.
En av de nye tingene vi får bruk
for i denne øvingen er plotting av residualer og transformasjoner av
variable. For beregning/plotting av residualer velg Verktøy ->
Dataanalyse og Regresjon. Fyll ut dialogboksen som kommer
opp på samme måte som tidligere, men kryss nå i tillegg av for
Avvik og Tegn avvik, dette medfører at residualene blir
beregnet og tegnet mot x-variabelen. De øvrige valgene under avvik
trenger du ikke bry deg om (Standardiserte avvik beregner
standardiserte residualer og Tilpass tegnelinjer lager et plott
med dataene og estimert regresjonslinje i hvert datapunkt, vi får
imidlertid et bedre plott ved å tegne dataene og legge inn hele
regresjonslinja som forklart i tipsene til øving
7). Bry deg heller ikke om valget Tegn normalfordeling
(det lager et meningsløst plott av y-dataene som ikke har noe med
normalplott å gjøre siden y-data for ulike x-verdier (og dermed med
ulik forventningsverdi) slås sammen). Du får nå, i tiliegg til samme
informasjon som før, opp informasjon om predikerte y-verdier
(=estimert forventningsverdi) for hvert datapunkt, residualene i
hvert datapunkt og plott av residualene mot x-verdiene. Dette plottet
må du trolig endre fasong (klikk på ramma rundt plottet ta tak i et
hjørne og endre til ønsket fasong) og editere aksene på (som forklart i
tipsene til øving 7) for å få et fint
plott.
Videre bør man lage et normalplott av residualene. Last ned normalplottrutinen dersom du ikke
allerede har gjort det, og start den (husk å trykke Aktiver
makroer når du åpner fila). Velg Fjern data i
normalplottarket og kopier deretter over residualene til
normalplottarket. Dette gjøres enklest ved muskopiering, marker alle
dataene som skal kopieres over, trykk Ctrl+c på tastaturet, flytt
markøren over i øverste rute i Data-kolonnen i
normalplottarket og trykk Ctrl+v på tastaturet (eventuelt kan bruke
hhv Kopier og Lim inn valgene på høyre mustast i
stedet for å bruke tastaturet). Trykk Sorter og lag
normalplott og normalplottet blir genererert. Dette plottet kan
man eventuelt kopiere over til arket hvor man har det andre plottet
ved å trykke på ramma rundt plottet og kopiere det over på tilsvarende måte
som man kopierte residualene.
En annen ting vi får bruk for å kunne gjøre i denne øvingen er
transformasjoner av variable. Merk først at for å lage plott av
variablen må de stå i to kolonner ved siden av hverandre, det kan
derfor i oppgave 11.rev:9b) og c) før man begynner å transformere
variablene være lurt å flytte y-dataene en kolonne til venstre dersom
de i utgangspunktet står ved siden av x-dataene. Dette gjøres lett ved
å markere hele kolonnen, høyreklikke og velge Klipp ut, flytte
markøren ett hakk til høyre og høyreklikke på nytt og velge Lim
inn. For å transformere alle x-dataene til ln(x), gjør vi nå
følgende. Sett markøren i feltet ved siden av den øverste
x-dataverdien (dersom x-dataene er i kolonne A og det står en
overskrift i rad 1 blir dette feltet B2). Velg fx oppe på
kommandolinja. I dialogboksen som kommer opp velg først Matem. og
Trig. i venstre kolonne og deretter LN i høyre og trykk
OK. For å fylle inn i boksen som kommer opp nå hvilket tall det
skal tas logaritmen av klikker du ikke i boksen men på den øverste
x-dataverdien (f.eks. felt A2), og trykker Ok. Du får da
beregnet logaritmen til den første x-verdien. Heldigvis slipper du å
gjenta denne prosedyeren for hver x-verdi! Det du gjør videre er i
stedet (mens markøren fremdeles står på feltet der den første
logaritmeverdien ble beregnet) å høyreklikke og velge Kopier,
marker deretter resten av kolonna under der den første
logaritmeverdien ble beregnet, høyreklikk på nytt og velge Lim
inn. Da blir logaritmeoperasjonen gjentatt for hele kolonna
nedover - logaritmen til alle x-verdiene blir beregnet.
Den andre operasjonen vi trenger å gjøre, å beregne 1/y, kan gjøres
helt tilsvarende ved bruk av OPPHØYD.I-funksjonen (opphøye i
-1), eller enda enklere ved å i feltet ved siden av første y-datapunkt
skrive rett inn =100/ og klikke på det første y-datapunktet (f.eks. C2
dersom y-dataene er i kolonne C og rad 1 er en overskrift) slik at
referansen til dette kommer etter =100/ (f.eks. =100/C2) og trykk
enter. Videre kopieres denne operasjonene nedover hele kolonnen på
samme måte som over (husk å først flytte markøren opp igjen på feltet
der den første 100/y ble beregnet).
Videre får vi i denne øvingen bruk for å kunne utføre multiple lineære
regresjonsanalyser. Multiple regresjonsanalyser
utføres på samme måte som enkle lineær
regresjonsanalyser. Marker bare hele x-dataområdet samlet i
Inndata X-område: i dialogboksen som kommer opp når du velger Verktøy ->
Dataanalyse og Regresjon, ellers er alt som før.
I tillegg får vi i oppgave 12.3:7 og 12.5:9 bruk for å regne ut
kvadratet av x-variabelen. Dette datasettet er så lite at dette er
fort gjort å gjøre for hånd og skrive ned de kvadrerte verdiene i en
kolonne ved siden av de opprinnelige verdiene. Alternativt kan du
bruke fremgangsmåten for å transformere variable beskrevet
over.
Bruk f.eks. OPPHØYD.I-funksjonen beskrevet der og opphøy i 2. Merk at den
kvadrerte x-variabelen må stå på siden av den opprinnelige
x-variabelen i regnearket ellers blir det problemer når x-dataområdet
skal markeres i regresjonsanalysedialogboksen.