SlideShare a Scribd company logo
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
Shrinkage Methods
Federico Cozza
Luca Vitale
Universit`a degli studi di Salerno
23 Gennaio 2017
1 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
INDICE
INTRODUZIONE
OLS
Panoramica
Problematiche
SHRINKAGE METHODS
Ridge Regression
Lasso
Elastic Net
LARS
LARS
CONCLUSIONI
2 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
INTRODUZIONE
Rapida crescita delle nuove tecnologie
Crescita dei dati disponibili
Maggiore granularit`a degli studi
Poche osservazioni, molte variabili!
Necessit`a di alternative a OLS (Ordinary Least Squares)
3 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
PANORAMICA
Metodo per stimare modello di regressione lineare
Y = Xβ +
Minimizzare RSS
β = (XTX)−1XTY
Best Linear Unbiased Estimator (BLUE) se si verificano le
condizioni di Gauss-Markov
4 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
UN CASO PRATICO
Osservare l’andamento del tasso criminale negli USA
Studio condotto dall’FBI su dati
raccolti nel 1960
Dati aggregati dei 47 stati
americani
http://www.statsci.org/data/general/uscrime.html
5 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
I DATI
Table: Descrizione variabili
M PERCENTAGE OF MALES AGED 14–24 IN TOTAL STATE POPULATION
ED MEAN YEARS OF SCHOOLING OF THE POPULATION AGED 25 YEARS OR OVER
PO1 PER CAPITA EXPENDITURE ON POLICE PROTECTION IN 1960
PO2 PER CAPITA EXPENDITURE ON POLICE PROTECTION IN 1959
LF LABOUR FORCE PARTICIPATION RATE OF CIVILIAN URBAN MALES IN THE AGE-GROUP 14-24
M.F NUMBER OF MALES PER 100 FEMALES
POP STATE POPULATION IN 1960 IN HUNDRED THOUSANDS
NW PERCENTAGE OF NONWHITES IN THE POPULATION
U1 UNEMPLOYMENT RATE OF URBAN MALES 14–24
U2 UNEMPLOYMENT RATE OF URBAN MALES 35–39
WEALTH WEALTH: MEDIAN VALUE OF TRANSFERABLE ASSETS OR FAMILY INCOME
INEQ INCOME INEQUALITY: PERCENTAGE OF FAMILIES EARNING BELOW HALF THE MEDIAN INCOME
PROB PROBABILITY OF IMPRISONMENT: RATIO OF NUMBER OF COMMITMENTS TO NUMBER OF OFFENSES
TIME AVERAGE TIME IN MONTHS SERVED BY OFFENDERS IN STATE PRISONS BEFORE THEIR FIRST RELEASE
CRIME CRIME RATE: NUMBER OF OFFENSES PER 100,000 POPULATION IN 1960
Sono presenti 47 osservazioni, ognuna con i dati aggregati di
un diverso stato americano
6 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
OLS: RISULTATI
Table: Indici VIF
M Ed Po1 Po2 LF M.F Pop NW U1 U2 Wealth Ineq Prob Time
3.64 5.07 79.09 87.4 2.32 4.22 3.26 3.54 5.86 4.47 11.95 9.16 4.49 3.78
MSE = 0.108233 — κ-Condition number = 424.0668
7 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
PROBLEMATICHE
1. Dipendenze non lineari (log-transform)
2. Pi`u variabili che osservazioni (Shrinkage Methods)
3. Multicollinearit`a (Ridge Regression)
4. Variabili ridondanti (Lasso ed Elastic Net)
8 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
SHRINKAGE METHODS
Metodi di stima con coefficienti ”portati verso lo zero” tramite
parametro di shrinkage λ
Aumento del bias
Riduzione della
varianza
Stima pi`u precisa per
opportuna scelta di λ
9 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
RIDGE REGRESSION
Stima dei coefficienti β di Y = Xβ + con
ˆβRidge = argmin
n
i=1
yi − β0 −
p
j=1
βjxij
2
+ λ
p
j=1
β2
j
ˆβRidge = (XTX + λI)−1XTY
det(XTX + λI) = 0
Meno gradi di libert`a ⇒ Bene
anche quando p > n
10 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
RIDGE REGRESSION: PROBLEMATICHE
β >> 0 nel modello
reale ⇒ Performance
non ottimali
ˆβi
Ridge
difficilmente
uguale a zero ⇒ Non
adatto per Variable
Selection
11 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
RIDGE REGRESSION: RISULTATI
MSE = 0.082783 — Minimum λ = 0.037
12 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LASSO
ˆβLasso = argmin
n
i=1
yi − β0 −
p
j=1
βjxij
2
+ λ
p
j=1
βj
13 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LASSO: VANTAGGI E PROBLEMATICHE
ˆβi
Lasso
non significativi
posti a zero ⇒ Ideale per
Variable Selection
Bene quando `e spiccata
l’importanza di un
gruppo ristretto di
parametri
Quando p >> n, Lasso
seleziona al pi`u n variabili
Di solito con n > p Ridge
Regression meglio di
Lasso
Da un gruppo di variabili
correlate ne viene scelta
solo una
14 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LASSO: VANTAGGI E PROBLEMATICHE-2
All’aumentare dei gradi di lib-
ert`a (i.e. al diminuire di λ), i
ˆβi delle variabili importanti au-
mentano drasticamente; quelli
meno significativi tendono a ri-
manere uguali a zero
Il Lasso tende a selezionare
solo uno dei geni di un path-
way, perdendo l’interazione fra
i geni
15 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LASSO: RISULTATI
MSE = 0.072829 — Minimum λ = 0.013
16 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
ELASTIC NET
ˆβNEN = argmin
n
i=1
yi − β0 −
p
j=1
βjxij
2
+ λ1
p
j=1
βj + λ2
p
j=1
β2
j
17 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
ELASTIC NET-2
Combina Lasso e Ridge Regression. Seleziona variabili pi`u
importanti (Lasso), e altre variabili escluse (Ridge Regression),
eventualmente correlate con quelle del Lasso.
Spesso `e infatti interessante selezionare un gruppo intero di
variabili correlate (ad esempio per pathway e microarray)
Per migliorare le performance rispetto alla versione Naive
⇒ ˆβEN = (1 + λ2)ˆβNEN
Sui nostri dati Elastic Net non apporta miglioramenti rispetto a
Lasso
18 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
I METODI A CONFRONTO
VARIABILE OLS RIDGE LASSO
Intercept 6.7427 6.7435 6.7436
M 0.1243 0.0464 0.0794
ED 0.3296 0.0495 0.1199
PO1 0.5548 0.0816 0.2453
PO2 -0.3210 0.0718 0
LF -0.0559 0.0146 0
M.F -0.0069 0.0408 0.0175
POP -0.0698 0.0053 0
NW 0.1046 0.0592 0.0621
U1 -0.5670 -0.0071 0
U2 0.1611 0.0470 0.0519
WEALTH 0.1601 0.0235 0
INEQ 0.3817 0.0516 0.1187
PROB -0.0834 -0.0392 -0.0345
TIME 0.0441 0.0289 0.0113
MSE 0.1082 0.0827 0.0728
19 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LARS
Algoritmo per la selezione del modello per regressione lineare
Evoluzione di
Forward Stagewise
Selection
Computazionalmente
efficiente
Indicato per alta
dimensionalit`a, a
meno di
multicollinearit`a
20 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
LARS: L’ALGORITMO
1. Inizializza vettore ˆβ = 0
2. Scegli la variabile xj pi`u correlata col vettore dei residui
corrente
3. Incrementa ˆβj il pi`u possibile fin quando una variabile xk
ha correlazione con i residui pari a quella di xj
4. Varia ( ˆβj, ˆβk) muovendoti in direzione equiangolare tra xj e
xk
5. Continua fin quando tutti i predittori sono stati inseriti nel
modello
21 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
CONCLUSIONI
22 / 23
INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI
FINE
GRAZIE PER L’ATTENZIONE
23 / 23

More Related Content

PPTX
La Guerra Civil Catalana del segle XV (Esquemàtic)
PPT
Scoperte Di Galileo M. Picco
PDF
Learning Non-Linear Functions for Text Classification
PPTX
Pollution
PDF
Sublevel open stopping assignment
PPT
Mining methods2
PDF
/.Amd mnt/lotus/host/home/jaishakthi/presentation/rmeet1/rmeet 1
La Guerra Civil Catalana del segle XV (Esquemàtic)
Scoperte Di Galileo M. Picco
Learning Non-Linear Functions for Text Classification
Pollution
Sublevel open stopping assignment
Mining methods2
/.Amd mnt/lotus/host/home/jaishakthi/presentation/rmeet1/rmeet 1

Viewers also liked (20)

PDF
Image processing tutorial
PDF
Unified Contact Riemannian Manifold Admitting SemiSymmetric Metric S-Connection
PPT
Digital Image Processing (DIP)
PPT
Digital Image Processing
PPTX
Digital Image Processing
PPTX
Shrinkage finishing for cellulosic fabrics
PPT
image theory
PPTX
Image compression Algorithms
PDF
Basic image processing
PDF
Shrinkage and Vertical Crater Retreat Stoping
PPT
Introduction to Digital Image Processing
PPTX
Digital Image Processing
PPTX
Digital image processing techniques
PPTX
1.arithmetic & logical operations
PDF
Introduction of image processing
PPTX
Digital image processing
PPT
Image pre processing - local processing
PPTX
Design of Bord and Pillar method in coal mines
PPTX
Edge Detection algorithm and code
PPT
Fields of digital image processing slides
Image processing tutorial
Unified Contact Riemannian Manifold Admitting SemiSymmetric Metric S-Connection
Digital Image Processing (DIP)
Digital Image Processing
Digital Image Processing
Shrinkage finishing for cellulosic fabrics
image theory
Image compression Algorithms
Basic image processing
Shrinkage and Vertical Crater Retreat Stoping
Introduction to Digital Image Processing
Digital Image Processing
Digital image processing techniques
1.arithmetic & logical operations
Introduction of image processing
Digital image processing
Image pre processing - local processing
Design of Bord and Pillar method in coal mines
Edge Detection algorithm and code
Fields of digital image processing slides
Ad

More from Luca Vitale (11)

PDF
Estimation of the Latent Signals for Consensus Across Multiple Ranked Lists u...
PDF
A pathway and SVM based tool for tumor classification
PDF
Pathway based OMICs data classification
PDF
JSON-LD
PDF
Metodi per la soluzione di problemi di programmazione non lineare
PDF
Log structured-file-system
PDF
Utilizzo dei Thread
PDF
Classificazione in efMRI: Un caso di studio sulla coniugazione dei verbi
PDF
Linguaggi Context-Sensitive e Linear Bounded Automata
PDF
Soluzione numerica di equazioni differenziali a grandi dimensioni su GPUs
Estimation of the Latent Signals for Consensus Across Multiple Ranked Lists u...
A pathway and SVM based tool for tumor classification
Pathway based OMICs data classification
JSON-LD
Metodi per la soluzione di problemi di programmazione non lineare
Log structured-file-system
Utilizzo dei Thread
Classificazione in efMRI: Un caso di studio sulla coniugazione dei verbi
Linguaggi Context-Sensitive e Linear Bounded Automata
Soluzione numerica di equazioni differenziali a grandi dimensioni su GPUs
Ad

Recently uploaded (8)

PDF
Mazzoni-Reggi-2012-Effetto-Lucifero-Su-Wikipedia.pdf
PDF
BÀI TẬP TEST BỔ TRỢ THEO TỪNG UNIT - TIẾNG ANH 10 FRIENDS GLOBAL - CẢ NĂM (24...
PDF
GIÁO ÁN KẾ HOẠCH BÀI DẠY CHÍNH KHÓA TIẾNG ANH 9 - CẢ NĂM - THEO CÔNG VĂN 5512...
PPTX
SLIDE-DE-CURSOS-OssssFICIAL-DA-EGEPI-.pptx
PDF
CHUYÊN ĐỀ BỔ TRỢ NGỮ ÂM, TỪ VỰNG NÂNG CAO - TIẾNG ANH 9 VÀ ÔN THI VÀO LỚP 10 ...
PDF
16 CHUYÊN ĐỀ BÀI TẬP ÔN THI TUYỂN SINH VÀO 10 - MÔN TIẾNG ANH - THEO FORM ĐỀ ...
PDF
BÀI TẬP TEST BỔ TRỢ THEO TỪNG UNIT - TIẾNG ANH 10 EXPLORE NEW WORLDS - CẢ NĂM...
PDF
GIÁO ÁN CHÍNH KHÓA TIẾNG ANH 9 - CẢ NĂM - THEO CÔNG VĂN 5512 (2 CỘT) NĂM HỌC ...
Mazzoni-Reggi-2012-Effetto-Lucifero-Su-Wikipedia.pdf
BÀI TẬP TEST BỔ TRỢ THEO TỪNG UNIT - TIẾNG ANH 10 FRIENDS GLOBAL - CẢ NĂM (24...
GIÁO ÁN KẾ HOẠCH BÀI DẠY CHÍNH KHÓA TIẾNG ANH 9 - CẢ NĂM - THEO CÔNG VĂN 5512...
SLIDE-DE-CURSOS-OssssFICIAL-DA-EGEPI-.pptx
CHUYÊN ĐỀ BỔ TRỢ NGỮ ÂM, TỪ VỰNG NÂNG CAO - TIẾNG ANH 9 VÀ ÔN THI VÀO LỚP 10 ...
16 CHUYÊN ĐỀ BÀI TẬP ÔN THI TUYỂN SINH VÀO 10 - MÔN TIẾNG ANH - THEO FORM ĐỀ ...
BÀI TẬP TEST BỔ TRỢ THEO TỪNG UNIT - TIẾNG ANH 10 EXPLORE NEW WORLDS - CẢ NĂM...
GIÁO ÁN CHÍNH KHÓA TIẾNG ANH 9 - CẢ NĂM - THEO CÔNG VĂN 5512 (2 CỘT) NĂM HỌC ...

Shrinkage methods

  • 1. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI Shrinkage Methods Federico Cozza Luca Vitale Universit`a degli studi di Salerno 23 Gennaio 2017 1 / 23
  • 2. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI INDICE INTRODUZIONE OLS Panoramica Problematiche SHRINKAGE METHODS Ridge Regression Lasso Elastic Net LARS LARS CONCLUSIONI 2 / 23
  • 3. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI INTRODUZIONE Rapida crescita delle nuove tecnologie Crescita dei dati disponibili Maggiore granularit`a degli studi Poche osservazioni, molte variabili! Necessit`a di alternative a OLS (Ordinary Least Squares) 3 / 23
  • 4. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI PANORAMICA Metodo per stimare modello di regressione lineare Y = Xβ + Minimizzare RSS β = (XTX)−1XTY Best Linear Unbiased Estimator (BLUE) se si verificano le condizioni di Gauss-Markov 4 / 23
  • 5. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI UN CASO PRATICO Osservare l’andamento del tasso criminale negli USA Studio condotto dall’FBI su dati raccolti nel 1960 Dati aggregati dei 47 stati americani http://www.statsci.org/data/general/uscrime.html 5 / 23
  • 6. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI I DATI Table: Descrizione variabili M PERCENTAGE OF MALES AGED 14–24 IN TOTAL STATE POPULATION ED MEAN YEARS OF SCHOOLING OF THE POPULATION AGED 25 YEARS OR OVER PO1 PER CAPITA EXPENDITURE ON POLICE PROTECTION IN 1960 PO2 PER CAPITA EXPENDITURE ON POLICE PROTECTION IN 1959 LF LABOUR FORCE PARTICIPATION RATE OF CIVILIAN URBAN MALES IN THE AGE-GROUP 14-24 M.F NUMBER OF MALES PER 100 FEMALES POP STATE POPULATION IN 1960 IN HUNDRED THOUSANDS NW PERCENTAGE OF NONWHITES IN THE POPULATION U1 UNEMPLOYMENT RATE OF URBAN MALES 14–24 U2 UNEMPLOYMENT RATE OF URBAN MALES 35–39 WEALTH WEALTH: MEDIAN VALUE OF TRANSFERABLE ASSETS OR FAMILY INCOME INEQ INCOME INEQUALITY: PERCENTAGE OF FAMILIES EARNING BELOW HALF THE MEDIAN INCOME PROB PROBABILITY OF IMPRISONMENT: RATIO OF NUMBER OF COMMITMENTS TO NUMBER OF OFFENSES TIME AVERAGE TIME IN MONTHS SERVED BY OFFENDERS IN STATE PRISONS BEFORE THEIR FIRST RELEASE CRIME CRIME RATE: NUMBER OF OFFENSES PER 100,000 POPULATION IN 1960 Sono presenti 47 osservazioni, ognuna con i dati aggregati di un diverso stato americano 6 / 23
  • 7. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI OLS: RISULTATI Table: Indici VIF M Ed Po1 Po2 LF M.F Pop NW U1 U2 Wealth Ineq Prob Time 3.64 5.07 79.09 87.4 2.32 4.22 3.26 3.54 5.86 4.47 11.95 9.16 4.49 3.78 MSE = 0.108233 — κ-Condition number = 424.0668 7 / 23
  • 8. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI PROBLEMATICHE 1. Dipendenze non lineari (log-transform) 2. Pi`u variabili che osservazioni (Shrinkage Methods) 3. Multicollinearit`a (Ridge Regression) 4. Variabili ridondanti (Lasso ed Elastic Net) 8 / 23
  • 9. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI SHRINKAGE METHODS Metodi di stima con coefficienti ”portati verso lo zero” tramite parametro di shrinkage λ Aumento del bias Riduzione della varianza Stima pi`u precisa per opportuna scelta di λ 9 / 23
  • 10. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI RIDGE REGRESSION Stima dei coefficienti β di Y = Xβ + con ˆβRidge = argmin n i=1 yi − β0 − p j=1 βjxij 2 + λ p j=1 β2 j ˆβRidge = (XTX + λI)−1XTY det(XTX + λI) = 0 Meno gradi di libert`a ⇒ Bene anche quando p > n 10 / 23
  • 11. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI RIDGE REGRESSION: PROBLEMATICHE β >> 0 nel modello reale ⇒ Performance non ottimali ˆβi Ridge difficilmente uguale a zero ⇒ Non adatto per Variable Selection 11 / 23
  • 12. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI RIDGE REGRESSION: RISULTATI MSE = 0.082783 — Minimum λ = 0.037 12 / 23
  • 13. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LASSO ˆβLasso = argmin n i=1 yi − β0 − p j=1 βjxij 2 + λ p j=1 βj 13 / 23
  • 14. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LASSO: VANTAGGI E PROBLEMATICHE ˆβi Lasso non significativi posti a zero ⇒ Ideale per Variable Selection Bene quando `e spiccata l’importanza di un gruppo ristretto di parametri Quando p >> n, Lasso seleziona al pi`u n variabili Di solito con n > p Ridge Regression meglio di Lasso Da un gruppo di variabili correlate ne viene scelta solo una 14 / 23
  • 15. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LASSO: VANTAGGI E PROBLEMATICHE-2 All’aumentare dei gradi di lib- ert`a (i.e. al diminuire di λ), i ˆβi delle variabili importanti au- mentano drasticamente; quelli meno significativi tendono a ri- manere uguali a zero Il Lasso tende a selezionare solo uno dei geni di un path- way, perdendo l’interazione fra i geni 15 / 23
  • 16. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LASSO: RISULTATI MSE = 0.072829 — Minimum λ = 0.013 16 / 23
  • 17. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI ELASTIC NET ˆβNEN = argmin n i=1 yi − β0 − p j=1 βjxij 2 + λ1 p j=1 βj + λ2 p j=1 β2 j 17 / 23
  • 18. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI ELASTIC NET-2 Combina Lasso e Ridge Regression. Seleziona variabili pi`u importanti (Lasso), e altre variabili escluse (Ridge Regression), eventualmente correlate con quelle del Lasso. Spesso `e infatti interessante selezionare un gruppo intero di variabili correlate (ad esempio per pathway e microarray) Per migliorare le performance rispetto alla versione Naive ⇒ ˆβEN = (1 + λ2)ˆβNEN Sui nostri dati Elastic Net non apporta miglioramenti rispetto a Lasso 18 / 23
  • 19. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI I METODI A CONFRONTO VARIABILE OLS RIDGE LASSO Intercept 6.7427 6.7435 6.7436 M 0.1243 0.0464 0.0794 ED 0.3296 0.0495 0.1199 PO1 0.5548 0.0816 0.2453 PO2 -0.3210 0.0718 0 LF -0.0559 0.0146 0 M.F -0.0069 0.0408 0.0175 POP -0.0698 0.0053 0 NW 0.1046 0.0592 0.0621 U1 -0.5670 -0.0071 0 U2 0.1611 0.0470 0.0519 WEALTH 0.1601 0.0235 0 INEQ 0.3817 0.0516 0.1187 PROB -0.0834 -0.0392 -0.0345 TIME 0.0441 0.0289 0.0113 MSE 0.1082 0.0827 0.0728 19 / 23
  • 20. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LARS Algoritmo per la selezione del modello per regressione lineare Evoluzione di Forward Stagewise Selection Computazionalmente efficiente Indicato per alta dimensionalit`a, a meno di multicollinearit`a 20 / 23
  • 21. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI LARS: L’ALGORITMO 1. Inizializza vettore ˆβ = 0 2. Scegli la variabile xj pi`u correlata col vettore dei residui corrente 3. Incrementa ˆβj il pi`u possibile fin quando una variabile xk ha correlazione con i residui pari a quella di xj 4. Varia ( ˆβj, ˆβk) muovendoti in direzione equiangolare tra xj e xk 5. Continua fin quando tutti i predittori sono stati inseriti nel modello 21 / 23
  • 22. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI CONCLUSIONI 22 / 23
  • 23. INTRODUZIONE OLS SHRINKAGE METHODS LARS CONCLUSIONI FINE GRAZIE PER L’ATTENZIONE 23 / 23