ECO5272: Économétrie
Annonces
Steve Ambler
Département des sciences économiques
École des sciences de la gestion
Université du Québec à Montréal
Hiver 2006
Bienvenue au cours ECO5272! Revenez consulter fréquemment cette page.
- 09/01/2006 - Mes heures de consultation pour le trimestre d'hiver 2006
seront les mardis de 9h30 à 12h30.
- 09/01/2006 - Voici deux renvois intéressants si vous cherchez à
approfondir ou à clarifier un sujet quelconque:
http://en.wikipedia.org/wiki/Main_Page
http://mathworld.wolfram.com/
- 09/01/2006 - Par exemple, si vous vous intéressez à une preuve du
théorème limite central, que nous avons vu en classe aujourd'hui, voir:
http://en.wikipedia.org/wiki/Central_limit_theorem
http://mathworld.wolfram.com/CentralLimitTheorem.html
C'est un peu difficile, mais peut-être moins que l'on croirait.
- 10/01/2006 - Je suis en train de réviser le syllabus. Ce que je vais
faire probablement c'est de baser ma présentation du modèle MCO sur le
chapitre 16 pour pouvoir utiliser une approche matricielle. Pour des sujets
qui ont été couverts de façon trop superficielle ou qui n'ont pas été
couverts du tout dans le cours Introduction à l'Econométrie et
provenant des chapitres 4, 5 et 6, je vais les intégrer dans mes cours,
toujours avec uen approche matricielle. En attendant la version révisée du
syllabus, voici un rappel de notions en calcul différentiel matriciel:
http://www.colorado.edu/engineering/CAS/courses.d/IFEM.d/IFEM.AppD.d/IFEM.AppD.pdf
- 11/01/2006 - Après avoir comparé les chapitre 5 et 16 du manuel, je
constate que la couverture de sujets est très semblable. Cela va me
permettre de remplacer les cours 3 et 4 par une approche matricielle à la
régression linéaire multivariée. Cela nous permettra aussi de tester vos
connaissances en matière d'algèbre matriciel et/ou de votre volonté
d'apprendre. Si tout va bien, je pourrai présenter le contenu des chapitres
subséquents à un niveau plus avancé, incorporant l'algèbre matriciel dans
les démonstrations.
- 11/01/2006 - Dans la mesure où vous avez étudié les chapitres 8 et 9
en détail, on pourrait fusionner les deux sujets en un seul cours. Cela
permettrait d'ajouter un autre sujet. Je serais tenté d'ajouter un cours sur
la méthode des moments généralisée. On verra bien.
- 11/01/2006 - Une version révisée du syllabus est disponible. Je m'en
suis tiré avec des changements minimaux. Avant de le considérer comme figé
dans le béton, on va en parler en classe la semaine prochaine.
- 11/01/2006 - Voici une référence plus complète sur la différentiation
matricielle:
http://www.econ.iastate.edu/classes/econ671/hallam/documents/Misc_Matrix_Algebra.pdf
- 16/01/2006 - Définitions alternatives de la convergence pour les
variables aléatoires:
http://en.wikipedia.org/wiki/Convergence_of_random_variables
- 16/01/2006 - Référence pour le théorème de Slutsky:
http://en.wikipedia.org/wiki/Convergence_of_random_variables
- 17/01/2006 - Concernant la loi normale - effectivement le nom de
Gauss y est associé. Voici un extrait qui provient de Wikipedia:
The normal distribution was first introduced by de Moivre in an article in
1733 (reprinted in the second edition of his The Doctrine of Chances,
1738) in the context of approximating certain binomial distributions for
large n. His result was extended by Laplace in his book Analytical Theory
of Probabilities (1812), and is now called the theorem of de
Moivre-Laplace.
Laplace used the normal distribution in the analysis of errors of
experiments. The important method of least squares was introduced by
Legendre in 1805. Gauss, who claimed to have used the method since 1794,
justified it rigorously in 1809 by assuming a normal distribution of the
errors ... That the distribution is called the normal or Gaussian
distribution is an instance of Stigler's law of eponymy: "No scientific
discovery is named after its original discoverer."
- 17/01/2006 - D'ici demain, des précisions sur la loi t de
Student.
- 17/01/2006 - "Wikipedia is your friend." Voici une discussion
succincte du concenpt de degrés de liberté:
http://en.wikipedia.org/wiki/Degrees_of_freedom_\%28statistics\%29
- 17/01/2006 - Effectivement, prouver que l'estimateur de la variance
que nous avons vu en classe suit une loi chi-carré nécessite quelques tours
de passe-passe. Il faut invoquer le théorème de Cochran (non, pas Zefram
Cochrane, celui qui inventera le warp drive!). Voir:
http://en.wikipedia.org/wiki/Cochran\%27s_theorem
- 24/01/2006 - L'interprétation géométrique des moindres carrés
ordinaires - voir:
http://www.geom.uiuc.edu/~banchoff/linalg/linalg.html
- 31/01/2006 - Le premier tp est affiché. Voici le lien:
http://www.er.uqam.ca/nobel/r10735/5272/exer061a.pdf
- 06/02/2006 - Voici une petite référence utile que j'ai trouvé
pour les espérances et les variances de vecteurs et de matrices de
variable aléatoires:
http://qed.econ.queensu.ca/walras/custom/300/351B/notes/mul_05.htm
Il faut absolument que ces formules vous soient familières.
- 16/02/2006 - Voici le corrigé du premier t.p.:
http://www.er.uqam.ca/nobel/r10735/5272/exer061b.pdf
- 21/02/2006 - J'ai affiché le questionnaire de l'intra et des réponses
détaillées. Voici les coordonnées:
http://www.er.uqam.ca/nobel/r10735/5272/intra06a.pdf
http://www.er.uqam.ca/nobel/r10735/5272/intra06b.pdf
- 21/02/2006 - J'ai corrigé une petite erreur dans la réponse à la
deuxième question du TP: j'ai oublié un carré dans le dénominateur de
l'expression pour la variance de l'estimateur. La version corrigée est
affichée (voir l'adresse ci-dessus).
- 07/03/2006 - Tel qu'annoncé dans mon courriel de ce matin, les
résultats de l'examen intra et du premier tp sont disponibles.
- 07/03/2006 - Un moment Euréka. J'ai découvert un article superbe sur
l'utilisation du langage "R" pour l'économétrie. La référence:
- Hyndman, Rob et Jeff Racine, "Using R to Teach Econometrics,"
Journal of Applied Econometrics 2002
Il contient une introduction au langage et une section avec la programmation
de l'estimateur MCO et la construction d'un test F. L'article est trop récent
pour être accessible sur JSTOR. Je vais vous envoyer la version cahier en
format pdf. L'avantage de R par rapport à Octave est d'être disponible
facilement en versions Windows (beurque!), Linux, MacOS, Unix, etc.
- 14/03/2006 - Pour ceux qui ont décidé d'utiliser le logiciel R
au lieu d'utiliser Stata pour le travail empirique, voici quelques
références utiles. D'abord, vous pouvez télécharger le logiciel
(gratuitement et sans pirater) à partir de la page suivante:
http://www.r-project.org/
Si je comprends bien, la version Windows s'installe à l'aide d'un "wizard"
et l'installation est relativement automatique. Sur mon système (Ubuntu
Linux), des paquets pré-compilés sont disponibles automatiquement à travers
le programme d'installation Synaptic.
Voici un lien vers la version cahier du texte de
l'article de Hyndman et Racine cité ci-dessus:
http://www.buseco.monash.edu.au/depts/ebs/pubs/wpapers/2001/wp10-01.pdf
Voici une courte introduction dans la langue de Molière:
http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf
Un guide d'introduction est disponible à partir de la page d'accueil du
logiciel, ainsi qu'un manuel de référence (qui est assez volumineux).
J'ai déjà réussi à importer les données pour le travail empirique, à estimer
quelques régressions et à créer quelques jolis graphiques. Je vais
probablement donner un petit cours d'introduction durant le laboratoire de
jeudi pour ceux qui sont intéressés.
- 14/03/2006 - Le deuxième tp sera affiché sous peu.
- 14/03/2006 - Pour ceux qui veulent travailler avec le logiciel
Matlab, le site suivant pourrait s'avérer indispensable:
http://www.spatial-econometrics.com/
Il contient d'innombrables routines pour l'économétrie, téléchargeables
gratuitement.
- 14/03/2006 - Voici le lien pour le deuxième exercice:
http://www.er.uqam.ca/nobel/r10735/5272/exer062a.pdf
- 14/03/2006 - Voici la référence promise pour le test de White pour
détecter la présence de l'hétéroscédasticité:
http://econpapers.repec.org/paper/aubautbar/575.03.htm.
Téléchargez les notes de cours en format pdf. Le test est expliqué à la page
120.
- 14/03/2006 - Une très bonne référence pour l'économétrie en R:
http://cran.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf
L'article couvre entre autres le calcul de matrices de variance-covariance
robustes (voir la section 3.3.2). Ceci peut s'avérer très utile dans le
contexte du tp.
- 16/03/2006 - Quelques précisions sur comment télécharger et installer
R. Je suppose que vous utilisez Windows (beurque!) et non un logiciel
supérieur tel que Linux. La page d'accueil pour le logiciel:
http://www.r-project.org
Pour installer le logiciel, il faut choisir un site miroir en cliquant sur
le lien "please choose your preferred CRAN mirror" à partir de la
page d'accueil, par exemple:
http://probability.ca/cran/
Ensuite, il faut cliquer sur le lien "Windows (95 and later)", ensuite sur
le lien "base". Le fichier clé est l'exécutable "R-2.2.1-win32.exe" qui
permet d'installer tout ce qui est nécessaire pour le programme de base en
répondant à quelques questions.
Par la suite, il faut installer quelques paquets optionnels dans le
répertoire "contrib", ensuite dans le sous-répertoire "2.2". Comme vous
allez voir, il y a beaucoup de paquets disponibles. Je recommande
minimalement les paquets suivants: car, lmtest,
sandwich, et zoo.
Voici quelques précisions venant du FAQ pour Windows
(http://cran.r-project.org/bin/windows/base/rw-FAQ.html):
"To install use R-2.2.1-win32.exe. Just double-click on the icon and follow
the instructions. If you installed R this way you can uninstall it from the
Control Panel or Start Menu (unless you supressed making a group for R).
Choose a working directory for R. You will have a shortcut to
R-2.2.1\bin\Rgui.exe on your desktop and/or somewhere on the
Start menu file tree. Right-click each shortcut, select Properties ...
and change the `Start in' field to your working directory."
Concernant l'installation de paquets, voici ce que le FAQ raconte:
"You can install pre-compiled packages either from CRAN or from a local
.zip file by using install.packages: see its help page. There are menu items
on the Packages menu to provide a point-and-click interface to package
installation. The packages for each minor (2.x) version will be stored in a
separate area, so for R 2.2.? the files are in bin/windows/contrib/2.2. You
can try those compiled for earlier versions (but not before 2.0.0), at your
own risk."
Comme je vous ai dit, le document le plus important à lire est sans doute
l'article sur l'économétrie en R cité ci-dessus. Voici quelques
autres liens utiles.
Un résumé des commandes de base dans R:
http://cran.r-project.org/doc/contrib/refcard.pdf
Un autre résumé des commandes de base:
http://cran.r-project.org/doc/contrib/Short-refcard.pdf
Un résumé des commandes disponibles pour les régressions:
http://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf
Pour les maniaques des séries chronologiques:
http://cran.r-project.org/doc/contrib/Ricci-refcard-ts.pdf
- 17/03/2006 - J'ai réussi moi-même à reproduire la plupart des
résultats du Tableau 7.2 dans le manuel. Par contre, même en utilisant la
matrice de variance-covariance robuste les écarts-types ne sont pas
identiques à ceux du tableau. Pas loin, mais pas identiques non plus.
Quelques indices pour le calcul de statistiques t dans R - Afin
de calculer la matrice de variance-covariance robuste, on peut utiliser les
commandes suivantes:
> library(car)
> mymatrix <- hccm(myresults)
où myresults contient les résultats d'une régression MCO. Ensuite, il
faut utiliser les racines carrées des éléments le long de la diagonale de la
matrice de variance-covariance. Les statistiques t sont tout simplement
les coefficients estimés divisés par leurs écart types. Voici les commandes
nécessaires:
> mystderr <- sqrt(diag(mymatrix))
> mybeta <- coefficients(myresults)
> mytratios <- mybeta / mystderr
Notez que dans ce cas, l'opérateur "/" est un opérateur de division
scalaire, qui divise chaque élément de mybeta par l'élément
correspondant de mystderr.
- 17/03/2006 - Quelques indices sur la construction de variables
dichotomiques dans R. Pour reproduire les résultats du Tableau 7.2,
il faut construire une variable dichotomique qui prend la valeur 1 si le
pourcentage d'élèves qui apprennent l'anglais est supérieur à la médiane
dans l'échantillon. La variable en question s'appelle pctel. Si vos
données sont dans l'objet mydata et si vous avez préalablement
invoqué la commande attach(mydata) pour que les variables dans la
banque de données sont en mémoire, la commande suivante:
> summary(pctel)
va vous indiquer que la valeur médiane de la variable est zéro, ce qui veut
dire que plus que la moitié des commissions scolaires dans l'échantillon
ont un pourcentage négligeable de non-anglophones. La commande suivante va
créer une nouvelle variable qui prendra la valeur "TRUE" si le
pourcentage de non-anglophones est supérieur à la médiane et la valeur
"FALSE" dans le cas contraire.
> elgm <- pctel > median(pctel)
Si vous affichez à l'écran le contenu de la variable elgm vous allez
constater qu'il s'agit d'une séquence de "TRUE" et de
"FALSE". La valeur "TRUE" est égale à un par défaut dans
R. Donc, vous pouvez utiliser la variable elgm directement
comme variable explicative dans une régression, et pour capter l'effet
croisé entre le ratio élèves/profs et cette variable, vous pouvez ajoutez la
variable I(tchratio*elgm) à la régression.
- 17/03/2006 - J'ai réussi à obtenir des résultats (presque)
complètement conformes à ceux du livre en programmant la matrice
variance-covariance moi-même (with a little help from the Internet). La
fonction suivante fait le calcul et présente les résultats d'une
régression MCO avec matrice de variance-covariance robuste:
##
## OLS with White's heteroscedasticity consistent standard errors
##
summaryw <- function( model) {
s <- summary( model)
X <- model.matrix( model)
u2 <- residuals( model)^2
XDX <- 0
##
## The last command has the effect of initializing the variable XDX.
## We will be using it on the right hand side of an assignment
## operator inside a do loop, and it needs to be defined before
## we can start performing operations with it.
##
## Here one needs essentially to calculate X'DX. But, since
## D can be huge (nxn), it is better to do it with a loop.
##
for( i in 1:nrow( X)) {
XDX <- XDX + u2[i]*X[i,]%*%t( X[i,])
}
XX1 <- solve( t( X)%*%X)
varcovar <- XX1 %*% XDX %*% XX1
stdh <- sqrt( diag( varcovar))
t <- model$coefficients/stdh
p <- 2*pnorm( -abs( t))
results <- cbind( model$coefficients, stdh, t, p)
dimnames(results) <- dimnames( s$coefficients)
results
}
Vous pouvez inclure cette définition de la fonction (qui s'appelle
summaryw) dans votre fichier de commandes ou l'inclure dans un fichier
à part et la charger en mémoire avec la fonction source("myfunction")
où bien sûr myfunction est le nom du fichier contenant sa définition.
Par la suite, vous substituez le nom de l'objet contenant les résultats de
votre régression comme argument de la fonction summaryw. Par exemple,
si vous invoquez les deux commandes suivantes:
> summary(myresults)
> summaryw(myresults)
la première va donner les résultats de la régression avec matrice de
variance-covariance homoscédastique et la deuxième va donner les résultats
avec la matrice de variance-covariance robuste.
Ça vaut la peine d'étudier la construction de cette fonction. Notez
l'utilisation du symbole "#" pour écrire des commentaires et l'utilisation
de pnorm pour calculer les p-values. Cette commande nous donne la
densité cumulative d'une loi normale (sans options ça va être une loi
normale standardisée). Donc, nous avons:
pnorm(0) = 0.5
pnorm(1.96) = 0.975
pnorm(-1.96) = 0.025
- 20/03/2006 - Certains d'entre vous m'ont dit que vous éprouvez des
difficultés à télécharger les données pour l'étude empirique. J'ai affiché
sur mon site une copie des données en format Stata, ainsi qu'une copie du
fichier avec les définitions détaillées des variables. Voici les
coordonnées:
http://www.er.uqam.ca/nobel/r10735/5272/mcas.dta
http://www.er.uqam.ca/nobel/r10735/5272/mcas.doc
- 28/03/2006 - Je vous rappelle que je vous ai envoyé une référence pour
le calcul de la statistique pour effectuer le test de White. Voir à la date
14/03/2006 ci-dessus.
- 28/03/2006 - Un autre rappel. Tel qu'indiqué ci-dessus, dans R,
le calcul de la matrice variance-covariance robuste se fait avec la commande
hccm, disponible dans la bibliothèque car. Selon le fichier "help" sur la
commande hccm, l'option par défaut (hc0) est d'utiliser la correction de
White:
"The classical White-corrected coefficient covariance matrix
('"hc0'') is
V(b) = inv(X'X) X' diag(e^2) X inv(X'X)
where e^2 are the squared residuals, and X is the model matrix.
The other methods represent adjustments to this formula."
Pourtant, c'est Nicholas Labelle-St-Pierre qui m'indique que c'est avec
l'option "hc1" qu'on peut reproduire les écarts types du Tableau
7.2. Donc, essayez la commande:
> mymatrix <- hccm(myresults,type='hc1')
où, bien sûr, "myresults" est l'objet contenant les résultats de votre
régression.
Sinon, vous pouvez utiliser la fonction définie ci-dessus.
- 04/04/2006 - Voici la référence promise concernant le test de
Hausman:
http://www.glue.umd.edu/~gelbach/626/current/lecture-notes/hausman-test-nov-28-05.pdf
- 04/04/2006 - En cherchant des textes sur les estimateurs de variables
instrumentales, j'ai trouvé celui-ci, qui est écrit pour un auditoire
relativement non technique. Il est bien écrit. (Pour les passionnés de
lectures supplémentaires.)
http://www.dartmouth.edu/~dstaiger/Papers/Staiger\%20IV\%20Handout.pdf
- 11/04/2006 - Quelques conseils sur la préparation du deuxième tp. Il
faut inclure suffisamment d'information pour que je puisse déterminer, peu
importe le logiciel utilisé, que vous avez compris comment générer les mêmes
résultats que ceux du Tableau 7.2 du livre. Donc, remettez une version
imprimée de votre fichier "do file" (Stata), le fichier de commandes .r
(R), le fichier de commandes .m (Matlab), etc. Sinon, la façon d'organiser
la présentation des résultats est votre choix. Vous pouvez remettre une
version imprimée ou en document attaché par courriel.
- 11/04/2006 - Sur les séries chronologiques, j'insiste sur l'importance
de comprendre le concept de la stationnarité. Voici les sections du livre
qui correspondent plus ou moins à ce que j'ai pu couvrir en classe: 12.1,
12.2, 12.3, 12.4, 12.6. Je considère la lecture de ces sections comme étant
obligatoire.
- 26/04/2006 - Je viens d'afficher le corrigé et le questionnaire de
l'examen final. Dans l'ordre habituel:
http://www.er.uqam.ca/nobel/r10735/5272/final06a.pdf
http://www.er.uqam.ca/nobel/r10735/5272/final06b.pdf
- 26/04/2006 - J'ai terminé la correction du final. J'entame la
correction du tp. Je devrai terminer avant la fin de la journée.
- 26/04/2006 - Les résultats sont affichés. Le travail sur le tp a été
admirable sans exception. Je ne pouvais pas vriament ajouter des bonus à des
100%, mais j'ai tenu compte de vos efforts en choisissant l'échelle pour
les notes finales.
- 26/04/2006 - En dépit des notes élevées, je conseillerais fortement de
ne pas demander une dispensation pour le cours ECO7035. De toute façon Doug
Hodgson me confirme qu'il n'accordera pas de dispensations. Vous avez fait
un rattrapage admirable étant donnée votre formation préalable, mais je n'ai
pas pu donner un cours qui s'approchait même de loin du cours de maîtrise.
Au moins vous allez être plus à l'aise avec la manipulation de matrices
(oui, même la concaténation!), avec les limites de probabilité, et avec le
travail sur ordinateur que sans le cours. Je vous remercie. Comme vous
savez, c'est la première fois que je donne le cours et ce fut fort
enrichissant pour moi. Pour vous aussi j'espère.
File translated from
TEX
by
TTH,
version 3.67.
On 26 Apr 2006, 14:55.