Examen de la qualité des évaluations dans les ministères et les organismes

Informations archivées

Les informations archivées sont fournies aux fins de référence, de recherche ou de tenue de documents. Elles ne sont pas assujetties aux normes Web du gouvernement du Canada et n’ont pas été modifiées ou mises à jour depuis leur archivage. Pour obtenir ces informations dans un autre format, veuillez communiquez avec nous.

octobre 2004

TABLE DES MATIÃˆRES

Remerciements

RÃ©sumÃ©
Introduction
Objet
MÃ©thodologie
Constatations
Conclusions et Recommandations

1. Introduction
1.1 Politique d'Ã©valuation du SCT
1.2 Centre d'excellence en Ã©valuation
1.3 Organisation du rapport

2. MÃ©thodologie
2.1 Conception du Guide d'examen des Ã©valuations
2.2 Ã‰chantillon
2.3 Examen des Rapports d'Ã©valuation
2.4 Analyse

3. Constatations
3.1 QualitÃ© des Ã©valuations de la fonction publique fÃ©dÃ©rale : AperÃ§u et faits saillants
3.2 Constatations dÃ©taillÃ©es
3.3 Forces et faiblesses des Ã©valuations de la fonction publique fÃ©dÃ©rale
3.4 Variations de la qualitÃ© selon les caractÃ©ristiques organisationnelles et la date du rapport

4. Conclusions et recommandations
4.1 Conclusions
4.2 Recommandations

ANNEXE A : Gabarit d'examen

ANNEXE B : RÃ©partition des rapports examinÃ©s par ministÃ¨re et organisme

Remerciements

Un groupe de travail a Ã©tÃ© mis sur pied afin de fournir des commentaires et des suggestions pour l'examen. Nous dÃ©sirons exprimer nos sincÃ¨res remerciements aux personnes suivantes :Un groupe de travail a Ã©tÃ© mis sur pied afin de fournir des commentaires et des suggestions pour l'examen. Nous dÃ©sirons exprimer nos sincÃ¨res remerciements aux personnes suivantes :

DRHC - Serge Bertrand
Service correctionnel du Canada - Christa Gillis
ACIA - Theresa Iuliano
MAECI - Stephen Kester
Diversification de l'Ã©conomie de l'Ouest Canada - Kathy Locke
AAC - Eric Seraphim
Transports Canada - Unnati Vasavada
SantÃ© Canada - Walter Zubrycky

Elles ont fourni de la rÃ©troaction sur le mandat de l'Ã©tude, des suggestions concernant le gabarit d'examen et des commentaires sur l'Ã©bauche du rapport.

Nous sommes trÃ¨s reconnaissants Ã Glenn Crone et Zeljka Spasojevic du Centre d'excellence en Ã©valuation, SecrÃ©tariat du Conseil du TrÃ©sor du Canada, de leur soutien continu.

Les membres du Groupe ont travaillÃ© en collaboration avec Shelley Borys, Michael Callahan, Mary Latreille, Norm Leckie, et Janice Remai de EKOS Research Associates, Inc.

RÃ©sumÃ©

Introduction
L'Ã©valuation soutient le but du gouvernement du Canada de devenir une organisation apprenante. Elle y rÃ©ussit en aidant les cadres supÃ©rieurs, les gestionnaires de programme et les dÃ©cideurs Ã dÃ©couvrir si leurs initiatives fonctionnent ou non et si elles atteignent les objectifs; elle les aide aussi Ã Ã©tablir s'il y a lieu de poursuivre ces initiatives et Ã dÃ©terminer comment mieux les concevoir et les exÃ©cuter afin d'atteindre les objectifs d'une faÃ§on rentable. La qualitÃ© des rapports d'Ã©valuation est primordiale pour que la fonction d'Ã©valuation rÃ©ponde Ã ces besoins d'information.

Objet
En 2001, le SecrÃ©tariat du Conseil du TrÃ©sor (SCT) a crÃ©Ã© le Centre d'excellence en Ã©valuation (CEE) et a Ã©tabli une nouvelle Politique d'Ã©valuation destinÃ©e Ã renforcer la fonction d'Ã©valuation et la qualitÃ© des rapports. L'un des objectifs clÃ©s du prÃ©sent rapport est de dÃ©terminer si la qualitÃ© des rapports est acceptable et s'il y a eu une amÃ©lioration de la qualitÃ©. L'un des aspects importants de ce travail est de promouvoir des rapports d'Ã©valuation de qualitÃ©. Le prÃ©sent examen reprÃ©sente un Ã©lÃ©ment de la stratÃ©gie d'ensemble du CEE pour surveiller et renforcer la qualitÃ© des rapports. Les autres activitÃ©s comprennent : l'Ã©tude des meilleures pratiques; une enquÃªte annuelle sur la santÃ© des unitÃ©s d'Ã©valuation des ministÃ¨res et des petits organismes; des rencontres individuelles, l'examen continu des Ã©valuations, les Cadres de gestion et de responsabilisation axÃ©s sur les rÃ©sultats (CGRR), les plans d'Ã©valuation ministÃ©riels et un rapport annuel documentant les constatations des Ã©valuations et indiquant comment elles contribuent au renforcement de la responsabilisation et Ã l'examen des dÃ©penses du gouvernement.

MÃ©thodologie
Diverses ressources ont servi Ã l'Ã©laboration des critÃ¨res que nous avons utilisÃ©s pour notre examen, dont le Guide d'examen des rapports d'Ã©valuation du Centre d'excellence en Ã©valuation, SCT, janvier 2004 et des extraits du Rapport de 1993 du Bureau du vÃ©rificateur gÃ©nÃ©ral du Canada (BVG) sur l'Ã©valuation de programmes (critiques des rapports d'Ã©valuation). Nous avons Ã©galement consultÃ© un groupe de rÃ©fÃ©rence d'unitÃ©s d'Ã©valuation de ministÃ¨res et d'organismes. Le gabarit que nous avons utilisÃ© pour l'examen se trouve Ã l'Annexe A. ^[1]

Constatations
Les constatations du prÃ©sent l'examen indiquent que la plupart des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale sont de qualitÃ© acceptable, quoique nous ayons dÃ©terminÃ© que presque le quart des Ã©valuations (23 %) Ã©taient inadÃ©quates dans l'ensemble. Nous n'avons pas observÃ© de variations claires et constantes de la qualitÃ© pour les organisations fÃ©dÃ©rales de tailles diffÃ©rentes et pour les ministÃ¨res par rapport aux organismes. Une comparaison des rapports Ã©laborÃ©s avant avril 2002 et de ceux qui ont Ã©tÃ© Ã©laborÃ©s par la suite dÃ©montre toutefois une amÃ©lioration de la qualitÃ© concernant un certain nombre de critÃ¨res dans les Ã©valuations les plus rÃ©centes. Par exemple : les questions de rentabilitÃ© ont Ã©tÃ© traitÃ©es; il y a une rigueur mÃ©thodologique; les solutions de remplacement sont indiquÃ©es; les constatations prÃ©sentÃ©es sont fondÃ©es sur des donnÃ©es; ils contiennent des recommandations formelles. Cette amÃ©lioration de la qualitÃ© avec le temps laisse croire que les efforts du SCT pour amÃ©liorer la qualitÃ© des Ã©valuations ont peut-Ãªtre un effet positif, en ayant accordÃ© une annÃ©e, jusqu'en avril 2002, aux ministÃ¨res et aux organismes pour comprendre entiÃ¨rement la Politique et pour donner le temps au nouveau Centre d'excellence en Ã©valuation de commencer Ã fonctionner. Mais il y a un besoin pressant d'amÃ©liorer encore les choses, comme l'indiquent les constatations qui suivent.

Les principales forces des Ã©valuations examinÃ©es dans le prÃ©sent examen incluent ce qui suit :

une description complÃ¨te du programme ou de l'initiative examinÃ©, y compris ses ressources, ses bÃ©nÃ©ficiaires et ses intÃ©ressÃ©s;
une dÃ©claration claire des objectifs d'Ã©valuation;
le recours Ã des sources de donnÃ©es multiples dans la mÃ©thodologie;
une bonne prÃ©sentation des constatations, en particulier, concernant les Ã©lÃ©ments de la pertinence, de l'exÃ©cution et de la mise en Guvre;
des recommandations formelles ou des propositions d'amÃ©liorations qui dÃ©coulent logiquement des constatations et des conclusions;
des rapports bien rÃ©digÃ©s et bien organisÃ©s.

Voici d'autre part quelques faiblesses des Ã©valuations et des rapports :

seulement six rapports d'Ã©valuation sur dix expliquaient le choix du moment et la signification de l'Ã©valuation;
la plupart des rapports (les deux tiers) ne faisaient qu'Ã©numÃ©rer les Ã©lÃ©ments d'Ã©valuation et trÃ¨s peu en discutaient (environ le quart);
les questions de rentabilitÃ© Ã©taient couvertes de faÃ§on superficielle;
un grand nombre de rapports ne contenaient pas de description complÃ¨te des principaux aspects de la mÃ©thodologie; si juste un peu plus de la moitiÃ© des rapports dÃ©crivaient la mÃ©thodologie, quatre sur dix ont seulement Ã©numÃ©rÃ© quelques aspects de la mÃ©thodologie et seulement le quart ont fait rÃ©fÃ©rence Ã un document technique;
on note peu d'intÃ©gration de donnÃ©es issues d'un systÃ¨me de mesure du rendement;
seulement une minoritÃ© des concepts d'Ã©valuation incluaient des caractÃ©ristiques d'optimisation de la rigueur de l'analyse comme un groupe de comparaison (13 %), des mesures de rÃ©fÃ©rence (14 %) ou une comparaison avec des normes, de la documentation ou un autre point de rÃ©fÃ©rence (22 %). Seulement 26 % ont utilisÃ© des entrevues avec des rÃ©pondants indÃ©pendants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme;
seulement environ quatre rapports d'Ã©valuation sur dix comprenaient une dÃ©claration des limites ou des contraintes de l'Ã©valuation;
seulement environ le tiers des Ã©valuations prÃ©sentaient des constatations permettant de dÃ©terminer si le programme fait double emploi ou s'il est en contraste avec d'autres programmes ou d'autres initiatives;
seulement le quart des Ã©valuations examinaient les rÃ©sultats fortuits (25 %) ou traitaient les impacts diffÃ©rentiels (26 %);
seulement 26 % des Ã©valuations prÃ©sentaient des constatations concernant des dÃ©marches de remplacement susceptibles d'Ãªtre plus rentables, quoique la couverture de cet Ã©lÃ©ment ait augmentÃ© dans les rapports les plus rÃ©cents (31 % aprÃ¨s avril 2002 contre 16 % avant avril 2002);
nous avons dÃ©terminÃ© que presque le quart des Ã©valuations (24 %) Ã©taient inadÃ©quates dans leur prestation de conclusions objectives, fondÃ©es sur des donnÃ©es concernant la pertinence, la rÃ©ussite ou la rentabilitÃ©, ou tout cela;
parmi les rapports qui contenaient des recommandations, seulement 26 % indiquaient des scÃ©narios de remplacement; et
moins de la moitiÃ© des rapports d'Ã©valuation incluaient une rÃ©ponse de la direction (48 %) ou un plan d'action (33 %);
25 % des rapports qui contenaient des recommandations incluaient une recommandation relative au financement global, et dans tous ces cas, la recommandation Ã©tait d'accroÃ®tre le financement;
aucun rapport ne prÃ©sentait de donnÃ©es indiquant qu'un programme n'Ã©tait pas pertinent ou qu'il n'Ã©tait pas nÃ©cessaire.

Conclusions et Recommandations
Dans l'ensemble, la plupart des Ã©valuations que nous avons examinÃ©es sont de qualitÃ© raisonnable. Nous avons dÃ©terminÃ© que la majoritÃ© Ã©taient adÃ©quates dans l'ensemble (45 %) ou plus qu'adÃ©quates (32 %). Mais nous avons aussi dÃ©terminÃ© qu'une proportion considÃ©rable des Ã©valuations (23 %) Ã©taient inadÃ©quates, une constatation qu'il faut traiter. C'est pourquoi le prÃ©sent rapport recommande que le Centre d'excellence en Ã©valuation du SCT prenne les mesures suivantes :

Encourager les divisions des Ã©valuations des ministÃ¨res et des organismes fÃ©dÃ©raux Ã renforcer leurs rapports d'Ã©valuation en traitant les principales faiblesses dÃ©terminÃ©es dans le prÃ©sent examen.
Peaufiner les lignes directrices et les critÃ¨res du Conseil du TrÃ©sor concernant les caractÃ©ristiques attendues des (1) mÃ©thodologies d'Ã©valuation et (2) des rapports d'Ã©valuation, et les diffuser.
Poursuivre la mise en oeuvre d'une dÃ©marche rigoureuse de surveillance de la qualitÃ© des Ã©valuations et l'utiliser comme base d'Ã©laboration de fiches de rendement individuelles sur la qualitÃ© et la santÃ© globale de la fonction d'Ã©valuation par ministÃ¨re et par petit organisme.
Indiquer des mesures, y compris une structure de stimulants et des normes, afin d'assurer que les ministÃ¨res et les organismes prÃ©sentent des Ã©valuations et des examens rÃ©alisÃ©s d'une faÃ§on responsable et raisonnable. Le respect de ces normes par les ministÃ¨res et les organismes devrait Ãªtre annoncÃ© publiquement.

1. INTRODUCTION

L'Ã©valuation soutient le but du gouvernement du Canada de devenir une organisation apprenante. Elle y rÃ©ussit en aidant les gestionnaires de programme et les dÃ©cideurs Ã dÃ©couvrir si leurs initiatives fonctionnent ou non et si elles atteignent les objectifs, Ã dÃ©terminer s'il y a lieu de poursuivre ces initiatives et Ã dÃ©terminer comment mieux les concevoir et les exÃ©cuter afin d'atteindre les objectifs d'une faÃ§on rentable. Le SecrÃ©tariat du Conseil du TrÃ©sor (SCT) a introduit la Politique d'Ã©valuation (la Politique) en avril 2001 afin de clarifier le rÃ´le important de l'Ã©valuation dans son cadre de gestion.

Le Centre d'excellence en Ã©valuation (CEE) a Ã©tÃ© Ã©tabli en 2001 pour faciliter la mise en oeuvre de la nouvelle Politique d'Ã©valuation et pour en surveiller la rÃ©ussite. Le CEE, en surveillant les pratiques d'Ã©valuation des ministÃ¨res et des organismes fÃ©dÃ©raux, a dÃ©terminÃ© qu'il y avait lieu d'examiner le niveau de qualitÃ© des Ã©valuations de ces ministÃ¨res et de ces organismes, afin de dÃ©terminer les forces et les faiblesses des pratiques d'Ã©valuation et les rÃ©ponses convenables. Le prÃ©sent document contient le projet de Rapport final de cet examen des Ã©valuations de la fonction publique fÃ©dÃ©rale.

1.1 Politique d'Ã©valuation du SCT
Dans le contexte de renouveau du gouvernement fÃ©dÃ©ral, les Ã©valuations ont pris considÃ©rablement plus d'importance, mais il n'en a pas Ã©tÃ© ainsi de la capacitÃ© de les exÃ©cuter [2] . Les ressources, humaines et autres, consacrÃ©es Ã l'Ã©valuation ont diminuÃ© rÃ©guliÃ¨rement depuis le dÃ©but des annÃ©es 1990. De plus, la Politique d'Ã©valuation courante a accru la tÃ¢che requise pour faire les Ã©valuations.

La Politique d'Ã©valuation du SCT, qui a Ã©tÃ© rÃ©visÃ©e la derniÃ¨re fois le 1er avril 2001, soutient Â« l'engagement permanent du gouvernement en vue de l'amÃ©lioration continue de la gestion et de la responsabilisation Â», comme l'a dÃ©clarÃ© la ministre Robillard dans un communiquÃ© de presse du 14 fÃ©vrier 2003 ^[3] . Dans la Politique d'Ã©valuation courante, l'Ã©valuation a un rÃ´le clÃ© Ã jouer pour soutenir la gestion des rÃ©sultats dans la fonction publique. La Politique repose sur les trois principes suivants : les gestionnaires de la fonction publique ont la responsabilitÃ© de rÃ©aliser les objectifs et d'en faire rapport; l'Ã©valuation rigoureuse et objective est un outil important de la gestion des rÃ©sultats; et les ministÃ¨res et les organismes sont responsables, avec le soutien du SCT, d'assurer la rigueur des Ã©valuations. L'objectif dÃ©clarÃ© de la Politique est de Â« faire en sorte que le gouvernement dispose en temps voulu de renseignements stratÃ©giques, objectifs et solides au sujet du rendement de ses politiques, programmes et initiatives, pour produire de meilleurs rÃ©sultats pour les Canadiens et les Canadiennes. Â» Ses exigences clÃ©s sont les suivantes :

Ã‰tablir une capacitÃ© d'Ã©valuation adÃ©quate, incluant la haute direction.
AccroÃ®tre la portÃ©e des Ã©valuations en traitant notamment les politiques, les programmes et les initiatives, en plus des activitÃ©s semblables qui sont exÃ©cutÃ©es dans le cadre de mÃ©canismes de partenariat (interministÃ©riels, intergouvernementaux, etc.).
Accorder une importance accrue Ã la surveillance du rendement et aux rÃ©sultats initiaux. Pour ce faire :
- Ã‰laborer des cadres de gestion et de responsabilisation axÃ©s sur les rÃ©sultats (CGRR) Ã l'Ã©gard des politiques, des initiatives et des programmes nouveaux ou renouvelÃ©s.
- exÃ©cuter des activitÃ©s continues de surveillance et de mesure du rendement;
- traiter les questions liÃ©es aux activitÃ©s initiales de mise en oeuvre et d'administration;
- traiter les questions liÃ©es Ã la pertinence, aux rÃ©sultats et Ã la rentabilitÃ©.
Ã‰laborer des plans d'Ã©valuation stratÃ©gique.
Incorporer l'Ã©valuation Ã la gestion et Ã la prise de dÃ©cisions stratÃ©giques.
Mettre en Guvre des normes de pratique simplifiÃ©es et consolidÃ©es.

1.2 Centre d'excellence en Ã©valuation
Le CEE a Ã©tÃ© Ã©tabli en mÃªme temps que la Politique d'Ã©valuation pour assurer un leadership et faciliter la mise en Guvre de la Politique. L'examen courant de la qualitÃ© des Ã©valuations soutiendra le mandat de surveillance et de rapport du CEE concernant l'Ã©tat de la capacitÃ© d'Ã©valuation dans l'ensemble de la fonction publique fÃ©dÃ©rale. Le CEE a Ã©tÃ© conÃ§u pour offrir les fonctions clÃ©s suivantes :

servir de plaque tournante du leadership de la fonction d'Ã©valuation de la fonction publique fÃ©dÃ©rale;
lancer des initiatives relatives Ã des dÃ©fis partagÃ©s dans la collectivitÃ©, comme la conception d'un cadre des ressources humaines visant les besoins Ã long terme en matiÃ¨re de recrutement, de formation et de perfectionnement;
soutenir le renforcement de la capacitÃ©, l'amÃ©lioration des pratiques et le renforcement de la collectivitÃ© de l'Ã©valuation de la fonction publique fÃ©dÃ©rale.

Le CEE exÃ©cute Ã ces fins des activitÃ©s comme : la mise en Guvre de politiques; la surveillance; le renforcement de la capacitÃ©; les conseils stratÃ©giques; les communications et le rÃ©seautage.

1.3 Organisation du rapport
Le prÃ©sent document contient les rÃ©sultats de l'Â« Examen de la qualitÃ© des Ã©valuations dans les ministÃ¨res et les organismes Â». Notre mÃ©thodologie est prÃ©sentÃ©e au chapitre suivant. Les constatations sont prÃ©sentÃ©es au chapitre 3 et les conclusions au chapitre 4.

2. MÃ‰THODOLOGIE

Le prÃ©sent chapitre dÃ©crit la dÃ©marche mÃ©thodologique du projet. La description est divisÃ©e en quatre sections : la conception du guide d'examen; l'Ã©chantillon; l'examen des rapports d'Ã©valuation; et une note concernant l'analyse.

2.1 Conception du Guide d'examen des Ã©valuations
Nous avons Ã©valuÃ© diverses ressources dans l'Ã©laboration des critÃ¨res aux fins du prÃ©sent examen. En cherchant les indicateurs possibles de qualitÃ© pour lesquels nous allions recueillir des donnÃ©es pour notre examen, nous nous sommes d'abord tournÃ©s vers le Cadre de gestion et de responsabilisation axÃ© sur les rÃ©sultats (CGRR) pour la Politique d'Ã©valuation du SecrÃ©tariat du Conseil du TrÃ©sor. Une analyse du CGRR a rÃ©vÃ©lÃ© que l'examen facilitera particuliÃ¨rement le traitement du groupe des questions prÃ©sentÃ©es Ã la Section E, Questions liÃ©es au progrÃ¨s et Ã la rÃ©ussite, c'est-Ã -dire : Â« La fonction d'Ã©valuation produit-elle des commentaires opportuns et efficaces intÃ©grÃ©s Ã la prise de dÃ©cisions des ministÃ¨res? Â»; contribuant aux rÃ©sultats immÃ©diats attendus de la Politique, Ã savoir des rapports crÃ©dibles en temps voulu et fondÃ©s sur des donnÃ©es. Toutefois, Ã cause de l'ampleur du projet, il n'est pas possible d'Ã©valuer si les rapports sont prÃ©sentÃ©s en temps voulu. En outre, nous avons examinÃ© seulement les rapports d'Ã©valuation achevÃ©s depuis que la Politique a Ã©tÃ© mise en Guvre; nous n'avons donc pas de mesure de rÃ©fÃ©rence de la qualitÃ© pour comparer les rÃ©sultats de notre examen.

De nombreux documents traitent la question des critÃ¨res de qualitÃ© qui ont Ã©tÃ© consultÃ©s au cours de la conception du prÃ©sent travail. En voici quelques-uns :

Â« Guide d'examen des rapports d'Ã©valuation Â», Ã©laborÃ© par le Centre d'excellence en Ã©valuation, SCT, janvier 2004;
Â« Liste de vÃ©rification pour le contrÃ´le interne de l'Ã©tude d'Ã©valuation : rÃ©alisations et rapports, processus et travail des entrepreneurs Â», prÃ©parÃ©e par la Direction gÃ©nÃ©rale de l'Ã©valuation des programmes, DRHC, septembre 2003;
Â« Guide d'Ã©valuation des rapports d'Ã©valuation de SantÃ© Canada Â», prÃ©parÃ© par la Division de l'Ã©valuation des programmes du MinistÃ¨re, SantÃ© Canada, avril 2003;
un cadre d'Ã©valuation de la qualitÃ© des Ã©valuations, Ã©laborÃ© par un consultant externe Ã l'intention du Bureau du vÃ©rificateur gÃ©nÃ©ral (non mis en Guvre);
extraits du Rapport de 1993 du BVG sur l'Ã©valuation de programmes (Â« critiques des rapports d'Ã©valuation Â»), Ã©laborÃ©s par le CEE.

Voici les questions centrales de notre Ã©tude : Est-ce que la qualitÃ© des rapports est acceptable et est-ce qu'il y a eu une amÃ©lioration de la qualitÃ©? Notons qu'un simple examen des rapports d'Ã©valuation ne nous a pas permis de dÃ©terminer s'il y a eu une amÃ©lioration de la qualitÃ© des rapports. On peut obtenir ce genre d'information seulement en faisant des comparaisons avec les Ã©valuations faites avant l'adoption de la Politique et en interrogeant les responsables. Toutefois, selon un examen de la Politique d'Ã©valuation (y compris l'Annexe B de la Politique), de son CGRR et du matÃ©riel mentionnÃ© ci-dessus, les indicateurs possibles qui ont Ã©tÃ© identifiÃ©s pour mesurer la qualitÃ© des rapports d'Ã©valuation comportent les caractÃ©ristiques suivantes :

ils sont rÃ©digÃ©s avec clartÃ©, concision et simplicitÃ©;
ils dÃ©crivent clairement le programme, la politique ou l'initiative examinÃ©, y compris ses objectifs, ses extrants, ses rÃ©sultats attendus, sa portÃ©e et ses ressources;
ils ont une Ã©valuation des rÃ©sultats rÃ©alisÃ©s par la politique, le programme ou l'initiative;
ils ont une description de l'Ã©valuation, notamment le choix du moment; la mÃ©thodologie; les objectifs et les Ã©lÃ©ments d'Ã©valuation; et comment l'Ã©valuation se situe, et son importance, par rapport aux opÃ©rations gÃ©nÃ©rales du ministÃ¨re ou de l'organisme;
ils indiquent les limites de l'Ã©valuation, concernant le contexte, la portÃ©e, les mÃ©thodes et les conclusions;
ils ont une mÃ©thodologie convenable (p. ex. des sources de donnÃ©es multiples);
ils ont des conclusions qui traitent clairement les principaux Ã©lÃ©ments d'Ã©valuation concernant la pertinence, les rÃ©ussites et les incidences et la rentabilitÃ© (selon le type d'Ã©valuation - formative ou sommative);
ils contiennent seulement l'information nÃ©cessaire pour comprendre les constatations, les conclusions et les recommandations;
les constatations prÃ©sentÃ©es sont crÃ©dibles et fondÃ©es sur des donnÃ©es, par exemple :
- des donnÃ©es rÃ©unies dans des enquÃªtes auprÃ¨s d'un groupe reprÃ©sentatif de participants et comparÃ©s Ã un groupe comparable de non-rÃ©pondants;
- des donnÃ©es dÃ©rivÃ©es de comparaisons avec des mesures de rÃ©fÃ©rence du systÃ¨me de mesure du rendement; et
- des donnÃ©es qualitatives obtenues de rÃ©pondants clÃ©s qui n'ont pas un intÃ©rÃªt dans le programme ou qui connaissent vraiment la question;
ils ont des conclusions et des recommandations qui Ã©manent logiquement des constatations de l'Ã©valuation;
ils ont des recommandations claires et atteignables indiquant les mesures Ã prendre et le cadre temporel;
ils analysent et expliquent l'exposition au risque des problÃ¨mes dÃ©terminÃ©s et par rapport aux recommandations prÃ©sentÃ©es.

Nous nous sommes fondÃ©s sur notre analyse de tout le matÃ©riel de rÃ©fÃ©rence mentionnÃ© ci-dessus pour Ã©laborer un projet de gabarit d'examen. Comme suite Ã l'Ã©laboration d'un projet d'instrument contenant les critÃ¨res proposÃ©s et l'examen de celui-ci avec les autoritÃ©s responsables du projet, nous avons rencontrÃ© le groupe de travail du CEE (reprÃ©sentant huit ministÃ¨res fÃ©dÃ©raux) pour discuter des critÃ¨res et de la portÃ©e de l'examen. Les rÃ©visions apportÃ©es au gabarit d'examen tiennent compte des commentaires que nous avons reÃ§us Ã ce moment-lÃ . Le gabarit final utilisÃ© pour l'examen se trouve Ã l'Annexe A.

2.2 Ã‰chantillon
Nous avions proposÃ© de choisir l'Ã©chantillon de rapports d'Ã©valuation dans une base de donnÃ©es compilÃ©e par le CEE sur les rapports d'Ã©valuation effectuÃ©s depuis l'adoption de la Politique d'Ã©valuation, c'est-Ã -dire l'exercice financier 2001-2002. La Â« population Â» des rapports serait stratifiÃ©e selon certaines variables clÃ©s d'intÃ©rÃªt. Les titres des rapports seraient choisis en proportion des caractÃ©ristiques de la population, ou en nombres suffisants pour assurer la reprÃ©sentation de tous les sous-groupes clÃ©s.

Dans la mesure oÃ¹ la stratification Ã©tait possible ou dÃ©sirÃ©e, ou les deux, nous avions un certain nombre de stratifications possibles de l'Ã©chantillon et de variables de sÃ©lection, par exemple : le type d'Ã©valuation, formative ou sommative; la taille et le type de ministÃ¨re ou d'organisme; l'annÃ©e de l'Ã©valuation (on peut s'attendre en effet Ã ce que la qualitÃ© des Ã©valuations augmente avec le temps, Ã mesure que la Politique est mise en oeuvre et que les Ã©valuateurs et les responsables du CEE se familiarisent avec elle).

Il s'est avÃ©rÃ© que la population des rapports Ã prendre en considÃ©ration pour notre examen Ã©tait constituÃ©e seulement des rapports d'Ã©valuation ^[4] qui ont Ã©tÃ© prÃ©sentÃ©s au SCT. MÃªme si les ministÃ¨res sont tenus de prÃ©senter tous les rapports d'Ã©valuation produits, ils ne semblent pas le faire de maniÃ¨re fiable. Selon l'Ã©tude d'Ã©valuation des capacitÃ©s exÃ©cutÃ©e par le CEE il y a deux ans, il semble qu'environ 250 Ã©valuations sont effectuÃ©es chaque annÃ©e, ce qui aurait dÃ» donner 500 rapports Ã examiner. Mais le SCT a reÃ§u seulement 214 rapports produits au cours des deux derniÃ¨res annÃ©es (les annÃ©es visÃ©es par le prÃ©sent examen). De plus, d'autres dossiers d'Ã©valuation sont en format Ã©lectronique (liens sur le Web et examens par exemple), mais ne respectaient pas la dÃ©finition de Â« copie complÃ¨te sur papier d'une Ã©valuation disponible aux fins d'examen Â».

Ã‰tant donnÃ© le temps limitÃ© pour effectuer l'examen, il Ã©tait impossible d'obtenir la sÃ©rie complÃ¨te des rapports d'Ã©valuation des ministÃ¨res individuels. Il est de plus difficile de dÃ©terminer quelle aurait Ã©tÃ© l'incidence sur l'objectivitÃ© de l'Ã©chantillon si nous avions rÃ©clamÃ© des ministÃ¨res et des organismes qu'ils nous prÃ©sentent des rapports aux fins du prÃ©sent examen.

Il est donc important de noter que nous avons examinÃ© cet Ã©chantillon limitÃ© de rapports d'Ã©valuation qui ont Ã©tÃ© prÃ©sentÃ©s au SCT et qui Ã©taient complets. Ã‰tant donnÃ© que l'Ã©chantillon ne comprend pas l'ensemble de la population, il est difficile d'Ã©valuer dans quelle mesure le lot des rapports examinÃ©s est biaisÃ© ou non.

Dans le processus de recherche de rapports pour l'examen, nous avons consultÃ© la sÃ©rie complÃ¨te des rapports prÃ©sentÃ©s aprÃ¨s le 1er avril 2001 et offerts par l'entremise du SCT. MÃªme si la base de donnÃ©es indiquait que plus de 200 rapports Ã©taient disponibles pour cet exercice, il a Ã©tÃ© Ã©tabli qu'un grand nombre des dossiers ne convenaient pas pour l'examen. Certains dossiers contenaient par exemple seulement un rÃ©sumÃ© d'un rapport, ou Ã©taient des rapports sur des vÃ©rifications, des Ã©tudes spÃ©ciales (par exemple pour fournir une analyse approfondie d'une question destinÃ©e Ã faire partie d'une Ã©valuation, mais qui n'Ã©tait pas une Ã©valuation en elle-mÃªme) ou d'autres types d'examen qui ne constituaient pas une Ã©valuation.

Le plan de travail consistait Ã examiner un total de 110 rapports. Nous disposions finalement de 122 rapports Ã examiner et nous en avons examinÃ© 115. Ceux qui n'ont pas Ã©tÃ© examinÃ©s (n=7) Ã©taient des rapports de ministÃ¨res qui Ã©taient dÃ©jÃ trÃ¨s reprÃ©sentÃ©s dans l'Ã©chantillon. Nous avons essayÃ© de limiter le nombre total de rapports examinÃ©s pour un ministÃ¨re en particulier, afin d'assurer la reprÃ©sentation dans la population des rapports disponibles. Il s'est avÃ©rÃ© que plusieurs ministÃ¨res avaient 10 ou 12 rapports qui ont Ã©tÃ© examinÃ©s (et ces ministÃ¨res Ã©taient Ã©galement ceux qui offraient des rapports qui n'ont pas Ã©tÃ© examinÃ©s).

Le CEE avait Ã©laborÃ© six des rapports de l'Ã©chantillon. Comme il n'Ã©tait pas convenable que nous examinions nos propres rapports, des analystes du SCT ont Ã©tÃ© formÃ©s pour appliquer le gabarit d'examen et ont ensuite exÃ©cutÃ© les examens de cinq de ces six rapports (le sixiÃ¨me rapport provenait d'un ministÃ¨re dÃ©jÃ bien reprÃ©sentÃ© et n'Ã©tait par consÃ©quent pas nÃ©cessaire).

La distribution des rapports examinÃ©s par ministÃ¨re et par organisme se trouve Ã l'Annexe B.

2.3 Examen des Rapports d'Ã©valuation
Un long processus prÃ©test auquel ont pris part tous les examinateurs a Ã©tÃ© entrepris, non seulement pour mettre Ã l'Ã©preuve le gabarit d'examen, mais Ã©galement pour assurer la fiabilitÃ© inter-Ã©valuateur. Chacun des membres de l'Ã©quipe de base a examinÃ© un total de trois rapports. AprÃ¨s l'examen de chaque rapport et l'application du gabarit, l'Ã©quipe s'est rÃ©unie pour discuter en dÃ©tails des notes attribuÃ©es par chaque examinateur. Quand il y avait des Ã©carts, la discussion subsÃ©quente a permis de clarifier la signification de certains aspects de l'examen ou de certaines notes. Le gabarit a Ã©galement Ã©tÃ© rÃ©visÃ© pour tenir compte de ces Ã©claircissements additionnels quand c'Ã©tait possible. On utilisait ensuite le gabarit rÃ©visÃ© pour l'examen de prÃ©test suivant. Il a Ã©tÃ© dÃ©terminÃ© Ã la fin du troisiÃ¨me examen de prÃ©test que la fiabilitÃ© inter Ã©valuateur (Ã©valuÃ©e qualitativement) Ã©tait suffisamment Ã©levÃ©e pour entreprendre les examens indÃ©pendants.

Suite aux prÃ©tests et Ã la mise au point du gabarit d'examen, nous avons entrepris l'examen complet des Ã©valuations. Chacun des rapports d'Ã©valuation a Ã©tÃ© Ã©valuÃ© par un seul examinateur. Tous les examinateurs Ã©taient des Ã©valuateurs chevronnÃ©s possÃ©dant des antÃ©cÃ©dents considÃ©rables en matiÃ¨re d'Ã©valuation des programmes de la fonction publique fÃ©dÃ©rale. L'examen de chaque rapport a durÃ© en moyenne deux heures et demie.

2.4 Analyse
Nous avons exÃ©cutÃ© des analyses Ã une variable et des analyses croisÃ©es sur les donnÃ©es des examens. La plupart des critÃ¨res Ã©valuÃ©s dans les examens ont Ã©tÃ© notÃ©s sur une Ã©chelle de cinq points allant de 1 (Â« mÃ©diocre Â») Ã 5 (Â« excellente Â»), la note mÃ©diane 3 signifiant Â« adÃ©quate Â». Nous avons fait une rÃ©duction pour les analyses, les notes y reprÃ©sentant alors les trois catÃ©gories suivantes : 1-2 (Â« inadÃ©quate Â»), 3 (Â« adÃ©quate Â») et 4-5 (Â« plus qu'adÃ©quate Â»). Nous avons fait ensuite des croisements selon la taille du ministÃ¨re ou de l'organisme. Trois catÃ©gories ont Ã©tÃ© Ã©laborÃ©es : petite (500 ETP ou moins, n=18) ^[5] ; moyenne (501 Ã 4 600 ETP, n=51); et grande (plus de 4 600 employÃ©s, n=46). Nous avons Ã©galement fait des croisements sur l'annÃ©e du rapport (jusqu'Ã mars 2002, n=37, et avril 2002 et aprÃ¨s, n=78) et Ã©galement sur les ministÃ¨res (n=91) par rapport aux organismes (n=24). Les tableaux des rÃ©sultats sont prÃ©sentÃ©s Ã l'Annexe technique dans un document distinct.

A) Limites

La qualitÃ© des Ã©valuations peut Ãªtre mesurÃ©e de diffÃ©rentes maniÃ¨res. Durant cet examen, nous nous sommes penchÃ©s sur la qualitÃ© des Ã©valuations, selon les rapports d'Ã©valuation. Il convient de signaler qu'une autre dimension importante de la qualitÃ© des Ã©valuations, non examinÃ©e durant cet examen, est l'utilitÃ©, comme l'indique le degrÃ© de mise en Guvre des recommandations d'Ã©valuation. Le CEE a prÃ©cisÃ© qu'il examinera ce critÃ¨re de qualitÃ© en recourant Ã d'autres sources de donnÃ©es.

Il est important de noter qu'Ã titre d'examinateurs externes d'un rapport d'Ã©valuation, nous n'avons pas toujours eu toute l'information sur les limites possibles d'une Ã©valuation particuliÃ¨re (p.ex., les restrictions budgÃ©taires, le temps allouÃ©, les contraintes internes) ou le contexte (nous n'avons pas interrogÃ© les gestionnaires de programme ou des Ã©valuations). Il est donc possible que certains rapports apparaissent faibles dans notre examen, mÃªme s'ils Ã©taient peut-Ãªtre en fait trÃ¨s forts compte tenu du contexte ou des limites externes qu'ils comportaient.

Le Groupe de travail du CEE a aussi mentionnÃ© que la qualitÃ© des rapports d'Ã©valuation sur lesquels a portÃ© cet examen peut sembler faible Ã certains Ã©gards parce que les ministÃ¨res ignoraient les critÃ¨res d'Ã©valuation avant d'effectuer les Ã©valuations. De plus, il a mentionnÃ© que les ministÃ¨res peuvent avoir Ã©valuÃ© ou inclus des critÃ¨res prÃ©vus dans cet examen, sans en traiter dans le rapport d'Ã©valuation, parce que ceux-ci ont fait l'objet d'autres rapports ou n'ont pas Ã©tÃ© jugÃ©s pertinents pour ce rapport.

De plus, en raison des contraintes budgÃ©taires et temporelles qui s'appliquaient au prÃ©sent examen (seulement deux heures et demie pour examiner chaque rapport), il a Ã©tÃ© dÃ©terminÃ© avec le client au cours de la phase de conception que l'examen serait essentiellement quantitatif (c'est-Ã -dire des articles fermÃ©s dans le gabarit d'examen prÃ©sentÃ© Ã l'Annexe A). Par consÃ©quent, l'information qualitative dÃ©taillÃ©e expliquant les diverses notes de chaque rapport d'Ã©valuation n'a pas Ã©tÃ© recueillie.

3. CONSTATATIONS

3.1 QualitÃ© des Ã©valuations de la fonction publique fÃ©dÃ©rale : AperÃ§u et faits saillants
Les constatations du prÃ©sent examen indiquent que la plupart des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale sont de qualitÃ© acceptable, quoique nous ayons dÃ©terminÃ© que presque le quart des Ã©valuations (23 %) Ã©taient inadÃ©quates dans l'ensemble. Nous n'avons pas observÃ© de variations claires et constantes de la qualitÃ© pour les organisations fÃ©dÃ©rales de tailles diffÃ©rentes et pour les ministÃ¨res par rapport aux organismes. Une comparaison des rapports produits avant avril 2002 et de ceux produits par la suite dÃ©montre toutefois une amÃ©lioration de la qualitÃ© concernant un certain nombre de critÃ¨res dans les Ã©valuations les plus rÃ©centes. Cela laisse croire que la Politique d'Ã©valuation d'avril 2001 du SCT a peut-Ãªtre eu un effet positif (c'est Ã dire en accordant une annÃ©e, jusqu'en avril 2002, aux ministÃ¨res et aux organismes pour comprendre entiÃ¨rement la Politique et avoir le temps de mettre en Guvre quelques amÃ©liorations). Mais il y a un besoin d'amÃ©liorer encore les choses, comme l'indiquent les faiblesses mentionnÃ©es ci-dessous.

L'examen rÃ©vÃ¨le que les rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale ont un certain nombre de forces et de limites, dont il n'y a pas de modÃ¨le clair (c'est-Ã -dire qu'une section donnÃ©e des rapports, comme l'introduction et le contexte, contient Ã la fois des forces et des faiblesses selon le critÃ¨re particulier Ã©valuÃ©). Les principales forces des Ã©valuations examinÃ©es dans le prÃ©sent examen incluent :

une description complÃ¨te du programme ou de l'initiative examinÃ©, y compris ses ressources, ses bÃ©nÃ©ficiaires et ses intÃ©ressÃ©s;
une dÃ©claration claire des objectifs d'Ã©valuation;
le recours Ã des sources de donnÃ©es multiples dans la mÃ©thodologie;
une bonne prÃ©sentation des constatations, en particulier, concernant la pertinence et les Ã©lÃ©ments d'exÃ©cution et de mise en Guvre;
des recommandations formelles ou des propositions d'amÃ©liorations qui dÃ©coulent logiquement des constatations et des conclusions;
des rapports bien rÃ©digÃ©s et bien organisÃ©s.

Voici d'autre part quelques faiblesses des Ã©valuations et des rapports :

absence de modÃ¨le de logique du programme ou de rÃ©fÃ©rence;
un examen inadÃ©quat des Ã©lÃ©ments d'Ã©valuation et l'absence des rÃ©fÃ©rences des documents sources comme les CGRR ou les Cadres d'Ã©valuation;
une description inadÃ©quate des aspects de la mÃ©thodologie et des instruments de collecte des donnÃ©es qui ne sont pas annexÃ©s ou dont la rÃ©fÃ©rence n'est pas indiquÃ©e;
l'utilisation inadÃ©quate des donnÃ©es de surveillance du rendement et des points de vue des rÃ©pondants clÃ©s indÃ©pendants qui n'ont pas un intÃ©rÃªt dans le programme;
une Ã©valuation inadÃ©quate de l'impact diffÃ©rentiel des programmes et, par consÃ©quent, l'utilisation insuffisante de groupes de comparaison et de mesures de rÃ©fÃ©rence dans la conception des Ã©valuations;
une couverture superficielle des questions de rentabilitÃ©.

Voici les faits saillants des constatations concernant chacune des grandes questions et des grands Ã©lÃ©ments Ã©valuÃ©s dans l'examen :

RÃ©sumÃ© : MÃªme si la plupart des rapports (86 %) incluaient un rÃ©sumÃ©, ce dernier a besoin d'Ãªtre amÃ©liorÃ©. Nous avons dÃ©terminÃ© que le quart des rÃ©sumÃ©s que nous avons examinÃ©s Ã©taient inadÃ©quats ^[6] Ã titre de document cohÃ©rent et autonome et qu'environ le tiers ne prÃ©sentaient pas du tout les Ã©lÃ©ments d'Ã©valuation - quoique ce dernier dÃ©faut soit moins courant dans les rapports prÃ©sentÃ©s aprÃ¨s avril 2002 (22 %) que dans ceux prÃ©sentÃ©s avant (56 %).
Introduction et contexte : La plupart des rapports d'Ã©valuation examinÃ©s prÃ©sentaient bien le programme ou l'initiative Ã©valuÃ©, y compris ses ressources, ses bÃ©nÃ©ficiaires et ses intÃ©ressÃ©s. De plus, environ six rapports sur dix traitaient des hypothÃ¨ses sous-jacentes du programme (comme le financement, les partenariats), de facteurs externes comme les influences environnementales, du moment choisi pour l'Ã©valuation et de son importance. La plupart des rapports incluaient aussi une dÃ©claration claire des objectifs de l'Ã©valuation. D'autre part, la plupart des rapports ne prÃ©sentaient pas de modÃ¨le logique ou n'en indiquaient pas la rÃ©fÃ©rence et n'examinaient pas les grands rapports de cause et d'effet sur lesquels le programme Ã©tait basÃ© (moins du quart des Ã©valuations incluaient ces Ã©lÃ©ments). La plupart des rapports (les deux tiers) ne faisaient qu'Ã©numÃ©rer les Ã©lÃ©ments d'Ã©valuation et trÃ¨s peu (environ le quart) en discutaient. De plus, la moitiÃ© des rapports ne faisaient rÃ©fÃ©rence Ã aucun document, comme un CGRR ou un Cadre d'Ã©valuation, comme contexte d'Ã©laboration des Ã©lÃ©ments d'Ã©valuation.
MÃ©thodologie : La majoritÃ© des Ã©valuations (72 %) ont utilisÃ© un concept de recherche convenable, Ã la lumiÃ¨re des objectifs de l'Ã©tude. Nous avons constatÃ© que seulement 5 % n'avaient pas Ã©tÃ© conÃ§ues adÃ©quatement (par exemple parce que trÃ¨s peu de rÃ©pondants ont Ã©tÃ© consultÃ©s ou parce que la gamme des perspectives incluses Ã©tait limitÃ©e), mais c'est un critÃ¨re que nous avons Ã©tÃ© incapables d'Ã©valuer pour presque le quart (23 %) des rapports, Ã cause du manque de dÃ©tails. Parmi les rapports Ã©valuÃ©s, nous avons dÃ©terminÃ© que la qualitÃ© de la conception de la mÃ©thodologie Ã©tait adÃ©quate ou mieux pour 87 % des Ã©valuations. Ã€ peu prÃ¨s toutes les Ã©valuations (97 %) incluaient des sources de donnÃ©es multiples. Mais il y avait aussi des faiblesses. Un grand nombre de rapports ne contenaient pas de description complÃ¨te des principaux aspects de la mÃ©thodologie. Si juste un peu plus de la moitiÃ© des rapports dÃ©crivaient la mÃ©thodologie, quatre rapports sur dix en ont seulement Ã©numÃ©rÃ© quelques aspects. Seulement le quart des rapports ont fait rÃ©fÃ©rence Ã un document technique plus Ã©toffÃ©. Nous avons dÃ©terminÃ© par consÃ©quent que 46 % des rapports Ã©taient inadÃ©quats du point de vue de leur description mÃ©thodologique. De plus, la moitiÃ© des rapports ne contenaient pas d'instruments de collecte des donnÃ©es ou une rÃ©fÃ©rence indiquant oÃ¹ trouver les instruments. Seulement une minoritÃ© des Ã©valuations comprenaient des donnÃ©es d'un systÃ¨me de mesure du rendement (24 %) ou des donnÃ©es d'entrevue avec des rÃ©pondants indÃ©pendants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme (26 %). Cette derniÃ¨re caractÃ©ristique est toutefois plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (31 % contre 16 %). Seulement une minoritÃ© des concepts d'Ã©valuation incluaient un groupe de comparaison (13 %), des mesures de rÃ©fÃ©rence (14 %) ou une comparaison avec des normes, de la documentation ou un autre point de rÃ©fÃ©rence (22 %), soit des caractÃ©ristiques qui peuvent amÃ©liorer la rigueur de la mÃ©thodologie. Finalement, seulement environ quatre rapports d'Ã©valuation sur dix comprenaient une dÃ©claration des limites ou des contraintes de l'Ã©valuation.
Constatations - Pertinence : Plus de la moitiÃ© des Ã©valuations (juste un peu moins de 60 %) prÃ©sentaient des constatations relatives Ã la nÃ©cessitÃ© de poursuivre le programme et Ã sa pertinence. Nous avons dÃ©terminÃ© que la majoritÃ© (85 %) de ces Ã©valuations Ã©taient adÃ©quates ou plus qu'adÃ©quates en fonction de ces critÃ¨res. Seulement environ le tiers des Ã©valuations prÃ©sentaient des constatations permettant de dÃ©terminer si le programme faisait double emploi ou s'il Ã©tait en contraste avec d'autres programmes ou d'autres initiatives; quand elles en prÃ©sentaient, nous avons dÃ©terminÃ© que ces prÃ©sentations Ã©taient inadÃ©quates dans 18 % des cas.
Constatations - RÃ©ussites : La majoritÃ© des Ã©valuations (87 %) ont prÃ©sentÃ© des constatations dÃ©montrant si le programme ou l'initiative en question produisait ou non des rÃ©sultats appuyant sa poursuite ou son renouvellement. MÃªme si nous avons dÃ©terminÃ© qu'environ le quart de ces rapports (26 %) Ã©taient inadÃ©quats en fonction de ce critÃ¨re, la proportion dont la prÃ©sentation de ces rÃ©sultats Ã©tait moins qu'adÃ©quate a diminuÃ© (19 % aprÃ¨s avril 2002 contre 39 % avant avril 2002). Seulement le quart des Ã©valuations examinaient les rÃ©sultats fortuits (25 %) ou traitaient les impacts diffÃ©rentiels (26 %). Environ les deux tiers des Ã©valuations n'ont pas traitÃ© ces Ã©lÃ©ments.
Constatations - RentabilitÃ© : Seulement 26 % des Ã©valuations prÃ©sentaient des constatations concernant des dÃ©marches de remplacement susceptibles d'Ãªtre plus rentables, quoique la couverture de cet Ã©lÃ©ment ait augmentÃ© dans les rapports les plus rÃ©cents (31 % aprÃ¨s avril 2002 contre 16 % avant avril 2002). De plus, environ le tiers des Ã©valuations (34 %) offraient une Ã©valuation qualitative, ou quantitative, ou les deux, de la rentabilitÃ© du programme ou de l'initiative examinÃ©, quoique nous ayons dÃ©terminÃ© que 28 % de ces Ã©valuations Ã©taient inadÃ©quates en fonction de ce critÃ¨re.
Constatations - ExÃ©cution et mise en oeuvre : En ce qui a trait aux Ã©lÃ©ments de l'exÃ©cution et de la mise en Guvre, la plupart des Ã©valuations prÃ©sentaient des constatations relatives Ã la pertinence du modÃ¨le d'exÃ©cution du programme, ou des pratiques de gestion, ou les deux (81 %), et Ã la nÃ©cessitÃ© d'amÃ©liorer la structure du programme ou les ententes d'exÃ©cution (76 %). Les Ã©valuations Ã©taient trÃ¨s bien notÃ©es en fonction du premier critÃ¨re (89 % Ã©taient adÃ©quates ou plus qu'adÃ©quates).
Constatations - Pertinence de l'analyse : Il Ã©tait difficile d'Ã©valuer la pertinence de l'analyse (c'est-Ã -dire la mesure dans laquelle l'analyse Ã©tait appuyÃ©e par les donnÃ©es selon les tests de signification, les taux de rÃ©ponse, etc.) pour 50 % des Ã©valuations en raison du manque de dÃ©tails prÃ©sentÃ©s dans les rapports. Nous avons dÃ©terminÃ© que presque le tiers (32 %) des rapports examinÃ©s en fonction de ces critÃ¨res Ã©taient inadÃ©quats. Cette derniÃ¨re proportion a toutefois diminuÃ© au cours des derniÃ¨res annÃ©es (26 % aprÃ¨s avril 2002 par rapport Ã 41 % avant avril 2002).
Conclusions : Nous avons dÃ©terminÃ© que les trois quarts des Ã©valuations Ã©taient adÃ©quates ou mieux et que le quart (24 %) Ã©taient inadÃ©quates en ce qui a trait Ã leur prestation de conclusions objectives, fondÃ©es sur des donnÃ©es concernant la pertinence, la rÃ©ussite ou la rentabilitÃ©, ou tout cela. Parmi les Ã©valuations qui traitaient la mise en Guvre, l'exÃ©cution ou les pratiques de gestion, ou tout cela, nous avons dÃ©terminÃ© qu'une proportion plus Ã©levÃ©e (85 %) Ã©taient adÃ©quates ou mieux dans la prestation de conclusions objectives, fondÃ©es sur des donnÃ©es concernant ces Ã©lÃ©ments. De plus, la qualitÃ© des Ã©valuations s'amÃ©liore concernant ce critÃ¨re : nous avons dÃ©terminÃ© que 40 % des Ã©valuations faites aprÃ¨s avril 2002 Ã©taient plus qu'adÃ©quates Ã cet Ã©gard par rapport Ã seulement 20 % des rapports produits avant cette date. De plus, dans leurs conclusions, la moitiÃ© des Ã©valuations (49 %) prÃ©sentaient d'autres leÃ§ons apprises au sujet du programme. Nous avons dÃ©terminÃ© que 95 % de ces rapports Ã©taient adÃ©quats ou plus qu'adÃ©quats Ã cet Ã©gard.
Recommandations : La grande majoritÃ© des Ã©valuations incluaient des recommandations formelles (77 %) ou des suggestions de mesures Ã prendre (13 %). Dans presque tous les cas, les recommandations traitaient des constatations d'Ã©valuation importantes et dÃ©coulaient logiquement des constatations et des conclusions (94 % dans chaque cas). D'autre part, parmi les rapports qui contenaient des recommandations, seulement 26 % indiquaient des scÃ©narios de remplacement et seulement 35 % tenaient compte des contraintes pratiques (par exemple les rÃ¨glements, les budgets). Nous avons dÃ©terminÃ© que plus du tiers de ces rapports (35 %) Ã©taient inadÃ©quats en fonction de ce critÃ¨re.
RÃ©ponse de la direction et plan d'action : Moins de la moitiÃ© des rapports d'Ã©valuation incluaient une rÃ©ponse de la direction (48 %) ou un plan d'action (33 %).
Aspects gÃ©nÃ©raux et autres du rapport : Nous avons dÃ©terminÃ© que la plupart des rapports d'Ã©valuation Ã©taient adÃ©quats ou plus qu'adÃ©quats quant Ã la clartÃ© de la rÃ©daction (86 %) et Ã l'organisation (81 %). En ce qui a trait aux faiblesses, nous avons dÃ©terminÃ© qu'une proportion considÃ©rable des rapports Ã©taient inadÃ©quats concernant la prÃ©sentation acceptable des donnÃ©es, y compris les chiffres et les sources (33 %), la prÃ©sentation convenable de l'information technique (30 %) et l'utilisation efficace des tableaux et des graphiques (25 %).
Ã‰valuation globale : La majoritÃ© des rapports d'Ã©valuation ont reÃ§u une note globale subjective indiquant qu'ils Ã©taient adÃ©quats (45 %) ou plus qu'adÃ©quats (32 %), mÃªme si nous avons dÃ©terminÃ© que presque le quart des Ã©valuations (23 %) Ã©taient inadÃ©quates.

3.2 Constatations dÃ©taillÃ©es

A) RÃ©sumÃ©

La majoritÃ© des rapports examinÃ©s (86 %) comprenaient un rÃ©sumÃ©. Les ministÃ¨res Ã©taient plus susceptibles d'inclure un rÃ©sumÃ© dans leurs rapports d'Ã©valuation que les organismes (90 % contre 71 %). De plus, les organisations de grande et de moyenne tailles (83 % et 92 % respectivement) Ã©taient plus susceptibles d'inclure un rÃ©sumÃ© que les petites organisations (78 %).

En ce qui a trait Ã la clartÃ© et Ã la concision de la rÃ©daction et Ã la cohÃ©rence Ã titre de document autonome, nous avons dÃ©terminÃ© que la plupart des rÃ©sumÃ©s Ã©taient adÃ©quats ou plus qu'adÃ©quats (43 % et 31 % respectivement) et que le quart Ã©taient inadÃ©quats.

Autres caractÃ©ristiques clÃ©s des rÃ©sumÃ©s :

Les Ã©lÃ©ments d'Ã©valuation clÃ©s Ã©taient prÃ©sentÃ©s de faÃ§on complÃ¨te (38 %) ou partielle (30 %) dans la plupart des rÃ©sumÃ©s, mais pas du tout dans 32 % des rÃ©sumÃ©s des rapports. Les rÃ©sumÃ©s sans prÃ©sentation des Ã©lÃ©ments d'Ã©valuation Ã©taient plus courants dans les rapports prÃ©sentÃ©s avant avril 2002 que dans ceux qui ont Ã©tÃ© prÃ©sentÃ©s aprÃ¨s (56 % contre 22 %) et plus courants dans les rapports des petites organisations (57 %) que dans ceux des organisations de grande et de moyenne tailles (31 % et 26 % respectivement).
Les constatations d'Ã©valuation clÃ©s Ã©taient rÃ©sumÃ©es dans presque tous les rÃ©sumÃ©s, soit complÃ¨tement (50 %) soit partiellement (43 %).
Les conclusions clÃ©s Ã©taient Ã©galement rÃ©sumÃ©es dans la plupart des rÃ©sumÃ©s, soit complÃ¨tement (60 %) ou partiellement (26 %).
Les recommandations d'Ã©valuation Ã©taient prÃ©sentÃ©es complÃ¨tement (69 %) ou partiellement (neuf pour cent) dans la majoritÃ© des rÃ©sumÃ©s des rapports.

B) Introduction et contexte

Description
La grande majoritÃ© des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale, soit 98 %, offrait une description claire et concise du programme, de la politique ou de l'initiative Ã©valuÃ© (voir Tableau 1). Les notes de la qualitÃ© de la description de programme Ã©taient fortes Ã©galement : nous avons dÃ©terminÃ© que 35 % des Ã©valuations Ã©taient adÃ©quates selon ce critÃ¨re et qu'une autre tranche de 49 % des Ã©valuations offrait une discussion plus qu'adÃ©quate.

La plupart des rapports dÃ©crivaient la totalitÃ© (64 %) ou une partie (29 %) des bÃ©nÃ©ficiaires visÃ©s et des intÃ©ressÃ©s du programme, de la politique ou de l'initiative. Nous avons dÃ©terminÃ© que la plupart des rapports Ã©taient adÃ©quats (61 %) ou plus qu'adÃ©quats (25 %) selon ce critÃ¨re. Les rapports d'Ã©valuation Ã©taient un peu plus susceptibles d'avoir indiquÃ© les bÃ©nÃ©ficiaires du programme (77 %) que ses intÃ©ressÃ©s (68 %).

La plupart des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale (71 %) incluaient une discussion de la rÃ©partition des ressources dans la description de programme. Nous avons dÃ©terminÃ© que cette discussion Ã©tait adÃ©quate (37 %) ou plus qu'adÃ©quate (40 %) dans ces rapports.

Environ six rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale sur dix (59 %) dÃ©crivaient les hypothÃ¨ses sous-jacentes du programme Ã©tudiÃ© (comme le financement, les partenariats) ou les facteurs externes (comme les influences environnementales). Dans les rapports (n=68) qui dÃ©terminaient ces facteurs, 78 % dÃ©crivaient les hypothÃ¨ses sous-jacentes du programme tandis que 66 % dÃ©terminaient les facteurs externes.

La principale faiblesse du volet de la description de programme Ã©tait le manque de rÃ©fÃ©rence Ã un modÃ¨le de logique du programme : moins d'un rapport d'Ã©valuation de la fonction publique fÃ©dÃ©rale sur quatre prÃ©sentait un modÃ¨le de logique (19 % dans le rapport lui-mÃªme et un autre 4 % dans un document citÃ© comme source de rÃ©fÃ©rence). Ã€ cet Ã©gard, seulement 22 % des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale incluaient une description des grands rapports de cause et d'effet sur lesquels le programme ou la politique Ã©tait basÃ© (par exemple, tel que prÃ©sentÃ© dans le modÃ¨le de logique). Dans les rapports qui incluaient une discussion de grands rapports de cause et d'effet (n=29), nous avons dÃ©terminÃ© que la discussion Ã©tait adÃ©quate ou plus qu'adÃ©quate dans la plupart des cas (41 % et 31 % respectivement), mais inadÃ©quate dans le cas de 28 % des rapports.

TABLEAU 1 : Description de programme - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
DÃ©crire le programme, la politique ou l'initiative	98	16	35	49
DÃ©crire les bÃ©nÃ©ficiaires et les intÃ©ressÃ©s	93*	14	61	25
Examiner l'attribution des ressources	71	23	37	40
DÃ©crire les hypothÃ¨ses sous-jacentes et les facteurs externes	59	10	59	30
PrÃ©senter un modÃ¨le logique	23**	s.o.	s.o.	s.o.
DÃ©crire les grands rapports de cause et d'effet	22	28	41	31
Source : Examen des Ã©valuations de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=29 Ã 113). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re. La totalitÃ© ou une partie des bÃ©nÃ©ficiaires. *PrÃ©sentation dans le rapport ou rÃ©fÃ©rence Ã un autre document.

Contexte d'Ã©valuation
La grande majoritÃ© des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale (91 %) incluait une dÃ©claration des objectifs de l'Ã©valuation (Tableau 2). La notation de la qualitÃ© Ã©tait Ã©levÃ©e pour ce critÃ¨re : nous avons dÃ©terminÃ© que 52 % des rapports Ã©taient adÃ©quats et que 32 % Ã©taient plus qu'adÃ©quats Ã cet Ã©gard.

Environ six rapports sur dix (58 %) expliquaient le moment choisi pour l'Ã©valuation (c'est-Ã -dire la pÃ©riode visÃ©e par l'Ã©tude) et une proportion semblable de rapports (56 %) dÃ©crivait la signification de l'Ã©valuation. Les rapports des ministÃ¨res contenaient plus souvent une discussion de la signification de l'Ã©valuation que les rapports des organismes (59 % contre 42 %) et les rapports des grandes organisations contenaient eux aussi plus souvent une discussion (65 %) que ceux des organisations de moyenne ou de petite taille (53 % et 39 % respectivement). La notation de la qualitÃ© pour ce critÃ¨re Ã©tait positive : nous avons dÃ©terminÃ© qu'elle Ã©tait plus qu'adÃ©quate dans 30 % des cas, adÃ©quate dans 59 % des cas et inadÃ©quate dans 11 % des cas.

En ce qui a trait aux Ã©lÃ©ments et aux questions d'Ã©valuation, les rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale Ã©numÃ¨rent simplement en gÃ©nÃ©ral (les deux tiers) les questions (au lieu de les examiner, comme nous l'avons observÃ© dans seulement 24 % des rapports). Cette pratique a fait en sorte que la note pour ce critÃ¨re Ã©tait comparativement faible par rapport aux autres notes. Pour ce critÃ¨re, nous avons dÃ©terminÃ© que 45 % des rapports Ã©taient adÃ©quats, que 20 % Ã©taient plus qu'adÃ©quats et que 35 % Ã©taient inadÃ©quats.

Une petite minoritÃ© des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale (8 %) a dÃ©terminÃ© les Ã©lÃ©ments d'Ã©valuation dans le contexte d'un Cadre de gestion et de responsabilisation axÃ©s sur les rÃ©sultats (CGRR). Nous n'avons pratiquement pas notÃ© de diffÃ©rences sur ce point selon le moment ou l'Ã©valuation a Ã©tÃ© faite (avant ou aprÃ¨s avril 2002). Toutefois, 42 % des rapports examinaient les Ã©lÃ©ments et les questions d'Ã©valuation dans le contexte d'un autre document (habituellement un Cadre d'Ã©valuation). La moitiÃ© des rapports n'ont pas fait rÃ©fÃ©rence Ã un contexte d'Ã©laboration des Ã©lÃ©ments et des questions d'Ã©valuation.

TABLEAU 2 : Contexte d'Ã©valuation - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
DÃ©crire les objectifs de l'Ã©valuation	91	16	52	32
DÃ©crire le moment choisi pour l'Ã©valuation	58	s.o.	s.o.	s.o.
DÃ©crire la signification de l'Ã©valuation	56	11	59	30
DÃ©crire la signification de l'Ã©valuation	89*	35	45	20
DÃ©crire le moment choisi pour l'Ã©valuation	58	s.o.	s.o.	s.o.
Source : Examen des Ã©valuations de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=64 Ã 106). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re. * DÃ©crire ou Ã©numÃ©rer les Ã©lÃ©ments.

En ce qui a trait Ã la couverture des Ã©lÃ©ments ^[7] (Tableau 3), la grande majoritÃ© des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale couvrait les Ã©lÃ©ments de rÃ©ussite (94 %), suivis des Ã©lÃ©ments de pertinence (74 %) et des Ã©lÃ©ments de mise en Guvre et d'exÃ©cution (72 %). Les rapports sont beaucoup moins susceptibles d'avoir traitÃ© les pratiques de gestion (47 %) ou la rentabilitÃ© (44 %).

La couverture des Ã©lÃ©ments de la pertinence Ã©tait plus courante dans les Ã©valuations des petites et des moyennes organisations (89 % et 80 % respectivement) que dans les Ã©valuations des grandes organisations (61 %). Les Ã©lÃ©ments de rentabilitÃ© Ã©taient plus susceptibles d'Ãªtre traitÃ©s dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (51 % par rapport Ã 27 %). Les Ã©valuations des ministÃ¨res Ã©taient plus susceptibles que celles des organismes de traiter les Ã©lÃ©ments de pratiques de gestion (52 % par rapport Ã 29 %), comme les rapports des grandes et des moyennes organisations Ã©taient plus susceptibles aussi de les traiter (50 % et 51 % respectivement) que ceux des petites organisations (28 %).

TABLEAU 3 : Couverture des Ã©lÃ©ments d'Ã©valuation
Ã‰lÃ©ment	Couverture (%)
Pertinence	74
RÃ©ussite	94
RentabilitÃ©	44
Mise en Guvre et exÃ©cution	72
Pratiques de gestion	47
Source : Examen des Ã©valuations de la fonction publique fÃ©dÃ©rale (n=115)

C) MÃ©thodologie

Description de la mÃ©thodologie et de la conception
Les discussions de la mÃ©thodologie d'Ã©valuation des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale Ã©taient de qualitÃ© diverse - 56 % offraient une description complÃ¨te de la mÃ©thodologie et de la conception de l'Ã©valuation (Tableau 4). Quatre rapports sur dix Ã©numÃ©raient seulement quelques renseignements.

Dans la discussion de la mÃ©thodologie, les rapports Ã©taient plus susceptibles d'Ã©tablir la taille de l'Ã©chantillon (comme pour les entrevues avec les rÃ©pondants clÃ©s et les enquÃªtes) (68 %). D'autre part, 45 % des rapports indiquaient la mÃ©thode d'Ã©chantillonnage, 30 % Ã©tablissaient le lien entre les mÃ©thodes et les Ã©lÃ©ments et 26 % fournissaient des instruments de collecte des donnÃ©es. Le quart des rapports (27 %) ont fait rÃ©fÃ©rence Ã un document technique plus Ã©toffÃ© sur la mÃ©thodologie. Trois rapports sur dix ne contenaient rien de ce qui prÃ©cÃ¨de dans leur discussion mÃ©thodologique (c'est-Ã -dire la taille de l'Ã©chantillon, la mÃ©thode d'Ã©chantillonnage, les instruments, le lien entre les mÃ©thodes et les Ã©lÃ©ments, la rÃ©fÃ©rence aux documents techniques).

Le manque d'information mÃ©thodologique a affaibli la note de la qualitÃ© des rapports pour le critÃ¨re en question : nous avons considÃ©rÃ© que 46 % des rapports Ã©taient inadÃ©quats Ã cet Ã©gard, que 32 % Ã©taient adÃ©quats et que 21 % Ã©taient plus qu'adÃ©quats.

La moitiÃ© des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale (49 %) n'incluaient pas d'instruments de collecte des donnÃ©es et ne contenaient pas de rÃ©fÃ©rence Ã un document technique oÃ¹ trouver les instruments. Ce dÃ©faut Ã©tait plus courant dans les Ã©valuations des moyennes organisations (61 %) que dans celles des grandes ou des petites organisations (37 % et 44 % respectivement). Le quart des rapports (23 %) prÃ©sentaient tous les instruments de recherche avec le rapport et quelques-uns des instruments Ã©taient prÃ©sentÃ©s dans une autre tranche de 10 % des rapports. Et 18 % des rapports faisaient rÃ©fÃ©rence Ã un document technique oÃ¹ il Ã©tait possible de trouver les instruments.

Dans l'ensemble, la plupart des Ã©valuations (72 %) Ã©taient conÃ§ues convenablement en fonction des objectifs visÃ©s par l'Ã©tude (selon des considÃ©rations comme la rentabilitÃ©, la faisabilitÃ© et la validitÃ©). Il y avait 5 % des Ã©valuations qui n'Ã©taient pas conformes Ã ce critÃ¨re et, dans 23 % des cas, l'examinateur a Ã©tÃ© incapable de faire une Ã©valuation (Ã cause de la description inadÃ©quate de la conception). Les Ã©valuations considÃ©rÃ©es inadÃ©quates avaient tendance Ã reprÃ©senter seulement une gamme limitÃ©e de perspectives (par exemple, pas de participation du client, des entrevues avec des reprÃ©sentants de la fonction publique fÃ©dÃ©rale seulement) ou Ã avoir consultÃ© seulement un petit nombre de particuliers et d'organisations.

Les notes de la qualitÃ© de la conception mÃ©thodologique Ã©taient favorables : nous avons dÃ©terminÃ© que 45 % des rapports d'Ã©valuation Ã©taient adÃ©quats et que 42 % Ã©taient plus qu'adÃ©quats Ã cet Ã©gard. Nous avons dÃ©terminÃ© que seulement 14 % de ces Ã©valuations Ã©taient inadÃ©quates en ce qui a trait Ã la conception.

TABLEAU 4 : MÃ©thodologie - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
DÃ©crire les mÃ©thodologies et les conceptions appliquÃ©es	56	46	32	21
Ã‰lÃ©ments de description		s.o.	s.o.	s.o.
Taille de l'Ã©chantillon	68
MÃ©thode d'Ã©chantillonnage	45
Liens entre les mÃ©thodes et les Ã©lÃ©ments	30
RÃ©fÃ©rence Ã des documents techniques	27
Instruments	26
Conception convenable	72	13	45	42
Source : Examen des Ã©valuations de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=64 Ã 106). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re. * DÃ©crire ou Ã©numÃ©rer les Ã©lÃ©ments.

Sources de donnÃ©es multiples
Parmi les forces des Ã©valuations de la fonction publique fÃ©dÃ©rale, pratiquement toutes les Ã©tudes (97 %) contenaient des sources multiples de donnÃ©es pour appuyer les constatations (Tableau 5). Nous avons dÃ©terminÃ© que presque les deux tiers des rapports prÃ©sentaient un Ã©quilibre adÃ©quat entre les mÃ©thodologies qualitatives et quantitatives, tandis que 14 % prÃ©sentaient un Ã©quilibre inadÃ©quat (nous avons dÃ©terminÃ© qu'environ les deux tiers de ces rapports dÃ©pendaient trop de mÃ©thodes qualitatives) et dans 23 % des cas, l'examinateur a Ã©tÃ© incapable de faire une Ã©valuation.

Voici les mÃ©thodologies utilisÃ©es le plus frÃ©quemment : entrevues avec des rÃ©pondants clÃ©s (94 %), examens de documents (78 %), enquÃªtes sur Ã©chantillon (38 %), examens de dossiers (38 %), analyses documentaires (36 %), Ã©tudes de cas (35 %) et groupes de rÃ©flexion (24 %).

L'intÃ©gration de donnÃ©es d'un systÃ¨me de mesure continue du rendement n'Ã©tait pas frÃ©quente : 24 % des rapports indiquaient ces donnÃ©es comme sources de donnÃ©es pour l'Ã©valuation.

Nous avons Ã©galement dÃ©terminÃ© que la majoritÃ© des rapports Ã©taient de qualitÃ© adÃ©quate (50 %) ou plus qu'adÃ©quate (28 % ) quant Ã l'inclusion d'une gamme de perspectives d'intÃ©ressÃ©s. Les Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale ont le plus souvent examinÃ© la perspective de la gestion du programme et du personnel exÃ©cutant (83 %); les clients et les bÃ©nÃ©ficiaires (58 %); les partenaires (39 %); les bÃ©nÃ©ficiaires de financement (36 %); et les tiers exÃ©cutants (24 %). Des experts ont Ã©galement Ã©tÃ© consultÃ©s dans 20 % des Ã©valuations; cette pratique Ã©tait plus courante aprÃ¨s avril 2002 qu'avant (24 % contre 11 %).

Seulement 26 % des rapports contenaient toutefois des donnÃ©es qualitatives obtenues de rÃ©pondants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme. Cette caractÃ©ristique mÃ©thodologique dÃ©sirable Ã©tait plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 qu'avant (31 % contre 16 %) et dans les Ã©valuations des petites et des moyennes organisations (39 % et 33 % respectivement) plutÃ´t que dans celles des grandes organisations (13 %).

TABLEAU 5 : Sources de donnÃ©es multiples - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
Inclure des sources de donnÃ©es multiples	97	s.o.	s.o.	s.o.
Utiliser des donnÃ©es de surveillance continue du rendement	24	s.o.	s.o.	s.o.
Ã‰quilibrer convenablement l'aspect qualitatif et l'aspect quantitatif	64	s.o.	s.o.	s.o.
Inclure toutes les perspectives des intÃ©ressÃ©s*	s.o.	23	50	28
Inclure les perspectives des non intÃ©ressÃ©s	26	s.o.	s.o.	s.o.
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=115) Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re. *Seuls les rapports pour lesquels ce critÃ¨re pouvait Ãªtre Ã©valuÃ© ont Ã©tÃ© notÃ©s (n=97).

Limites
Quatre Ã©valuations sur dix (39 %) des rapports d'Ã©valuation de la fonction publique fÃ©dÃ©rale incluaient une discussion des limites des mÃ©thodologies et des sources de donnÃ©es utilisÃ©es (biais, fiabilitÃ© des donnÃ©es). Une proportion semblable de rapports (44 %) indiquaient les contraintes de l'Ã©valuation, la disponibilitÃ© des donnÃ©es et le temps (34 % et 19 % respectivement) Ã©tant les contraintes mentionnÃ©es le plus souvent.

Rigueur
En ce qui a trait Ã la rigueur, peu d'Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale employaient la conception expÃ©rimentale traditionnelle ou quasi expÃ©rimentale. Si 44 % des Ã©valuations incluaient un sondage reprÃ©sentatif des participants, seulement 13 % incluaient un groupe de comparaison et 14 % comparaient les donnÃ©es d'Ã©valuation Ã une mesure de rÃ©fÃ©rence. Une proportion un peu plus grande des rapports (22 %) incluait toutefois des donnÃ©es comparatives de la documentation ou un autre point de rÃ©fÃ©rence.

On note la tendance des Ã©valuations des moyennes organisations Ã Ãªtre un peu moins rigoureuses que celles des grandes ou des petites organisations. Par exemple, un sondage reprÃ©sentatif des participants et un groupe de comparaison Ã©taient moins courants dans les Ã©valuations des moyennes organisations (31 % et six pour cent respectivement) que dans celles des petites organisations (67 % et 22 %) ou dans celles des grandes organisations (50 % et 17 %).

D) Constatations clÃ©s

Pertinence
Juste un peu plus de la moitiÃ© des rapports d'Ã©valuation (57 %) prÃ©sentaient des donnÃ©es dÃ©montrant le besoin rÃ©el du programme en question et la rÃ©ceptivitÃ© du programme Ã ce besoin (Tableau 6). Nous avons dÃ©terminÃ© que la prÃ©sentation de ces constatations Ã©tait adÃ©quate ou mieux pour 85 % des rapports examinÃ©s. La prÃ©sentation de donnÃ©es sur ces deux Ã©lÃ©ments Ã©tait moins courante dans les rapports des grandes organisations (46 % et 48 % respectivement) que dans ceux des moyennes organisations (61 % et 59 %) ou ceux des petites organisations (78 % pour les deux Ã©lÃ©ments). De plus, la qualitÃ© des donnÃ©es sur le second Ã©lÃ©ment (rÃ©ceptivitÃ© au besoin) Ã©tait notÃ©e diffÃ©remment selon la taille de l'organisation. Les rapports des petites et des grandes organisations Ã©taient plus susceptibles d'Ãªtre notÃ©s plus qu'adÃ©quats Ã cet Ã©gard (47 % et 41 % respectivement) que les rapports des moyennes organisations (19 %). Notons Ã©galement que ces Ã©lÃ©ments n'Ã©taient simplement pas traitÃ©s dans environ le tiers des Ã©valuations.

TABLEAU 6 : Constatations de la pertinence - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
Des donnÃ©es pour dÃ©montrer le besoin rÃ©el	57	15	45	40
Des donnÃ©es pour dÃ©montrer la rÃ©ceptivitÃ© au besoin	57	13	54	32
Des donnÃ©es pour dÃ©montrer la pertinence continue par rapport aux prioritÃ©s du gouvernement	58	12	47	41
Des donnÃ©es pour dÃ©montrer qu'il n'y a pas de double emploi	34	18	54	28
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=39 Ã 68).

De mÃªme, 58 % des rapports incluaient des donnÃ©es sur la pertinence continue du programme par rapport aux prioritÃ©s du gouvernement et nous avons dÃ©terminÃ© que la prÃ©sentation de ces constatations Ã©tait adÃ©quate (47 %) ou plus qu'adÃ©quate (41 %) pour la plupart des rapports. Ã€ nouveau, toutefois, la prÃ©sentation de donnÃ©es sur cet Ã©lÃ©ment de pertinence Ã©tait moins courante dans les rapports des grandes organisations (48 %) que dans ceux des moyennes ou des petites organisations (environ les deux tiers dans chaque cas). Nous avons dÃ©terminÃ© que moins de rapports des grandes organisations Ã©taient plus qu'adÃ©quats Ã cet Ã©gard (30 %) que ceux des petites ou des moyennes organisations (50 % et 46 % respectivement). Nous avons Ã©galement dÃ©terminÃ© que moins de rapports prÃ©sentÃ©s avant avril 2002 Ã©taient plus qu'adÃ©quats que dans le cas des rapports prÃ©sentÃ©s aprÃ¨s cette date (32 % contre 46 %). Cet Ã©lÃ©ment n'a pas Ã©tÃ© traitÃ© du tout dans 35 % des Ã©valuations.

Concernant l'Ã©lÃ©ment qui consiste Ã dÃ©terminer si le programme fait double emploi ou est en contraste avec d'autres programmes ou d'autres initiatives, seulement 34 % des Ã©valuations prÃ©sentaient des donnÃ©es et un groupe de 54 % n'a mÃªme pas traitÃ© cet Ã©lÃ©ment. Pour les Ã©valuations qui ont prÃ©sentÃ© certaines donnÃ©es, les notes Ã©taient lÃ©gÃ¨rement infÃ©rieures Ã celles des autres Ã©lÃ©ments de la pertinence : nous avons dÃ©terminÃ© que 82 % des rapports Ã©taient adÃ©quats ou mieux, mais que 18 % Ã©taient inadÃ©quats Ã cet Ã©gard.

RÃ©ussite
La grande majoritÃ© des Ã©valuations (87 %) a prÃ©sentÃ© des constatations dÃ©montrant si le programme, la politique ou l'initiative en question produisait ou non des rÃ©sultats appuyant sa poursuite ou son renouvellement (Tableau 7). Seulement quatre pour cent des Ã©valuations n'ont pas prÃ©sentÃ© ces constatations relatives Ã la rÃ©ussite, et les Ã©lÃ©ments de rÃ©ussite n'Ã©taient pas traitÃ©s dans le dernier groupe de neuf pour cent des Ã©valuations. La proportion d'Ã©valuations qui ont prÃ©sentÃ© des constatations relatives Ã la rÃ©ussite Ã©tait relativement plus Ã©levÃ©e pour les petites organisations (100 %) que pour les moyennes et les grandes organisations (84 % et 85 % respectivement).

TABLEAU 7 : Constatations de la rÃ©ussite - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
DÃ©crire les rÃ©sultats du programme et l'attribution du programme par rapport Ã la rÃ©ussite	87	26	37	37
DÃ©terminer d'autres programmes, politiques et initiatives qui ont des liens, des rÃ©sultats partagÃ©s	37	s.o.	s.o.	s.o.
Prendre ce qui prÃ©cÃ¨de en considÃ©ration dans l'attribution	19	s.o.	s.o.	s.o.
Examiner d'autres facteurs qui contribuent aux rÃ©sultats	61	14	50	36
Examiner les rÃ©sultats fortuits	25	14	60	21
Traiter l'incrÃ©mentalitÃ©	26	26	48	27
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=29 Ã 100). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re.

Nous avons dÃ©terminÃ© qu'environ le tiers (37 %) des Ã©valuations avaient dÃ©crit les rÃ©sultats plus qu'adÃ©quatement, une proportion semblable (37 %) adÃ©quatement et 26 % inadÃ©quatement. La proportion indiquant que la prÃ©sentation des constatations Ã©tait inadÃ©quate Ã©tait considÃ©rablement infÃ©rieure pour les grandes organisations (18 %) par rapport aux petites et aux moyennes organisations (28 % et 33 % respectivement); et pour les Ã©valuations produites aprÃ¨s avril 2002 que pour les Ã©valuations produites avant (19 % contre 39 %).

Un peu plus du tiers des Ã©valuations (37 %) identifiaient d'autres programmes, politiques ou initiatives susceptibles de prÃ©senter des similaritÃ©s, des rapports, des rÃ©sultats partagÃ©s, ou des effets inter-programmes prÃ©vus, ou tout cela. Environ la moitiÃ© des Ã©valuations (51 %) ne l'a pas fait. La proportion d'Ã©valuations qui n'identifiaient pas d'autres programmes Ã©tait considÃ©rablement plus Ã©levÃ©e pour les organismes (62 %) que pour les ministÃ¨res (49 %).

Environ le cinquiÃ¨me des Ã©valuations (19 %) a pris d'autres programmes ou d'autres initiatives en considÃ©ration dans la mesure de la rÃ©ussite (attribution). Trois Ã©valuations sur cinq (58 %) ne l'ont pas fait. La proportion des Ã©valuations qui prennent d'autres programmes en considÃ©ration augmente avec la taille de l'organisation, de 6 % pour les petites organisations, de 18 % pour les moyennes organisations et de 24 % pour les grandes organisations.

Trois Ã©valuations sur cinq (61 %) examinaient d'autres facteurs qui contribuent aux rÃ©sultats, tandis qu'environ le tiers des Ã©valuations (31 %) ne l'a pas fait. Les petites organisations (72 %) Ã©taient plus susceptibles de considÃ©rer d'autres facteurs contributifs que les organisations des autres tranches de taille (59 % pour les moyennes et les grandes organisations). De plus, les organismes Ã©taient considÃ©rablement plus susceptibles de considÃ©rer d'autres facteurs que les ministÃ¨res (75 % contre 57 %). Des proportions semblables identifiaient des facteurs internes et des facteurs externes.

Nous avons dÃ©terminÃ© qu'environ le tiers (36 %) des Ã©valuations avait considÃ©rÃ© d'autres facteurs plus qu'adÃ©quatement et que 50 % l'avaient fait adÃ©quatement. Nous avons dÃ©terminÃ© que seulement 14 % des Ã©valuations avaient considÃ©rÃ© les facteurs contributifs moins qu'adÃ©quatement. La proportion des Ã©valuations plus qu'adÃ©quates Ã©tait considÃ©rablement plus Ã©levÃ©e pour les moyennes organisations (45 %) que pour les petites et les grandes organisations (31 % et 29 %).

Le quart des Ã©valuations (25 %) ont considÃ©rÃ© les rÃ©sultats fortuits et environ les deux tiers (63 %) ne l'ont pas fait. Aucune diffÃ©rence importante n'a Ã©mergÃ© des caractÃ©ristiques considÃ©rÃ©es. Parmi les Ã©valuations qui mesuraient les rÃ©sultats fortuits, environ la moitiÃ© a considÃ©rÃ© les rÃ©sultats positifs et environ la moitiÃ© a considÃ©rÃ© les rÃ©sultats nÃ©gatifs.

Nous avons dÃ©terminÃ© qu'environ les deux tiers des Ã©valuations (66 %) examinaient adÃ©quatement les rÃ©sultats fortuits et que le cinquiÃ¨me (21 %) les examinait plus qu'adÃ©quatement. Il y avait trop peu d'observations pour considÃ©rer les diffÃ©rences des rÃ©sultats selon la taille et le type d'organisation et le moment choisi pour l'Ã©valuation.

Le quart des Ã©valuations (26 %) a considÃ©rÃ© les rÃ©sultats par incrÃ©mentalitÃ© tandis que presque les deux tiers (64 %) ne l'ont pas fait. La mesure de l'incrÃ©mentalitÃ© Ã©tait considÃ©rablement plus Ã©levÃ©e pour les organismes que pour les ministÃ¨res (38 % contre 23 %) et pour les Ã©valuations faites aprÃ¨s avril 2002 que pour les Ã©valuations faites avant (30 % contre 17 %). Parmi les Ã©valuations qui ont Ã©valuÃ© l'incrÃ©mentalitÃ©, 72 % ont examinÃ© l'Ã©lÃ©ment subjectivement et 28 % l'ont fait objectivement. Nous avons dÃ©terminÃ© que l'incrÃ©mentalitÃ© Ã©tait traitÃ©e adÃ©quatement dans 53 % des rapports et plus qu'adÃ©quatement dans 27 % des rapports. Il y avait trop peu d'observations pour considÃ©rer les diffÃ©rences dans les rÃ©sultats selon la taille et le type d'organisation ou selon le moment choisi pour l'Ã©valuation.

RentabilitÃ©
Environ le quart des Ã©valuations (26 %) examinait des dÃ©marches de remplacement qui pourraient produire des faÃ§ons plus rentables de rÃ©aliser les rÃ©sultats. Une proportion de 16 % des Ã©valuations ne l'a pas fait et 58 % des Ã©valuations n'ont pas traitÃ© la rentabilitÃ©. La proportion des Ã©valuations qui a traitÃ© des dÃ©marches de remplacement baisse fortement selon la taille de l'organisation, dans une proportion de 50 % pour les petites organisations et dans une proportion de 13 % pour les grandes organisations. De plus, cette proportion est beaucoup plus importante pour les Ã©valuations faites aprÃ¨s avril 2002 que pour les Ã©valuations faites avant (31 % contre 16 %) et un peu plus importante pour les organismes que pour les ministÃ¨res (38 % contre 23 %).

Parmi les Ã©valuations qui ont considÃ©rÃ© des dÃ©marches de remplacement rentables, nous avons jugÃ© que 42 % les avaient Ã©valuÃ©es adÃ©quatement et que 29 % l'avaient fait plus qu'adÃ©quatement. Encore une fois, il y avait trop peu d'observations pour considÃ©rer les diffÃ©rences dans les rÃ©sultats selon la taille et le type d'organisation ou selon le moment choisi pour l'Ã©valuation.

Parmi les Ã©valuations qui ont considÃ©rÃ© la rentabilitÃ©, environ deux fois plus d'Ã©valuations l'ont considÃ©rÃ© qualitativement que quantitativement. Ce ratio n'a pas variÃ© beaucoup dans les caractÃ©ristiques en question, sauf qu'il Ã©tait lÃ©gÃ¨rement infÃ©rieur dans les grandes organisations. Nous avons dÃ©terminÃ© qu'environ la moitiÃ© (49 %) des Ã©valuations qualitatives ou quantitatives de la rentabilitÃ© des Ã©valuations avait Ã©tÃ© exÃ©cutÃ©e adÃ©quatement et que le quart (23 %) l'avait Ã©tÃ© plus qu'adÃ©quatement. Nous avons dÃ©terminÃ© cependant que 28 % de ces Ã©valuations Ã©taient inadÃ©quates. Il y avait trop peu d'observations pour nous permettre d'observer Ã quel point la rentabilitÃ© a Ã©tÃ© traitÃ©e dans les caractÃ©ristiques des organisations.

ExÃ©cution et mise en Guvre
La plupart des Ã©valuations (81 %) ont prÃ©sentÃ© des constatations relatives Ã la pertinence du modÃ¨le d'exÃ©cution, ou des pratiques de gestion, ou tout cela, pour contribuer aux objectifs du programme. Plus prÃ©cisÃ©ment, environ les deux tiers des Ã©valuations (64 %) ont Ã©valuÃ© le modÃ¨le d'exÃ©cution et 50 % ont examinÃ© les pratiques de gestion. Une Ã©valuation de ce dernier Ã©lÃ©ment Ã©tait plus courante dans les rapports des moyennes et des grandes organisations (55 % et 52 % respectivement) que dans les rapports des petites organisations (33 %). La prÃ©sentation de ces constatations relatives Ã l'exÃ©cution et Ã la mise en oeuvre a obtenu une note Ã©levÃ©e : nous avons dÃ©terminÃ© que 50 % des Ã©valuations Ã©taient adÃ©quates et que 39 % Ã©taient plus qu'adÃ©quates. Les Ã©valuations plus qu'adÃ©quates Ã©taient beaucoup plus nombreuses pour les grandes que pour les petites organisations (43 % contre 29 %).

En outre, la plupart des Ã©valuations (76 %) prÃ©sentaient des donnÃ©es relatives au besoin d'amÃ©liorer les structures de programme ou les ententes d'exÃ©cution. Dans le cas de 14 % des Ã©valuations examinÃ©es, les Ã©lÃ©ments d'exÃ©cution et de mise en Guvre n'ont pas Ã©tÃ© traitÃ©s.

Autres aspects des constatations et de l'analyse
Dans la plupart des Ã©valuations examinÃ©es, les Ã©lÃ©ments et les questions d'Ã©valuation ont Ã©tÃ© traitÃ©s adÃ©quatement (47 %) ou plus qu'adÃ©quatement (31 %), quoique 23 % des Ã©valuations aient Ã©tÃ© inadÃ©quates selon ce critÃ¨re (Voir Tableau 8). De plus, en ce qui a trait Ã la prÃ©sentation de constatations fondÃ©es sur des donnÃ©es qui dÃ©coulent logiquement de donnÃ©es et d'analyses, la majoritÃ© des Ã©valuations ont Ã©tÃ© jugÃ©es adÃ©quates ou mieux (46 % et 33 % respectivement), mÃªme si environ le cinquiÃ¨me (21 %) ont Ã©tÃ© jugÃ©es inadÃ©quates. Les rapports des petites organisations Ã©taient plus susceptibles d'Ãªtre jugÃ©s plus qu'adÃ©quats Ã cet Ã©gard (44 %) que ceux des grandes ou des moyennes organisations (36 % et 26 % respectivement). De plus, les Ã©valuations faites aprÃ¨s avril 2002 Ã©taient un peu plus susceptibles d'Ãªtre plus qu'adÃ©quates selon ce critÃ¨re que celles faites avant (37 % contre 24 %).

En ce qui a trait Ã la pertinence de l'analyse (c'est-Ã -dire la mesure dans laquelle l'analyse est appuyÃ©e par les donnÃ©es selon les tests de signification, les taux de rÃ©ponse, etc.), les notes Ã©taient relativement peu Ã©levÃ©es. PremiÃ¨rement, nous avons Ã©tÃ© incapables de faire cette Ã©valuation pour 50 % des rapports d'Ã©valuation, ce qui laisse croire que les renseignements clÃ©s relatifs Ã l'analyse ne sont pas inclus dans les rapports d'Ã©valuation. DeuxiÃ¨mement, parmi les rapports que nous avons Ã©valuÃ©s, environ les deux tiers Ã©taient adÃ©quats ou mieux (47 % et 21 % respectivement), mais 32 % Ã©taient quand mÃªme inadÃ©quats selon ce critÃ¨re clÃ©. Les raisons qui nous ont incitÃ©s Ã considÃ©rer que l'analyse Ã©tait inadÃ©quate Ã©taient notamment les suivantes : ne pas attribuer les constatations Ã des groupes distincts spÃ©cifiques qui avaient Ã©tÃ© consultÃ©s; ne pas indiquer la magnitude d'une constatation (par exemple, la proportion gÃ©nÃ©rale des intÃ©ressÃ©s qui pouvaient avoir une certaine opinion); trop se fonder sur l'analyse qualitative et anecdotique; et prÃ©senter des donnÃ©es d'Ã©chantillons de trÃ¨s petites tailles sans les accompagner des mises en garde qui s'imposent. Sur une note plus encourageante, nous avons dÃ©terminÃ© qu'un moins grand nombre des Ã©valuations faites aprÃ¨s avril 2002 Ã©taient inadÃ©quates que dans le cas des Ã©valuations faites avant (26 % contre 41 %), ce qui dÃ©note une certaine amÃ©lioration. Les Ã©valuations inadÃ©quates Ã©taient plus frÃ©quentes pour les organismes (55 %) que pour les ministÃ¨res (26 %).

Tableau 8 : Autres aspects des constatations et de l'analyse - Notes
CritÃ¨res	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
Les Ã©lÃ©ments et les questions d'Ã©valuation sont traitÃ©s adÃ©quatement	23	47	31
Les constatations sont fondÃ©es sur les donnÃ©es et dÃ©coulent logiquement de l'interprÃ©tation des donnÃ©es et de l'analyse	21	46	33
L'analyse est convenable	32	47	21
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=57 Ã 115)

E) Conclusions clÃ©s

La plupart des Ã©valuations prÃ©sentaient des conclusions sur la pertinence (57 %) et la rÃ©ussite (80 %) du programme ou de l'initiative en question, mais seulement 29 % ont tirÃ© des conclusions sur la rentabilitÃ©. Il faut noter que moins d'Ã©valuations des grandes organisations ont prÃ©sentÃ© des conclusions sur la pertinence ou la rÃ©ussite (41 % et 70 % respectivement) que dans le cas des Ã©valuations des petites organisations (67 % et 89 %) ou des moyennes organisations (67 % et 86 %). Parmi les Ã©valuations qui ont tirÃ© des conclusions sur ces trois Ã©lÃ©ments, nous avons dÃ©terminÃ© que la plupart Ã©taient adÃ©quates (49 %) ou plus qu'adÃ©quates (27 %) quant Ã la prestation de conclusions objectives, fondÃ©es sur des donnÃ©es, mÃªme si nous avons dÃ©terminÃ© que 24 % des Ã©valuations Ã©taient inadÃ©quates selon ce critÃ¨re (Tableau 9). Nous avons dÃ©terminÃ© qu'un nombre un peu plus Ã©levÃ© d'Ã©valuations des grandes organisations Ã©taient inadÃ©quates (31 %) que d'Ã©valuations des petites ou des moyennes organisations (environ le cinquiÃ¨me dans chacun des cas). Nous avons Ã©galement dÃ©terminÃ© que plus d'Ã©valuations faites aprÃ¨s avril 2002 Ã©taient plus qu'adÃ©quates selon ce critÃ¨re que les Ã©valuations faites auparavant (30 % contre 20 %), signe d'une certaine amÃ©lioration.

TABLEAU 9 : Conclusions - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
PrÃ©senter des conclusions objectives, fondÃ©es sur des donnÃ©es, sur la pertinence, la rÃ©ussite, ou la rentabilitÃ©, ou tout cela	s.o.	24	49	27
PrÃ©senter des conclusions objectives, fondÃ©es sur des donnÃ©es, sur la mise en Guvre et l'exÃ©cution, ou sur les pratiques de gestion, ou tout cela	s.o.	15	52	33
PrÃ©senter d'autres leÃ§ons apprises	54	5	54	41
Les conclusions sont fondÃ©es sur des critÃ¨res de jugement ou des points de rÃ©fÃ©rence explicites	21	s.o.	s.o.	s.o.
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=56 Ã 96). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re.

Presque les deux tiers des Ã©valuations ont tirÃ© des conclusions sur la mise en Guvre et l'exÃ©cution (64 %), mais moins de la moitiÃ© a traitÃ© les pratiques de gestion dans les conclusions (44 %). Les conclusions relatives Ã ce dernier Ã©lÃ©ment Ã©taient moins courantes dans les Ã©valuations des petites organisations (22 %) que dans celles des grandes ou des moyennes organisations (44 % et 53 % respectivement); dans les Ã©valuations des organismes plutÃ´t que dans celles des ministÃ¨res (33 % contre 47 %); et dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (40 % par rapport Ã 54 %). Les notes que nous avons dÃ©terminÃ©es pour la prestation de conclusions objectives, fondÃ©es sur des donnÃ©es, sur ces deux Ã©lÃ©ments Ã©taient trÃ¨s fortes : nous avons dÃ©terminÃ© que la majoritÃ© des Ã©valuations Ã©taient adÃ©quates (52 %) ou plus qu'adÃ©quates (33 %). Les notes Ã©levÃ©es, plus qu'adÃ©quates, Ã©taient plus courantes pour les Ã©valuations des grandes organisations (45 %) que pour celles des petites ou des moyennes organisations (environ le quart dans chaque cas) et pour les Ã©valuations faites aprÃ¨s avril 2002 (40 %) que pour les Ã©valuations faites avant ce temps (20 %).

Environ la moitiÃ© des Ã©valuations (49 %) prÃ©sentait d'autres leÃ§ons apprises au sujet du programme. Dans le cas de ces rapports, les notes Ã©taient trÃ¨s Ã©levÃ©es quant Ã cet aspect. Nous avons dÃ©terminÃ© que juste un peu plus de la moitiÃ© (54 %) des rapports Ã©taient adÃ©quats et que 41 % Ã©taient plus qu'adÃ©quats. Les notes les plus Ã©levÃ©es (c'est-Ã -dire plus qu'adÃ©quates) Ã©taient plus courantes pour les Ã©valuations faites aprÃ¨s avril 2002 que pour celles faites avant (47 % contre 25 %).

Les conclusions de l'Ã©valuation Ã©taient clairement fondÃ©es sur des critÃ¨res de jugement ou des points de rÃ©fÃ©rence explicites dans le cas de seulement une minoritÃ© (21 %) des Ã©valuations, quoique nous ayons Ã©tÃ© incapables de faire une Ã©valuation sur ce point pour 34 % des rapports (par exemple Ã cause du manque d'information). Nous avons observÃ© l'absence de tels critÃ¨res et de tels points de rÃ©fÃ©rence dans le cas de 45 % de l'ensemble des Ã©valuations, et ce dÃ©faut Ã©tait plus courant pour les Ã©valuations faites avant avril 2002 que pour celles faites aprÃ¨s (57 % contre 40 %).

F) Recommandations

Les trois quarts des rapports d'Ã©valuation examinÃ©s contenaient des recommandations formelles (77 %). Une proportion additionnelle de 13 % des rapports proposait des mesures Ã prendre, sans indiquer toutefois qu'il s'agissait de recommandations. Seulement 10 % des rapports ne contenaient pas de recommandations ou de propositions. Les recommandations formelles Ã©taient plus susceptibles d'apparaÃ®tre dans les rapports des petites et des moyennes organisations (89 % et 86 % respectivement) que dans ceux des grandes organisations (63 %). Les rapports faits Ã compter d'avril 2002 Ã©taient plus susceptibles de contenir des recommandations formelles que ceux faits avant (83 % contre 65 %). Finalement, les rapports produits par les organismes Ã©taient plus susceptibles de contenir des recommandations formelles que ceux des ministÃ¨res (88 % contre 75 %).

Parmi les rapports qui contenaient des recommandations (n=99), 26 % indiquaient des scÃ©narios de remplacement et 35 % tenaient compte des contraintes pratiques comme les rÃ¨glements et les budgets. Si nous avons dÃ©terminÃ© que seulement 36 % des rapports Ã©taient dÃ©taillÃ©s, nous avons Ã©galement dÃ©terminÃ© que les deux tiers Ã©taient opÃ©rationnels (67 %) et que juste un peu moins des deux tiers Ã©taient pratiques (61 %). Les recommandations dans les rapports produits Ã compter d'avril 2002 Ã©taient plus susceptibles d'Ãªtre opÃ©rationnelles et pratiques que celles des rapports antÃ©rieurs (72 % contre 57 % et 65 % contre 51 % respectivement). Les recommandations dans les rapports des organismes Ã©taient plus susceptibles d'Ãªtre opÃ©rationnelles que celles dans les rapports des ministÃ¨res (79 % contre 64 %).

Presque tous les rapports qui contenaient des recommandations (94 %) ont traitÃ© des constatations importantes (c'est-Ã -dire des constatations clÃ©s relatives aux grands Ã©lÃ©ments d'Ã©valuation prioritaires), quoique neuf pour cent aient Ã©galement traitÃ© des constatations qui n'Ã©taient pas importantes. Nous avons dÃ©terminÃ© de plus que la grande majoritÃ© des recommandations (94 %) dÃ©coulaient logiquement des constatations et des conclusions de l'Ã©valuation (Tableau 10).

Le quart des rapports qui contenaient des recommandations incluait une recommandation relative au financement global, et dans tous ces cas, la recommandation Ã©tait d'accroÃ®tre le financement. De plus, aucun rapport ne prÃ©sentait de donnÃ©es indiquant qu'un programme n'Ã©tait pas pertinent ou qu'il n'Ã©tait pas nÃ©cessaire. Tous les rapports qui ont prÃ©sentÃ© des donnÃ©es sur les Ã©lÃ©ments de pertinence ont prÃ©sentÃ© des donnÃ©es indiquant que le programme Ã©valuÃ© Ã©tait pertinent et nÃ©cessaire. Il faut toutefois noter que ces constatations Ã©taient parfois accompagnÃ©es de recommandations ou de propositions indiquant qu'il Ã©tait nÃ©cessaire de restructurer ou de faire d'autres changements, mais toujours dans le contexte d'un programme encore pertinent et nÃ©cessaire.

TABLEAU 10 : Recommandations - CritÃ¨res et Notes
CritÃ¨res	Respect des critÃ¨res (%)	Notes
CritÃ¨res	Respect des critÃ¨res (%)	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
Ã‰tablir les scÃ©narios de remplacement et tenir compte des contraintes pratiques	s.o.	35	48	17
PrÃ©senter des recommandations dÃ©taillÃ©es et opÃ©rationnelles (et pratiques)	s.o.	20	51	29
PrÃ©senter des recommandations qui traitent les constatations importantes	94	13	57	30
PrÃ©senter des recommandations qui dÃ©coulent logiquement des constatations et des conclusions	94	15	53	32
Inclure une recommandation relative au financement global	25	s.o.	s.o.	s.o.
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=115). Seuls les rapports qui respectaient les critÃ¨res ont Ã©tÃ© notÃ©s (n=99 Ã 103). Â« s.o. Â» signifie qu'il n'y a pas eu de note selon un critÃ¨re.

G) RÃ©ponse de la direction et Plan d'action

Juste un peu moins de la moitiÃ© des rapports d'Ã©valuation examinÃ©s contenait une rÃ©ponse de la direction (48 %). Les autres rapports (52 %) n'en contenaient pas.

Le tiers des rapports d'Ã©valuation examinÃ©s contenait un plan d'action en rÃ©ponse Ã l'Ã©valuation (33 %). Les autres rapports (67 %) ne contenaient pas cet Ã©lÃ©ment.

H) ClartÃ© et autres aspects du rapport

Nous avons dÃ©terminÃ© que les rapports d'Ã©valuation Ã©taient rÃ©digÃ©s en gÃ©nÃ©ral clairement, que 42 % Ã©taient adÃ©quats et que 44 % Ã©taient plus qu'adÃ©quats (Tableau 11). Notons que nous avons dÃ©terminÃ© que 17 % des rapports Ã©taient excellents Ã ce sujet. Une proportion de 22 % des rapports contenaient un lexique des acronymes pour les rendre plus clairs. Les rapports prÃ©sentÃ©s Ã compter d'avril 2002 ont obtenu de meilleures notes que ceux qui ont Ã©tÃ© prÃ©sentÃ©s avant cette date (53 % contre 24 % de rapports plus qu'adÃ©quats).

En ce qui a trait Ã la prÃ©sentation de l'information technique, nous avons dÃ©terminÃ© que 55 % des rapports contenaient suffisamment mais non excessivement d'information dans le corps du rapport et que les annexes de 38 % des rapports contenaient de l'information technique pertinente et pratique (il faut noter que ces deux aspects ne sont pas mutuellement exclusifs). Nous avons toutefois dÃ©terminÃ© que le tiers des rapports (33 %) Ã©taient inadÃ©quats quant Ã la pertinence de la prÃ©sentation de l'information technique.

Nous avons dÃ©terminÃ© que la grande majoritÃ© des rapports qui incluaient des annexes techniques (n=72) Ã©tait de bonne qualitÃ© (69 % Ã©taient adÃ©quats et 18 % Ã©taient plus qu'adÃ©quats).

Une proportion de 43 % des rapports d'Ã©valuation que nous avons examinÃ©s comptait entre 25 et 40 pages, une longueur jugÃ©e raisonnable aux fins de ces rapports. En ce qui a trait aux autres rapports, 20 % comptaient moins de 25 pages et 37 % en comptaient plus.

Tableau 11 : ClartÃ© et autres aspects du rapport - Notes
CritÃ¨res	InadÃ©quat (%)	AdÃ©quat (%)	Plus qu'adÃ©quat (%)
RÃ©diger le rapport d'Ã©valuation avec clartÃ©	15	42	44
PrÃ©senter l'information technique de faÃ§on convenable	30	51	18
PrÃ©senter des annexes techniques de qualitÃ© Ã©levÃ©e	13	69	18
PrÃ©senter les donnÃ©es de faÃ§on acceptable	33	46	21
Utiliser efficacement les tableaux et les graphiques	25	52	23
Bien organiser le rapport pour qu'il soit facile Ã consulter	19	49	32
Source : Examen des Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale (n=72 Ã 115)

Les rapports avaient tendance Ã Ãªtre seulement modÃ©rÃ©ment bien en ce qui a trait Ã la prÃ©sentation des donnÃ©es. Nous avons dÃ©terminÃ© que le tiers des rapports Ã©taient inadÃ©quats quant Ã la prÃ©sentation acceptable des donnÃ©es (33 %) et que 25 % Ã©taient pareillement inadÃ©quats quant Ã l'utilisation efficace des tableaux et des graphiques. Nous avons dÃ©terminÃ© en ce qui a trait Ã ces deux caractÃ©ristiques que juste un peu moins du quart des rapports Ã©taient plus qu'adÃ©quats. Nous avons cependant dÃ©terminÃ© que la plus grande partie des rapports Ã©taient adÃ©quats quant Ã la prÃ©sentation acceptable des donnÃ©es et Ã l'utilisation efficace des tableaux et des graphiques (46 % et 52 % respectivement). De plus, malgrÃ© les notes modÃ©rÃ©es qui prÃ©cÃ¨dent, 65 % des rapports prÃ©sentaient des chiffres et 71 % documentaient les sources de donnÃ©es.

Nous avons finalement dÃ©terminÃ©, en ce qui a trait Ã la bonne organisation des rapports et Ã la facilitÃ© de les consulter, que presque le tiers Ã©taient plus qu'adÃ©quats (33 %) et que presque la moitiÃ© Ã©taient adÃ©quats (49 %). Les rapports prÃ©sentÃ©s Ã compter d'avril 2002 Ã©taient plus susceptibles d'Ãªtre plus qu'adÃ©quats en ce qui a trait Ã cette caractÃ©ristique que ceux qui ont Ã©tÃ© prÃ©sentÃ©s avant cette date (39 % contre 16 %).

I) Ã‰valuation globale

Ã€ la fin de chaque examen, l'examinateur a notÃ© subjectivement la qualitÃ© globale du rapport d'Ã©valuation. Nous avons dÃ©terminÃ© que la plupart des rapports d'Ã©valuation Ã©taient adÃ©quats (45 %) ou plus qu'adÃ©quats (32 %), quoique seulement huit pour cent aient Ã©tÃ© Â« excellents Â». Nous avons dÃ©terminÃ© d'autre part que juste un peu moins du quart (23 %) Ã©taient globalement inadÃ©quats.

Il n'y avait pas de modÃ¨le clair des diffÃ©rences dans l'Ã©valuation globale par rapport Ã la taille de l'organisation (par exemple, les rapports des petites organisations Ã©taient Ã la fois plus susceptibles d'Ãªtre inadÃ©quats et d'Ãªtre plus qu'adÃ©quats que ceux des grandes organisations, qui Ã©taient plus susceptibles d'Ãªtre adÃ©quats que ceux des petites organisations). Les rapports Ã©taient toutefois plus susceptibles d'Ãªtre inadÃ©quats s'ils avaient Ã©tÃ© prÃ©sentÃ©s avant avril 2002 (32 %, par rapport Ã 18 % pour avril 2002 et par la suite) et plus susceptibles d'Ãªtre plus qu'adÃ©quats s'ils avaient Ã©tÃ© prÃ©sentÃ©s Ã compter d'avril 2002 et par la suite (37 % contre 22 % des rapports prÃ©sentÃ©s avant cette date).

A) Forces

Voici les rÃ©sumÃ©s des principales forces des Ã©valuations de la fonction publique fÃ©dÃ©rale que nous avons dÃ©terminÃ©es :

La plupart des rapports d'Ã©valuation examinÃ©s prÃ©sentaient bien le programme ou l'initiative Ã©valuÃ©, y compris ses ressources, ses bÃ©nÃ©ficiaires et ses intÃ©ressÃ©s. Environ six rapports sur dix traitaient des hypothÃ¨ses sous-jacentes du programme (comme le financement, les partenariats) et de facteurs externes comme les influences environnementales. La plupart des rapports incluaient aussi une dÃ©claration claire des objectifs de l'Ã©valuation.
La majoritÃ© des Ã©valuations (72 %) employaient une conception convenable de recherche, Ã la lumiÃ¨re des objectifs de l'Ã©tude, quoique nous ayons Ã©tÃ© incapables de faire une Ã©valuation en fonction de ce critÃ¨re pour presque le quart des rapports Ã cause du manque de renseignements. Parmi les rapports Ã©valuÃ©s, nous avons dÃ©terminÃ© que la qualitÃ© de la conception de la mÃ©thodologie Ã©tait adÃ©quate ou mieux pour 87 % des Ã©valuations. Ã€ peu prÃ¨s toutes les Ã©valuations (97 %) incluaient des sources de donnÃ©es multiples.
Plus de la moitiÃ© des Ã©valuations (juste un peu moins de 60 %) prÃ©sentaient des constatations relatives Ã la nÃ©cessitÃ© de poursuivre le programme et Ã sa pertinence. De ces Ã©valuations, nous avons dÃ©terminÃ© que la plupart (85 %) Ã©taient adÃ©quates ou plus qu'adÃ©quates en fonction de ces critÃ¨res.
La majoritÃ© des Ã©valuations (87 %) ont prÃ©sentÃ© des constatations dÃ©montrant si le programme ou l'initiative en question produisait ou non des rÃ©sultats appuyant sa poursuite ou son renouvellement. MÃªme si nous avons dÃ©terminÃ© qu'environ le quart de ces rapports (26 %) Ã©taient inadÃ©quats en fonction de ce critÃ¨re, la proportion des rapports dont la prÃ©sentation de ces rÃ©sultats Ã©tait moins qu'adÃ©quate a diminuÃ© (19 % aprÃ¨s avril 2002 contre 39 % avant avril 2002).
En ce qui a trait aux Ã©lÃ©ments d'exÃ©cution et de mise en Guvre, la plupart des Ã©valuations ont prÃ©sentÃ© des constatations relatives Ã la pertinence du modÃ¨le d'exÃ©cution du programme, ou des pratiques de gestion, ou les deux (81 %), et Ã la nÃ©cessitÃ© d'amÃ©liorer la structure du programme ou ses modes d'exÃ©cution (76 %). Les Ã©valuations Ã©taient trÃ¨s bien notÃ©es en fonction du premier critÃ¨re (89 % Ã©taient adÃ©quates ou plus qu'adÃ©quates).
Parmi les Ã©valuations qui traitaient ces Ã©lÃ©ments, nous avons dÃ©terminÃ© que la plupart (85 %) Ã©taient adÃ©quates ou mieux dans la prestation de conclusions objectives, fondÃ©es sur des donnÃ©es relatives Ã la mise en Guvre et Ã l'exÃ©cution, ou aux pratiques de gestion, ou tout cela. De plus, la qualitÃ© des Ã©valuations s'amÃ©liore en ce qui a trait Ã ce critÃ¨re : nous avons dÃ©terminÃ© que 40 % des Ã©valuations faites aprÃ¨s avril 2002 Ã©taient plus qu'adÃ©quates Ã cet Ã©gard par rapport Ã seulement 20 % des rapports produits avant cette date.
Dans leurs conclusions, la moitiÃ© des Ã©valuations (49 %) prÃ©sentaient d'autres leÃ§ons apprises au sujet du programme. Parmi ces rapports, nous avons dÃ©terminÃ© que 95 % Ã©taient adÃ©quats ou plus qu'adÃ©quats Ã cet Ã©gard.
La grande majoritÃ© des Ã©valuations incluaient des recommandations formelles (77 %) ou des suggestions de mesures Ã prendre (13 %). Dans presque tous les cas, les recommandations traitaient des constatations d'Ã©valuation importantes (c'est-Ã -dire des constatations clÃ©s relatives aux grands Ã©lÃ©ments d'Ã©valuation) et dÃ©coulaient logiquement des constatations et des conclusions (94 % dans chaque cas).
Nous avons dÃ©terminÃ© que la plupart des rapports d'Ã©valuation Ã©taient adÃ©quats ou plus qu'adÃ©quats quant Ã la clartÃ© de la rÃ©daction (86 %) et Ã la bonne organisation (81 %).

B) Faiblesses

Voici les principales faiblesses ou les principaux aspects des Ã©valuations de la fonction publique fÃ©dÃ©rale incluses dans le prÃ©sent examen qui ont besoin d'amÃ©lioration :

Les rÃ©sumÃ©s ont besoin d'une certaine amÃ©lioration. Nous avons dÃ©terminÃ© que le quart des rÃ©sumÃ©s que nous avons examinÃ©s Ã©taient inadÃ©quats Ã titre de document cohÃ©rent et autonome et qu'environ le tiers ne prÃ©sentaient pas du tout les Ã©lÃ©ments d'Ã©valuation - quoique ce dernier dÃ©faut ait Ã©tÃ© moins courant dans les rapports prÃ©sentÃ©s aprÃ¨s avril 2002 (22 %) que dans ceux prÃ©sentÃ©s avant (56 %).
La plupart des rapports ne prÃ©sentaient pas de modÃ¨le logique ou n'en indiquaient pas la rÃ©fÃ©rence et n'examinaient pas les grands rapports de cause et d'effet sur lesquels le programme Ã©tait basÃ© (moins du quart des Ã©valuations incluaient ces Ã©lÃ©ments).
MÃªme si environ six rapports d'Ã©valuation sur dix expliquaient le moment choisi pour l'Ã©valuation et la signification de celle-ci, il semblerait qu'une proportion plus Ã©levÃ©e de rapports devrait inclure de tels dÃ©tails de base.
La plupart des rapports (les deux tiers) ne faisaient qu'Ã©numÃ©rer les Ã©lÃ©ments d'Ã©valuation et trÃ¨s peu (environ le quart) en discutaient. De plus, la moitiÃ© des rapports ne faisaient rÃ©fÃ©rence Ã aucun document, comme un CGRR ou un Cadre d'Ã©valuation, comme contexte d'Ã©laboration des Ã©lÃ©ments d'Ã©valuation.
Moins de la moitiÃ© des rapports d'Ã©valuation (44 %) traitaient les Ã©lÃ©ments de rentabilitÃ©, quoique la couverture de ces Ã©lÃ©ments ait Ã©tÃ© plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (51 % contre 27 %).
Un grand nombre de rapports ne contenaient pas de description complÃ¨te des principaux aspects de la mÃ©thodologie. Si juste un peu plus de la moitiÃ© des rapports dÃ©crivaient la mÃ©thodologie, quatre sur dix en ont seulement Ã©numÃ©rÃ© quelques aspects. Seulement le quart des rapports ont fait rÃ©fÃ©rence Ã un document technique plus Ã©toffÃ© sur la mÃ©thodologie. Nous avons dÃ©terminÃ© par consÃ©quent que 46 % des rapports Ã©taient inadÃ©quats du point de vue de leur description mÃ©thodologique. De plus, la moitiÃ© des rapports ne contenaient pas d'instruments de collecte des donnÃ©es ou une rÃ©fÃ©rence indiquant oÃ¹ trouver les instruments.
Seulement une minoritÃ© des Ã©valuations comprenaient des donnÃ©es d'un systÃ¨me de mesure du rendement (24 %) ou des donnÃ©es d'entrevue avec des rÃ©pondants indÃ©pendants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme (26 %). Cette derniÃ¨re caractÃ©ristique est toutefois plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (31 % contre 16 %).
MalgrÃ© le fait que nous avons dÃ©terminÃ© que presque les trois quarts des Ã©valuations avaient une conception convenable de recherche pour les objectifs de l'Ã©tude, seulement une minoritÃ© des concepts d'Ã©valuation incluaient des caractÃ©ristiques d'optimisation de la rigueur de l'analyse comme un groupe de comparaison (13 %), des mesures de rÃ©fÃ©rence (14 %) ou une comparaison avec des normes, de la documentation ou un autre point de rÃ©fÃ©rence (22 %).
Seulement environ quatre rapports d'Ã©valuation sur dix comprenaient une dÃ©claration des limites ou des contraintes de l'Ã©valuation.
Seulement environ le tiers des Ã©valuations prÃ©sentaient des constatations permettant de dÃ©terminer si le programme faisait double emploi ou s'il Ã©tait en contraste avec d'autres programmes ou d'autres initiatives.
Seulement le quart des Ã©valuations examinaient les rÃ©sultats fortuits (25 %) ou traitaient les impacts diffÃ©rentiels (26 %). Environ les deux tiers des Ã©valuations n'ont pas traitÃ© ces Ã©lÃ©ments.
Seulement 26 % des Ã©valuations prÃ©sentaient des constatations concernant des dÃ©marches de remplacement susceptibles d'Ãªtre plus rentables, quoique la couverture de cet Ã©lÃ©ment ait augmentÃ© dans les rapports les plus rÃ©cents (31 % aprÃ¨s avril 2002 contre 16 % avant avril 2002). De plus, environ le tiers des Ã©valuations (34 %) prÃ©sentaient une Ã©valuation qualitative, ou quantitative, ou les deux, de la rentabilitÃ© du programme ou de l'initiative examinÃ©, mÃªme si nous avons dÃ©terminÃ© que 28 % de ces Ã©valuations Ã©taient inadÃ©quates en fonction de ce critÃ¨re.
Il Ã©tait difficile d'Ã©valuer la pertinence de l'analyse (c'est-Ã -dire la mesure dans laquelle l'analyse Ã©tait appuyÃ©e par les donnÃ©es selon les tests de signification, les taux de rÃ©ponse, etc.) pour 50 % des Ã©valuations en raison du manque de dÃ©tails prÃ©sentÃ©s dans les rapports. Parmi les rapports Ã©valuÃ©s en fonction de ce critÃ¨re, nous avons dÃ©terminÃ© que presque le tiers (32 % ) Ã©taient inadÃ©quats. Cette derniÃ¨re proportion a toutefois diminuÃ© au cours des derniÃ¨res annÃ©es (26 % aprÃ¨s avril 2002 contre 41 % avant avril 2002).
Nous avons dÃ©terminÃ© que presque le quart des Ã©valuations (24 %) Ã©taient inadÃ©quates dans leur prestation de conclusions objectives, fondÃ©es sur des donnÃ©es concernant la pertinence, la rÃ©ussite ou la rentabilitÃ©, ou tout cela.
Parmi les rapports qui contenaient des recommandations, seulement 26 % indiquaient des scÃ©narios de remplacement et seulement 35 % tenaient compte des contraintes pratiques (par exemple les rÃ¨glements, les budgets). Nous avons dÃ©terminÃ© que plus du tiers de ces rapports (35 %) Ã©taient inadÃ©quats en fonction de ce critÃ¨re.
Moins de la moitiÃ© des rapports d'Ã©valuation incluaient une rÃ©ponse de la direction (48 %) ou un plan d'action (33 %).
Nous avons dÃ©terminÃ© qu'une proportion considÃ©rable des rapports Ã©taient inadÃ©quats du point de vue de la prÃ©sentation acceptable des donnÃ©es, y compris les chiffres et les sources (33 %), la prÃ©sentation convenable de l'information technique (30 %) et l'utilisation efficace des tableaux et des graphiques (25 %).

A) Taille de l'organisation

Nous avons observÃ© un certain nombre de diffÃ©rences intÃ©ressantes selon la taille de l'organisation. Il n'y avait toutefois pas de modÃ¨le constant dans les rÃ©sultats selon la taille de l'organisation. Il n'est pas ressorti que les organisations d'une catÃ©gorie de taille particuliÃ¨re ou d'une autre prÃ©sentaient de faÃ§on constante des Ã©valuations de qualitÃ© supÃ©rieure Ã celles des organisations des autres catÃ©gories de taille. Les grandes diffÃ©rences selon la taille incluaient ce qui suit :

Les grandes et les moyennes organisations (83 % et 92 % respectivement) Ã©taient plus susceptibles d'inclure un rÃ©sumÃ© que les petites organisations (78 %).
Les rÃ©sumÃ©s qui ne prÃ©sentaient pas les Ã©lÃ©ments d'Ã©valuation Ã©taient plus courants dans les rapports des petites organisations (57 %) que dans ceux des grandes et des moyennes organisations (31 % et 26 % respectivement).
Une discussion de la signification de l'Ã©valuation Ã©tait plus courante dans les rapports des grandes organisations (65 %) que dans ceux des moyennes ou des petites organisations (53 % et 39 % respectivement).
La couverture des Ã©lÃ©ments de la pertinence Ã©tait plus courante dans les Ã©valuations des petites et des moyennes organisations (89 % et 80 % respectivement) que dans celles des grandes organisations (61 %). Le traitement des Ã©lÃ©ments relatifs aux pratiques de gestion Ã©tait plus courant dans les rapports des grandes et des moyennes organisations (50 % et 51 % respectivement) que dans ceux des petites organisations (28 %).
L'absence d'instruments de collecte des donnÃ©es dans le rapport et de la rÃ©fÃ©rence Ã un document technique qui contiendrait ces instruments Ã©tait plus courante dans les Ã©valuations des moyennes organisations (61 %) que dans celles des grandes ou des petites organisations (37 % et 44 % respectivement).
La prÃ©sentation de donnÃ©es qualitatives obtenues de rÃ©pondants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme Ã©tait plus courante dans les Ã©valuations des petites et des moyennes organisations (39 % et 33 % respectivement) que dans celles des grandes organisations (13 %).
Un sondage reprÃ©sentatif des participants et un groupe de comparaison Ã©taient moins courants dans les Ã©valuations des moyennes organisations (31 % et six pour cent respectivement) que dans celles des petites (67 % et 22 %) ou celles des grandes organisations (50 % et 17 %).
Les rapports des moyennes organisations Ã©taient beaucoup moins susceptibles d'Ãªtre plus qu'adÃ©quats dans la prÃ©sentation de donnÃ©es sur la rÃ©ceptivitÃ© au besoin (19 %) que ceux des petites ou des grandes organisations (47 % et 41 % respectivement).
La prÃ©sentation de donnÃ©es sur l'Ã©lÃ©ment de pertinence continue Ã©tait moins courante dans les rapports des grandes organisations (48 %) que dans ceux des moyennes ou des petites organisations (environ les deux tiers dans chaque cas). Il est ressorti que moins de rapports des grandes organisations Ã©taient plus qu'adÃ©quats Ã cet Ã©gard (30 %) que de rapports des petites ou des moyennes organisations (50 % et 46 % respectivement).
La proportion des Ã©valuations qui ont prÃ©sentÃ© des constatations relatives Ã la rÃ©ussite Ã©tait un peu plus Ã©levÃ©e pour les petites organisations (100 %) que pour les moyennes et les grandes organisations (84 % et 85 % respectivement).
La proportion des Ã©valuations inadÃ©quates quant Ã la prÃ©sentation des constatations Ã©tait considÃ©rablement plus faible pour les grandes organisations (18 %) que pour les petites et les moyennes organisations (28 % et 33 % respectivement).
La proportion des Ã©valuations qui prenaient d'autres programmes en considÃ©ration en Ã©valuant les incidences augmente avec la taille de l'organisation, de six pour cent pour les petites organisations, 18 % pour les moyennes, et 24 % pour les grandes organisations.
Les petites organisations (72 %) Ã©taient plus susceptibles de considÃ©rer d'autres facteurs contributifs que les organisations des autres catÃ©gories de taille (59 % pour les moyennes et les grandes organisations).
La proportion des Ã©valuations plus qu'adÃ©quates dans la prise en considÃ©ration de facteurs contributifs dans la mesure de la rÃ©ussite Ã©tait considÃ©rablement plus Ã©levÃ©e pour les moyennes organisations (45 %) que pour les petites et les grandes organisations (31 % et 29 %).
La proportion des Ã©valuations qui ont Ã©valuÃ© des dÃ©marches de remplacement baisse fortement selon la taille de l'organisation, de 50 % pour les petites organisations Ã 13 % pour les grandes organisations.
Une Ã©valuation des pratiques de gestion Ã©tait plus courante dans les rapports des moyennes et des grandes organisations (55 % et 52 % respectivement) que dans ceux des petites organisations (33 %). Les Ã©valuations plus qu'adÃ©quates Ã©taient beaucoup plus nombreuses pour les grandes que pour les petites organisations (45 % contre 29 %).
En ce qui concerne la prÃ©sentation de constatations fondÃ©es sur des donnÃ©es qui dÃ©coulent logiquement de donnÃ©es et d'analyses, plus de rapports des petites organisations Ã©taient plus qu'adÃ©quats (44 %) que de rapports des grandes ou des moyennes organisations (36 % et 26 % respectivement).
Les conclusions sur les pratiques de gestion Ã©taient moins courantes dans les Ã©valuations des petites organisations (22 %) que dans celles des grandes ou des moyennes organisations (44 % et 53 % respectivement).
Les Ã©valuations plus qu'adÃ©quates pour la prestation de conclusions fondÃ©es sur des donnÃ©es concernant les Ã©lÃ©ments d'exÃ©cution et de pratiques de gestion Ã©taient plus courantes dans le cas des grandes organisations (45 %) que dans le cas des petites ou des moyennes organisations (environ le quart dans chaque cas).
Les recommandations formelles Ã©taient plus susceptibles d'apparaÃ®tre dans les rapports des petites et des moyennes organisations (89 % et 86 % respectivement) que dans ceux des grandes organisations (63 %).

B) Avant et aprÃ¨s avril 2002

Nous avons notÃ© des diffÃ©rences clÃ©s selon le moment oÃ¹ le rapport a Ã©tÃ© produit. En gÃ©nÃ©ral, les Ã©valuations faites aprÃ¨s avril 2002 avaient des notes plus Ã©levÃ©es que celles faites avant. Voici les rÃ©sultats dÃ©taillÃ©s :

Les rÃ©sumÃ©s ne prÃ©sentant pas les Ã©lÃ©ments d'Ã©valuation Ã©taient plus courants dans les rapports faits avant avril 2002 que dans ceux faits aprÃ¨s (56 % contre 22 %).
Les Ã©lÃ©ments de rentabilitÃ© Ã©taient plus susceptibles d'Ãªtre traitÃ©s dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (51 % contre 27 %).
La prÃ©sentation de donnÃ©es qualitatives obtenues de rÃ©pondants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme Ã©tait plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (31 % contre 16 %).
Moins de rapports prÃ©sentÃ©s avant avril 2002 Ã©taient plus qu'adÃ©quats en ce qui a trait aux constatations portant sur la pertinence continue, que dans le cas des rapports prÃ©sentÃ©s aprÃ¨s cette date (32 % contre 46 %).
La proportion pour laquelle la prÃ©sentation de constatations sur la rÃ©ussite Ã©tait inadÃ©quate Ã©tait considÃ©rablement moins Ã©levÃ©e dans les rapports produits aprÃ¨s avril 2002 que dans ceux produits avant (19 % contre 39 %).
La proportion des Ã©valuations qui traitaient les dÃ©marches de remplacement Ã©tait beaucoup plus grande dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (31 % contre 16 %).
Les Ã©valuations faites aprÃ¨s avril 2002 Ã©taient un peu plus susceptibles d'Ãªtre plus qu'adÃ©quates concernant la prÃ©sentation de constatations fondÃ©es sur des donnÃ©es qui dÃ©coulent logiquement de donnÃ©es et d'analyses que dans le cas des Ã©valuations faites avant cette date (37 % contre 24 %).
Moins d'Ã©valuations faites aprÃ¨s avril 2002 Ã©taient inadÃ©quates concernant la pertinence de l'analyse que dans le cas des Ã©valuations faites avant cette date (26 % contre 41 %).
Plus d'Ã©valuations faites aprÃ¨s avril 2002 Ã©taient plus qu'adÃ©quates concernant la prestation de conclusions objectives fondÃ©es sur des donnÃ©es (sur la pertinence, la rÃ©ussite ou la rentabilitÃ©, ou tout cela) que pour les Ã©valuations faites avant cette date (30 % contre 20 %), signe d'une certaine amÃ©lioration.
Les conclusions sur les pratiques de gestion Ã©taient moins courantes dans les rapports d'Ã©valuation produits aprÃ¨s avril 2002 que dans ceux produits avant cette date (40 % contre 54 %). Les rapports d'Ã©valuation plus qu'adÃ©quats concernant les conclusions sur les Ã©lÃ©ments d'exÃ©cution et de mise en Guvre Ã©taient plus courants pour les Ã©valuations faites aprÃ¨s avril 2002 (40 %) que pour celles faites avant (20 %).
Les rapports faits Ã compter d'avril 2002 Ã©taient plus susceptibles de contenir des recommandations formelles que ceux faits avant (83 % contre 65 %).
Les rapports prÃ©sentÃ©s Ã compter d'avril 2002 Ã©taient plus susceptibles que les rapports prÃ©sentÃ©s avant cette date d'Ãªtre plus qu'adÃ©quats concernant la clartÃ© de la rÃ©daction (53 % contre 24 %).
Les rapports Ã©taient plus susceptibles d'Ãªtre inadÃ©quats dans l'ensemble s'ils avaient Ã©tÃ© prÃ©sentÃ©s avant avril 2002 (32 % contre 18 % pour avril 2002 et par la suite) et plus susceptibles d'Ãªtre plus qu'adÃ©quats s'ils avaient Ã©tÃ© prÃ©sentÃ©s Ã compter d'avril 2002 (37 % contre 22 % des rapports prÃ©sentÃ©s avant cette date).

C) Organisme par rapport au ministÃ¨re

Nous avons observÃ© quelques diffÃ©rences entre les Ã©valuations parrainÃ©es par les organismes et celles parrainÃ©es par les ministÃ¨res, mais il n'y avait pas de modÃ¨le constant dans les rÃ©sultats. Les diffÃ©rences entre les rapports des organismes et ceux des ministÃ¨res Ã©taient notamment les suivantes :

La discussion de la signification de l'Ã©valuation Ã©tait plus courante dans les rapports des ministÃ¨res que dans ceux des organismes (59 % contre 42 %).
Le traitement des Ã©lÃ©ments relatifs aux pratiques de gestion Ã©tait plus courant dans les Ã©valuations des ministÃ¨res que dans celles des organismes (52 % contre 29 %).
La prÃ©sentation de donnÃ©es obtenues de rÃ©pondants clÃ©s qui n'avaient pas un intÃ©rÃªt dans le programme Ã©tait plus courante dans les Ã©valuations faites aprÃ¨s avril 2002 que dans celles faites avant (31 % contre 16 %).
Les Ã©valuations des organismes Ã©taient considÃ©rablement plus susceptibles de considÃ©rer d'autres facteurs ayant contribuÃ© aux rÃ©sultats que celles des ministÃ¨res (75 % contre 57 %).
La mesure de l'incrÃ©mentalitÃ© Ã©tait incluse dans plus d'Ã©valuations des organismes que des ministÃ¨res (38 % contre 23 %).
Les Ã©valuations des organismes Ã©taient plus susceptibles de traiter des dÃ©marches de remplacement que celles des ministÃ¨res (38 % contre 23 %).
La prÃ©sentation de conclusions concernant la mise en Guvre et l'exÃ©cution Ã©tait moins courante dans les Ã©valuations parrainÃ©es par les organismes que dans celles parrainÃ©es par les ministÃ¨res (33 % contre 47 %).
Les rapports produits pour les organismes Ã©taient plus susceptibles de contenir des recommandations formelles que ceux produits pour les ministÃ¨res (88 % contre 75 %).
Les recommandations dans les rapports pour les organismes Ã©taient plus susceptibles d'Ãªtre opÃ©rationnelles que celles dans les rapports pour les ministÃ¨res (79 % contre 64 %).

4. CONCLUSIONS ET RECOMMANDATIONS

4.1 Conclusions
Dans l'ensemble, la plupart des Ã©valuations que nous avons examinÃ©es sont de qualitÃ© raisonnable. La majoritÃ© a reÃ§u la note globale adÃ©quate (45 %) ou Â« plus qu'adÃ©quate Â» (32 %). Mais une proportion considÃ©rable des Ã©valuations (23 %) a reÃ§u la note inadÃ©quate et il s'agit d'une constatation sur laquelle le CEE doit se pencher. Nous n'avons pas observÃ© de modÃ¨les clairs et constants quand nous avons comparÃ© les rapports des organisations de tailles diffÃ©rentes ou les rapports des ministÃ¨res par rapport Ã ceux des organismes. Nous avons toutefois observÃ© une amÃ©lioration visible concernant un certain nombre de critÃ¨res quand nous avons comparÃ© les Ã©valuations faites avant avril 2002 Ã celles faites aprÃ¨s cette date. Les Ã©valuations plus rÃ©centes dÃ©montrent une amÃ©lioration importante de la qualitÃ©, ce qui laisse croire que la Politique d'Ã©valuation d'avril 2001 du SCT a pu avoir un effet favorable.

Comme nous l'avons illustrÃ© de faÃ§on dÃ©taillÃ©e dans le chapitre prÃ©cÃ©dent, nous avons dÃ©terminÃ© un certain nombre de forces dans les Ã©valuations des programmes de la fonction publique fÃ©dÃ©rale. Les principales forces incluent : une description complÃ¨te du programme ou de l'initiative examinÃ©, y compris ses ressources, ses bÃ©nÃ©ficiaires et ses intÃ©ressÃ©s; une dÃ©claration claire des objectifs d'Ã©valuation; le recours Ã des sources multiples de donnÃ©es dans la mÃ©thodologie; une bonne prÃ©sentation des constatations, en particulier, sur les Ã©lÃ©ments de la pertinence, de l'exÃ©cution et de la mise en Guvre; l'inclusion de recommandations formelles ou de propositions d'amÃ©liorations, avec des recommandations dÃ©coulant logiquement des constatations et des conclusions; et des rapports bien rÃ©digÃ©s et bien organisÃ©s.

D'autre part, notre examen a Ã©galement rÃ©vÃ©lÃ© un certain nombre de faiblesses des Ã©valuations et des rapports, incluant ce qui suit : nÃ©gliger de prÃ©senter le modÃ¨le logique du programme ou ne pas en indiquer la rÃ©fÃ©rence; prÃ©senter une discussion inadÃ©quate des Ã©lÃ©ments d'Ã©valuation et ne pas indiquer la rÃ©fÃ©rence aux documents sources comme les CGRR ou les Cadres d'Ã©valuation; dÃ©crire de faÃ§on inadÃ©quate les aspects de la mÃ©thodologie et nÃ©gliger de joindre les instruments de collecte des donnÃ©es ou d'en indiquer la rÃ©fÃ©rence; utiliser de faÃ§on inadÃ©quate les donnÃ©es de surveillance du rendement et les points de vue des rÃ©pondants clÃ©s indÃ©pendants qui n'ont pas un intÃ©rÃªt dans le programme; Ã©valuer de faÃ§on inadÃ©quate l'impact diffÃ©rentiel des programmes et ne pas utiliser suffisamment de groupes de comparaison et de mesures de rÃ©fÃ©rence dans les conceptions d'Ã©valuation; couvrir superficiellement les Ã©lÃ©ments de rentabilitÃ©.

1) Encourager les divisions des Ã©valuations des ministÃ¨res et des organismes fÃ©dÃ©raux Ã renforcer leurs rapports d'Ã©valuation en traitant les faiblesses majeures dÃ©terminÃ©es dans le prÃ©sent examen :

assurer que le rÃ©sumÃ© d'un rapport comprend tous les points clÃ©s et sert de rÃ©sumÃ© autonome des objectifs d'Ã©valuation, des Ã©lÃ©ments, de la dÃ©marche mÃ©thodologique, des constatations clÃ©s, des conclusions et (s'il y a lieu) des recommandations;
prÃ©senter le modÃ¨le de logique du programme dans le rapport ou dans une annexe, ou indiquer la rÃ©fÃ©rence pour le trouver (par exemple un CGRR, un Cadre d'Ã©valuation);
Ã©numÃ©rer tous les Ã©lÃ©ments d'Ã©valuation dans le rapport ou dans une annexe, ou fournir une rÃ©fÃ©rence pour la liste au complet;
prÃ©senter tous les dÃ©tails clÃ©s de la mÃ©thodologie (par exemple les mÃ©thodes utilisÃ©es, le moment choisi pour la collecte des donnÃ©es, le nombre de rÃ©pondants, les types d'analyse) et les instruments de collecte des donnÃ©es, dans le rapport et ses annexes ou dans un document technique indiquÃ© en rÃ©fÃ©rence;
prÃ©senter les constatations et les donnÃ©es de faÃ§on acceptable en incluant les dÃ©tails clÃ©s sur les donnÃ©es et l'analyse dans le rapport ou dans les annexes, en particulier, les taux de rÃ©ponse, les tests de signification, les chiffres et les rÃ©sultats quantitatifs et les sources de donnÃ©es;
prÃ©senter des conclusions objectives fondÃ©es sur des donnÃ©es, qui sont liÃ©es clairement et logiquement aux constatations de l'Ã©valuation sur laquelle elles sont fondÃ©es;
dans les recommandations, considÃ©rer des scÃ©narios de remplacement (s'il y a lieu) et les contraintes pratiques des mesures Ã prendre qui sont proposÃ©es;
essayer de garder le corps du rapport d'Ã©valuation d'une longueur de 25 Ã 40 pages et prÃ©senter l'information supplÃ©mentaire essentielle (par exemple les constatations dÃ©taillÃ©es et les analyses techniques) dans les annexes.

incorporer des mesures de rÃ©fÃ©rence et un groupe de comparaison dans la conception de recherche des Ã©valuations lorsque les impacts diffÃ©rentiels d'un programme sont un Ã©lÃ©ment important; et

2) Peaufiner les lignes directrices et les critÃ¨res du Conseil du TrÃ©sor concernant les caractÃ©ristiques attendues des (1) mÃ©thodes d'Ã©valuation et (2) des rapports d'Ã©valuation, et les diffuser.

3) Poursuivre la mise en oeuvre d'une dÃ©marche rigoureuse de surveillance de la qualitÃ© des Ã©valuations et l'utiliser comme base d'Ã©laboration de fiches de rendement individuelles sur la qualitÃ© et la santÃ© globale de la fonction d'Ã©valuation par ministÃ¨re et par petit organisme.

4) Indiquer des mesures, y compris une structure de stimulants et des normes, afin d'assurer que les ministÃ¨res et les organismes prÃ©sentent des Ã©valuations et des examens d'une faÃ§on responsable et raisonnable. Le respect de ces normes par les ministÃ¨res et les organismes devrait Ãªtre annoncÃ© publiquement.

Annexe A

Gabarit d'examen

NumÃ©ro du rapport
MinistÃ¨re	Petit o Moyen o Grand o
Organisme	Petit o Moyen/Grand o
Taille du Groupe d'Ã©valuation de l'org.


Type de rapport	o Examen
	o Ã‰valuation formative
	o Ã‰valuation sommative
	o Ã‰tude spÃ©ciale (p. ex., recherche)
	o Autre : ___________________




Date du rapport
Examinateur

Gabarit d'examen

Gabarit d'examen (26 avril 2004)

Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note [8]	Ã‰valuation qualitative [9]	Autres observations
1.0 RÃ©sumÃ© (Remarque : Ã‰valuation derniÃ¨re)
	1.1 PrÃ©senter une Ã©valuation claire et concise, cohÃ©rente Ã titre de document autonome		o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5
	1.2 PrÃ©senter les Ã©lÃ©ments d'Ã©valuation clÃ©s et rÃ©pondre Ã ces Ã©lÃ©ments avec de l'information pertinente au moyen d'une analyse solide	Les Ã©lÃ©ments d'Ã©valuation clÃ©s sont rÃ©sumÃ©s	o Oui - complÃ¨tement o Oui - partiellement o Non
		Les constatations d'Ã©valuation clÃ©s sont rÃ©sumÃ©es	o Oui - complÃ¨tement o Oui - partiellement o Non
		Les conclusions d'Ã©valuation clÃ©s sont rÃ©sumÃ©es	o Oui - complÃ¨tement o Oui - partiellement o Non
		Les recommandations d'Ã©valuation sont prÃ©sentÃ©es	o Oui - complÃ¨tement o Oui - partiellement o Non o s.o.
Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note	Ã‰valuation qualitative	Autres observations
2.0 Introduction et Contexte
2.1 Description	2.1.1 DÃ©crire clairement et avec concision le programme, la politique ou l'initiative Ã©valuÃ©		o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	2.1.2 DÃ©crire les bÃ©nÃ©ficiaires visÃ©s et les intÃ©ressÃ©s concernÃ©s		o Oui - tous o Oui - quelques-uns o Non	o bÃ©nÃ©ficiaires o intÃ©ressÃ©s	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	2.1.3 DÃ©crire les liens de cause et d'effet entre les intrants, les activitÃ©s, les extrants et les rÃ©sultats, et les facteurs externes contribuant Ã la rÃ©ussite ou Ã l'Ã©chec	PrÃ©senter un modÃ¨le de logique dans le rapport	o Oui o Non - mais rÃ©fÃ©rence fournie o Non - pas de rÃ©fÃ©rence
		DÃ©crire les grands rapports de cause et d'effet (p.ex., comme prÃ©sentÃ©s dans le modÃ¨le de logique)	o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		DÃ©crire les hypothÃ¨ses sous-jacentes (p.ex., le financement, les partenariats) ou les facteurs externes (comme les influences environnementales) ou tout cela	o Oui o Non	o hypothÃ¨ses sous-jacentes o facteurs externes	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	2.1.4 Examiner l'attribution des ressources Ã la politique, au programme ou Ã l'initiative	DÃ©crire clairement les ressources du programme pour faire comprendre comment les crÃ©dits du programme ont Ã©tÃ© attribuÃ©s et dÃ©pensÃ©s	o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
2.2 Contexte d'Ã©valuation	2.2.1 DÃ©terminer le rÃ´le de l'Ã©valuation et son importance/sa signification au moment oÃ¹ elle a Ã©tÃ© exÃ©cutÃ©e	DÃ©crire les objectifs de l'Ã©valuation	o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		DÃ©crire le moment choisi pour l'Ã©valuation	o Oui o Non
		DÃ©crire la signification de l'Ã©valuation	o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	2.2.2 DÃ©crire les Ã©lÃ©ments d'Ã©valuation clÃ©s et les questions liÃ©s au programme, Ã la politique ou Ã l'initiative	DÃ©crire les Ã©lÃ©ments d'Ã©valuation et les questions	o Oui - les Ã©lÃ©ments sont examinÃ©s o Oui - les Ã©lÃ©ments sont seulement Ã©numÃ©rÃ©s o Non	o prÃ©senter les Ã©lÃ©ments dans une annexe technique	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		DÃ©terminer les Ã©lÃ©ments d'Ã©valuation dans le contexte d'un CGRR ou d'autres documents clÃ©s	o Oui - CGRR o Oui - autres documents o Non o ImpossibilitÃ© d'Ã©valuer
		Couverture : › pertinence › rÃ©ussite › rentabilitÃ©		o pertinence o rÃ©ussite o rentabilitÃ©
		Inclure les Ã©lÃ©ments concernant : › la mise en Guvre et l'exÃ©cution › les pratiques de gestion		o la mise en Guvre et l'exÃ©cution o les pratiques de gestion
Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note	Ã‰valuation qualitative	Autres observations
3.0 MÃ©thodologie
3.1 Description de la mÃ©thodologie et de la conception	3.1.1 DÃ©crire les mÃ©thodologies logiques, valides, fondÃ©es sur des donnÃ©es qui sont liÃ©es aux Ã©lÃ©ments d'Ã©valuation explorÃ©s OU inclure une rÃ©fÃ©rence claire Ã un document technique contenant cette information	DÃ©crire les mÃ©thodologies et la conception qui s'appliquent Ã l'Ã©valuation	o Oui - description o Oui - seulement l'Ã©numÃ©ration de quelques dÃ©tails o Non - pas de rÃ©fÃ©rence Ã des documents techniques o Non - rÃ©fÃ©rence Ã des documents techniques	o taille de l'Ã©chantillon o MÃ©thode d'Ã©chantillonnage o I nstruments o Liens entre les mÃ©thodes et les Ã©lÃ©ments o RÃ©fÃ©rence Ã des documents techniques	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter les instruments	o Oui - tous o Oui - quelques-uns o Non - pas de rÃ©fÃ©rence Ã des documents techniques o Non - rÃ©fÃ©rence Ã des documents techniques
		Utiliser une conception convenable pour les objectifs visÃ©s de l'Ã©tude (p.ex., rentable, faisable, logique, valide)	o Oui o Non o ImpossibilitÃ© d'Ã©valuer		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9	a
3.2 Sources de donnÃ©es multiples	3.2.1 Inclure des sources multiples de donnÃ©es dans l'Ã©valuation pour appuyer la validitÃ© des constatations	Faire dÃ©pendre l'Ã©valuation de plus d'une source de donnÃ©es pour appuyer ses constatations › qualitative › quantitative › analyse documentaire › examen des documents › examen des dossiers › analyse des donnÃ©es secondaires › examen des bases de donnÃ©es › analyse des donnÃ©es sur le rendement › Ã©tudes de cas › analyse de rentabilitÃ© › autre	o Oui o Non - non mais elle aurait dÃ» o Non - mais ce n'est pas nÃ©cessaire ou convenable pour l'Ã©valuation en question	o qualitative o groupe de discussion o entrevues avec des rÃ©pondants clÃ©s o autre ______ o quantitative o recensement o taille de l'Ã©chantillon o autre ______ o analyse documentaire o examen des documents o examen des dossiers o analyse des donnÃ©es secondaires o examen des bases de donnÃ©es o analyse des donnÃ©es sur le rendement o Ã©tudes de cas o analyse de rentabilitÃ© o autre ______
		L'Ã©valuation utilise des donnÃ©es d'un systÃ¨me de surveillance continue du rendement	o Oui o Non - donnÃ©es existantes mais non utilisÃ©es o Non - pas de donnÃ©es o Sans objet o ImpossibilitÃ© d'Ã©valuer
	3.2.2 Est-ce que l'Ã©quilibre est convenable entre les mÃ©thodologies qualitatives et quantitatives?		o Oui o Non o s.o.			a
	3.2.3 Inclure les perspectives de tous les intÃ©ressÃ©s	› Clients/bÃ©nÃ©ficiaires › gestion et exÃ©cution du programme (fonction publique fÃ©dÃ©rale › tiers exÃ©cutants › partenaires › experts › bÃ©nÃ©ficiaires de financement › non-bÃ©nÃ©ficiaires › autre ______	o ImpossibilitÃ© d'Ã©valuer	o clients/ bÃ©nÃ©ficiaires o gestion et exÃ©cution du programme (fonction publique fÃ©dÃ©rale) o tiers exÃ©cutants o partenaires o experts o bÃ©nÃ©ficiaires de financement o non-bÃ©nÃ©ficiaires o autre ______	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Obtention de donnÃ©es qualitatives de rÃ©pondants clÃ©s qui n'ont pas un intÃ©rÃªt dans le programme	o Oui o Non o ImpossibilitÃ© d'Ã©valuer
3.4 Limites	3.4.1 Formuler clairement les limites et les compromis des mÃ©thodologies, des sources de donnÃ©es et des donnÃ©es utilisÃ©es dans l'Ã©valuation	Description des limites : dÃ©termination et explication des biais rÃ©els et possibles et la fiabilitÃ© des donnÃ©es du point de vue de leur incidence sur les constatations prÃ©sentÃ©es	o Oui o Non o Pas de limites apparentes	o description des biais o explication de la qualitÃ© des donnÃ©es	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Les contraintes de l'Ã©valuation sont prÃ©sentÃ©es clairement	o Oui o Non o Pas de contraintes apparentes	o budget o temps o disponibilitÃ© des donnÃ©es o autre _______	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
3.5 Rigueur	3.5.1 Existence d'un Â« point Â» de comparaison	EnquÃªte auprÃ¨s d'un groupe reprÃ©sentatif de participants	o Oui o Non
3.5 Rigueur		Groupe de comparaison	o Oui o Non
		Comparaison avec des mesures de rÃ©fÃ©rence	o Oui o Non
		Comparaison avec des normes, de la documentation, d'autres points de repÃ¨re	o Oui o Non
Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note	Ã‰valuation qualitative	Autres observations
4.0 Constatations clÃ©s
4.1 Pertinence	4.1.1 PrÃ©senter des constatations concernant l'Ã©tablissement de la pertinence continue et de la contribution Ã la rÃ©alisation des rÃ©sultats en liant les rÃ©sultats aux besoins sociÃ©taux et aux prioritÃ©s du gouvernement	Des donnÃ©es pour dÃ©montrer le besoin rÃ©el	o Oui o Non o Non traitÃ©		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Des donnÃ©es pour dÃ©montrer la rÃ©ceptivitÃ© au besoin	o Oui o Non o Non traitÃ©		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Des donnÃ©es pour dÃ©montrer la pertinence continue par rapport aux prioritÃ©s du gouvernement	o Yes o No o Non traitÃ©		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Des donnÃ©es pour dÃ©montrer que le programme ne fait pas double emploi ou ne contraste pas avec d'autres programmes, politiques ou initiatives	o Oui o Non o Non traitÃ©		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
4.2 RÃ©ussite	4.2.1 PrÃ©senter des constatations qui dÃ©montrent si le programme, la politique ou l'initiative en question produit ou non des rÃ©sultats qui appuient sa poursuite ou son renouvellement	DÃ©crire clairement ce qui s'est produit comme rÃ©sultat du programme et formuler la contribution du programme, de la politique ou de l'initiative Ã la rÃ©ussite	o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	4.2.2 DÃ©terminer d'autres programmes, politiques ou initiatives susceptibles de prÃ©senter des similaritÃ©s, des rapports, des rÃ©sultats partagÃ©s, ou des effets inter-programmes prÃ©vus, ou tout cela.	DÃ©terminer d'autres programmes, politiques ou initiatives	o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s
		Prendre ce qui prÃ©cÃ¨de en considÃ©ration dans l'attribution	o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s
	4.2.3 Examiner d'autres facteurs qui contribuent aux rÃ©sultats (p.ex. concernant le financement ou le partenariat, les facteurs externes)		o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s	o Facteurs internes du programme o Facteurs externes	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	4.2.4 Examiner s'il s'est produit des rÃ©sultats fortuits qui ont contribuÃ© Ã la rÃ©ussite ou qui ont prÃ©sentÃ© des contraintes spÃ©cifiques		o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s	o RÃ©sultats positifs o RÃ©sultats nÃ©gatifs	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	4.2.5 L'incrÃ©mentalitÃ© est traitÃ©e		o Oui o Non o S.O. - les Ã©lÃ©ments de rÃ©ussite ne sont pas traitÃ©s	o Subjectivement o Objectivement	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
4.3 RentabilitÃ©	4.3.1 DÃ©terminer la mesure dans laquelle le programme, la politique ou l'initiative aurait pu Ãªtre exÃ©cutÃ© avec des mÃ©thodes plus convenables et rentables pour rÃ©aliser ses objectifs	Examiner des dÃ©marches de remplacement qui pourraient produire des faÃ§ons plus rentables d'obtenir les rÃ©sultats	o Oui o Non o N/A - S.O. - les Ã©lÃ©ments de rentabilitÃ© ne sont pas traitÃ©s		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter : › une Ã©valuation qualitative de la rentabilitÃ© › une Ã©valuation quantitative de la rentabilitÃ©	o Yes o No o S.O. - les Ã©lÃ©ments de rentabilitÃ© ne sont pas traitÃ©s	o Ã‰valuation qualitative o Ã‰valuation quantitative MÃ©diocre	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
4.4 ExÃ©cution et mise en oeuvre	4.4.1 PrÃ©senter des constatations relatives Ã la dÃ©termination de l'efficacitÃ© et de la pertinence du champ des structures du programme et des ententes de prestation du service pour le programme, la politique ou l'initiative	Ã‰valuer le modÃ¨le d'exÃ©cution, sa pertinence et sa contribution Ã la rÃ©alisation des objectifs › pratiques de gestion	o Oui o Non o S.O.	o ModÃ¨le d'exÃ©cution o Pratiques de gestion	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter des donnÃ©es permettant de dÃ©terminer s'il y a lieu d'amÃ©liorer les structures ou les ententes d'exÃ©cution du programme	o Oui o Non o S.O.
4.5 Ã‰lÃ©ments d'Ã©valuation	4.5.1 Traiter convenablement les Ã©lÃ©ments et les questions d'Ã©valuation				MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5
4.6 Constatations fondÃ©es sur des donnÃ©es	4.6.1 PrÃ©senter des constatations fondÃ©es sur des donnÃ©es extraites de l'Ã©tude d'Ã©valuation	DÃ©montrer que les constatations dÃ©coulent logiquement de l'interprÃ©tation des donnÃ©es et des analyses			MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
4.7 Analyse	4.7.1 L'analyse est convenable	Les donnÃ©es soutiennent l'analyse (selon, par exemple, les tests de signification et les taux de rÃ©ponse)	o ImpossibilitÃ© d'Ã©valuer		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note	Ã‰valuation qualitative	Autres observations
5.0 Conclusions clÃ©s
	5.1 PrÃ©senter des conclusions claires, impartiales et exactes fondÃ©es sur des donnÃ©es	Les conclusions rÃ©pondent objectivement aux Ã©lÃ©ments d'Ã©valuation et sont appuyÃ©es par les constatations		o pertinence o rÃ©ussite o rentabilitÃ©	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
				o la mise en Guvre et l'exÃ©cution o pratiques de gestion	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter d'autres leÃ§ons apprises au sujet du programme Ã la lumiÃ¨re de l'Ã©valuation	o Oui o Non o ImpossibilitÃ© d'Ã©valuer		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		Les conclusions sont fondÃ©es sur des critÃ¨res de jugement ou des points de repÃ¨re explicites	o Oui o Non o ImpossibilitÃ© d'Ã©valuer	o pas de critÃ¨res prÃ©sentÃ©s
6.0 Recommandations
	6.1 PrÃ©senter de faÃ§on claire des recommandations pratiques qui peuvent Ãªtre rÃ©alisÃ©es	Ã‰tablir les scÃ©narios de remplacement et tenir compte des contraintes pratiques (p.ex., les rÃ¨gles, les Ã©tablissements et le budget)	o Oui - recommandations formelles o Oui - des propositions qui ne sont pas appelÃ©es des Â« recommandations Â» o Non	o scÃ©narios de remplacement o contraintes pratiques	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter des recommandations dÃ©taillÃ©es et opÃ©rationnelles (et pratiques)		o dÃ©taillÃ©es o opÃ©rationnelles o pratiques	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	6.2 PrÃ©senter des recommandations qui dÃ©coulent logiquement des constatations et des conclusions et sur lesquelles elles sont appuyÃ©es	PrÃ©senter des recommandations qui traitent les constatations importantes	o Oui o Non	o traiter aussi les recomman- dations moins importantes	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter des recommandations qui dÃ©coulent logiquement des constatations et des conclusions	o Oui o Non		MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	6.3 Inclure une recommandation relative au financement global		o Oui o Non	o augmenter le financement o diminuer le financement
7.0 RÃ©ponse de la direction			o Oui o Non
8.0 Plan d'action			o Oui o Non
Ã‰lÃ©ments/Exigences	CritÃ¨res	ConsidÃ©rations	Liste de vÃ©rification gÃ©nÃ©rale	Liste de vÃ©rification dÃ©taillÃ©e	Note	Ã‰valuation qualitative	Autres observations
9.0 Aspects gÃ©nÃ©raux/Autre
9.1 ClartÃ©	9.1.1 Le rapport est rÃ©digÃ© en clair et les annexes techniques fournissent de l'information technique dÃ©taillÃ©e	RÃ©diger le rapport d'Ã©valuation avec clartÃ©		o lexique des acronymes	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
		PrÃ©senter l'information technique de faÃ§on convenable		o suffisamment d'information technique dans le corps du rapport mais non exces- sivement o information technique pertinente et pratique dans les annexes	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
9.2 Autres aspects du rapport	9.2.1 Le corps du rapport est d'une longueur raisonnable (25 Ã 40 pages)		o Oui o Non	o moins de 25 pages o 25 Ã 40 pages o plus de 40 pages
	9.2.2 Les annexes techniques sont dÃ©terminÃ©es clairement, comme les endroits oÃ¹ elles se trouvent		o Oui - clairement o Oui - mais pas assez clairement o Non
	9.2.3 PrÃ©senter des annexes techniques de qualitÃ© Ã©levÃ©e				MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	9.2.4 PrÃ©senter les donnÃ©es de faÃ§on acceptable	PrÃ©senter les chiffres Documenter les sources		o prÃ©sentation des chiffres o documentation des sources	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5
	9.2.5 Utiliser efficacement les tableaux et les graphiques	Bonne prÃ©sentation Facile Ã lire Acceptable	o Pas de tableaux o Pas de graphiques o Les tableaux ou les graphiques ne sont pas nÃ©cessaires ou convenables pour le rapport	o tableaux efficaces o graphiques efficaces	MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5 s.o. 9
	9.2.6 Bien organiser le rapport pour qu'il soit facile Ã consulter				MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5
	9.2.7 L'examen est entravÃ© par le degrÃ© d'interdiction en vertu de la Loi sur l'accÃ¨s Ã l'information		o Oui - grandement o Oui - lÃ©gÃ¨rement o Non
10. Ã‰valuation globale
	10.1 Ã‰valuation globale				MÃ©diocre 1 2 AdÃ©quate 3 4 Excellente 5

Annexe B

MinistÃ¨re et organisme	Nombre de rapports
Affaires Ã©trangÃ¨res et Commerce international	3
Affaires indiennes et du Nord Canada	10
Agence canadienne de dÃ©veloppement international	4
Agence de dÃ©veloppement Ã©conomique du Canada pour les rÃ©gions du QuÃ©bec	3
Agence des douanes et du revenu du Canada	2
Agence de promotion Ã©conomique du Canada atlantique	1
Agence spatiale canadienne	1
Agriculture et Agroalimentaire Canada	3
Anciens Combattants Canada	2
Bureau de la protection des infrastructures essentielles et de la protection civile	1
Centre canadien de gestion	1
Centre canadien d'hygiÃ¨ne et de sÃ©curitÃ© au travail	1
CitoyennetÃ© et Immigration Canada	1
Commission de la fonction publique	1
Commission nationale des libÃ©rations conditionnelles	1
Communications Canada/Bureau d'information du Canada	3
Condition fÃ©minine Canada	1
Conseil national de recherches du Canada	5
Conseil de recherches en sciences naturelles et en gÃ©nie	1
DÃ©fense nationale	2
DÃ©fense nationale/Anciens Combattants Canada	1
DÃ©veloppement des ressources humaines Canada	5
Finances Canada	1
Gendarmerie royale du Canada	1
Industrie Canada	12
Instituts de recherche en santÃ© du Canada	2
Justice Canada	4
MinistÃ¨re de la Diversification de l'Ã©conomie de l'Ouest	5
Patrimoine canadien	11
PÃªches et OcÃ©ans Canada	2
Ressources naturelles Canada	10
SantÃ© Canada	6
SecrÃ©tariat du Conseil du TrÃ©sor	2
Service correctionnel du Canada	3
Transports Canada	3

Total	115

[1] Nous avons d'abord voulu utiliser un Ã©chantillon stratifiÃ© de rapports d'Ã©valuation en fonction de variables clÃ©s d'intÃ©rÃªt. Il s'est avÃ©rÃ© que l'ensemble de rapports Ã prendre en considÃ©ration dans notre examen Ã©tait constituÃ© seulement des rapports d'Ã©valuation qui ont Ã©tÃ© prÃ©sentÃ©s au SCT. MÃªme si les ministÃ¨res sont tenus de prÃ©senter tous les rapports d'Ã©valuation produits, ils ne semblent pas le faire de maniÃ¨re fiable. Selon l'Ã©tude d'Ã©valuation des capacitÃ©s exÃ©cutÃ©e par le CEE il y a deux ans, il semble qu'environ 250 Ã©valuations sont effectuÃ©es chaque annÃ©e, ce qui aurait dÃ» donner 500 rapports Ã examiner. Mais le SCT a reÃ§u seulement 214 rapports achevÃ©s au cours des deux derniÃ¨res annÃ©es (les annÃ©es visÃ©es par le prÃ©sent examen). De plus, un grand nombre de dossiers d'Ã©valuation sont en format Ã©lectronique (liens sur le web et examens par exemple) et ne respectent pas la dÃ©finition de copie complÃ¨te sur papier d'une Ã©valuation disponible aux fins d'examen. Ã‰tant donnÃ© que l'Ã©chantillon ne comprend pas l'ensemble des rapports, il est difficile d'Ã©valuer dans quelle mesure le lot des rapports examinÃ©s est biaisÃ© ou non. La distribution des rapports examinÃ©s par ministÃ¨re et par organisme se trouve Ã l'Annexe B.

[2] SecrÃ©tariat du Conseil du TrÃ©sor du Canada (septembre 2003). Politique d'Ã©valuation : Cadre de gestion et de responsabilisation axÃ© sur les rÃ©sultats (CGRR).

[4] Les rapports de la population et de notre Ã©chantillon (n=115) incluaient Ã la fois les rapports d'Ã©valuation qui Ã©taient obligatoires et ceux qui ne l'Ã©taient pas. Les Ã©valuations obligatoires (c'est-Ã -dire celles qui ont Ã©tÃ© faites pour appuyer une demande de renouvellement de financement de programme au Conseil du TrÃ©sor) sont axÃ©es sur des questions particuliÃ¨res (p.ex. celles qui sont prÃ©cisÃ©es dans le CGRR) et les directives du CT sont donc claires quant Ã ce que ces rapports devraient traiter. Par contre, le champ des Ã©valuations non obligatoires peut Ãªtre plus Ã©troit ou plus large, selon leur raison-d'Ãªtre.

[5] Le petit nombre de rapports de petits organismes fait en sorte que les constatations relatives Ã cette catÃ©gorie doivent Ãªtre traitÃ©es avec prÃ©caution.

[6] La plupart des critÃ¨res Ã©valuÃ©s dans le prÃ©sent examen ont Ã©tÃ© notÃ©s sur une Ã©chelle de cinq points allant de 1 (Â« mÃ©diocre Â») Ã 5 (Â« excellent Â»), la note mÃ©diane 3 signifiant Â« adÃ©quat Â». En prÃ©sentant les constatations dans le prÃ©sent chapitre, nous avons fait une rÃ©duction pour que les notes reprÃ©sentent les trois catÃ©gories suivantes : 1-2 (Â« inadÃ©quat Â»), 3 (Â« adÃ©quat Â») et 4-5 (Â« plus qu'adÃ©quat Â»).

[7] Outre les Ã©lÃ©ments d'Ã©valuation de base du CT concernant la pertinence continue d'un programme, les rÃ©sultats, les rÃ©ussites et la rentabilitÃ©, certains rapports d'Ã©valuation couvraient des Ã©lÃ©ments de la mise en Guvre et de l'exÃ©cution du programme (par exemple, la mesure selon laquelle les rÃ©sultats attendus du programme Ã©taient produits et offerts aux bÃ©nÃ©ficiaires visÃ©s) et les pratiques de gestion (par exemple, la pertinence de la structure de gouvernance du programme, la clartÃ© des rÃ´les de gestion, de responsabilitÃ©s et de communications).

[8] Une note de 3 indique que le critÃ¨re est respectÃ©, tandis qu'une note de 1 ou 2 indique que le critÃ¨re n'est pas respectÃ© convenablement. Une note de 4 ou 5 indique une qualitÃ© excellente qui signifie que les considÃ©rations minimales de base du critÃ¨re sont dÃ©passÃ©es ou extrÃªmement bien appliquÃ©s.

[9] Ã‰valuation qualitative Ã faire seulement lorsque P apparaÃ®t dans la cellule.

Date de modification :: 2010-02-25

Sélection de la langue

Recherche et menus

Recherche

Examen de la qualité des évaluations dans les ministères et les organismes

Informations archivées

1. INTRODUCTION

2. MÃ‰THODOLOGIE

Nous procédons actuellement au transfert de nos services et de nos renseignements sur le Web vers Canada.ca.

Examen de la qualité des évaluations dans les ministères et les organismes

Informations archivées

1. INTRODUCTION

2. MÃ‰THODOLOGIE