Séminaire doctorants 2008-2009

 

*     *     *

 

1. Séance du 24 janvier 2009

 

1.1

Nous avons évoqué entre autres :

 

- Les RAISONS pour lesquelles la « démarche scientifique » a été mise au point et développée

(conscience des limites de la perception de la réalité par l’homme, tentative de les repousser le plus loin possible)

 

- Les NORMES FONDAMENTALES de la « science », qui est (en principe) :

 

 

« Rigoureuse »

Systématique dans son exploration

Prudente dans son exploration et dans ses inférences

Objective dans la mesure du possible

Logique (au sens cartésien du terme)

 

Descriptive, explicative et prédictive quand elle peut

Pas prescriptive dans la quintessence de sa démarche

(mais ses résultats peuvent conduire à des conclusions prescriptives)

 

Collective

Communicative

Critique

Explicite dans la présentation de ses méthodes, résultats et inférences

 

Ces normes sont évoquées de manière plus ou moins directe ou explicite dans de nombreux ouvrages et exposés d’introduction à la recherche « scientifique ». Ici, elles seront considérées comme une théorie, et feront l’objet de vérification partielle à travers votre travail.

_______________________________________________

1.2

Nous avons dit que

 

LA DEMARCHE EMPIRIQUE DANS LA RECHERCHE SUIT CES NORMES

_______________________________________________

 

1.3

Nous l’avons illustré avec l’article Cantatrix Sopranica L. de Georges Perec

 

Disponible sur Internet, notamment à l’adresse http://pauillac.inria.fr/~xleroy/stuff/tomato/tomato.html

Version française :   http://www.pianotype.net/doc/tomatotopic.htm

_______________________________________________

 

1.4

Nous avons constaté qu’il existe aussi, dans la littérature universitaire qui rend compte de travaux de recherche,

des démarches qui ne suivent pas ces normes, notamment dans les « sciences humaines ».

 

Nous  les regroupons sous le terme LAP (Liberal Arts Paradigm) et essayons de l’explorer.

 

A ces fins, nous examinons un certain nombre d’articles qui relèvent de la recherche empirique, et d’autres de la démarche LAP, et essayons

de voir dans quelle mesure les uns et les autres respectent ou non les normes que nous supposons fondamentales dans la démarche empirique qui représente théoriquement la forme canonique de la « science ».

_______________________________________________

 

1.5  Pour la prochaine séance de travail, le samedi 31 janvier,

 

Chacun de vous examinera au moins

-         deux articles rapportant des travaux de recherche empirique (ERP – Empirical Research Paradigm)

-         deux articles représentatifs de la démarche LAP

 

Je vous envoie à tous plusieurs articles ERP et plusieurs articles LAP parmi lesquels vous pouvez choisir les quatre (ou plus si vous le souhaitez) articles à étudier.

Vous avez également la possibilité d’étudier d’autres articles de recherche ERP ou LAP qui relèvent davantage de vos centres d’intérêt respectifs (pour remplacer les articles proposés par moi). Dans ce cas, je vous demanderai de me communiquer ces articles.

 

Pour chacun des articles étudiés, je vous demande d’examiner la démarche suivie et notamment les aspects suivants :

 

-         Quel est l’objet du travail ? (question de recherche, vérification d’hypothèse, élaboration d’une théorie, réflexion sur telle ou telle chose, etc.)

-         Quelle est la nature de la progression du point de départ et jusqu’à la fin ? (Argumentation théorique, expérimentation, observation naturaliste, etc.)

-         Quelle est la place des faits observés directement par l’auteur (phénomènes « physiques », écrits, comportement verbal etc.) dans la progression ? Est-elle centrale, périphérique, inexistante ou presque ?

-         Comment l’auteur justifie-t-il ses affirmations ? Par un raisonnement, par des faits explicités dans le texte, par quelques faits à titre illustratif, etc. ?

-         Dans quelle mesure avez-vous l’impression que l’auteur est prudent dans ses affirmations et ses inférences ?

 

Je vous demanderai de m’envoyer les résultats de votre travail par courrier électronique à daniel.gile@yahoo.com avant samedi prochain. Il n’y a pas de normes de présentation particulières (longueur, format, style…). Votre français doit être compréhensible, mais vous n’avez pas besoin de rédiger dans un français impeccable. En revanche, je vous demanderai de respecter les normes fondamentales de la recherche empirique telles que nous les avons décrites : vous examinez dans une démarche naturaliste des objets (des articles) dans le but de vérifier la présence ou l’absence d’indicateurs d’application de normes. Selon ce que vous trouverez et vos conclusions (présentées sous forme de synthèse), nous seront amenés ou non à réviser nos hypothèses sur les normes qui sous-tendent la démarche empirique dans la réalité sur le terrain, de même que l’hypothèse d’une distinction entre une démarche empirique et une démarche LAP.

 

Si vous avez des questions, écrivez-moi. Sinon, à la semaine prochaine !

_______________________________________________

 

 

2. Séance du 31 janvier 2009

 

2.1

Nous avons examiné de plus près des extraits de deux articles de type LAP et avons posé à titre provisoire certaines différences entre les démarches LAP et la démarche ERP:

 

Dans la/les démarche(s) LAP, ou en tout cas dans certaines démarches LAP

 

La place des données directement observées n’est pas centrale dans la progression,

qui peut être essentiellement argumentative

 

Les données servant de base à des affirmations sont parfois illustratives seulement

(dans la démarche ERP, elles ont un rôle essentiellement démonstratif)

 

L’objectivité n’est pas une norme forte

 

La prudence dans les inférences n’est pas une norme forte

 

 

Nous n’en concluons pas que ces démarches LAP ne sont pas ‘scientifiques’ dans la mesure où elles ont une légitimité sociale dans le monde universitaire, correspondent à un travail de recherche et participent à la production de connaissances, mais elles ne suivent pas les mêmes normes que la science dans sa définition classique. Le présent séminaire s’inscrit dans l’univers ERP.

 

2.2

Nous avons étudié plusieurs exemples de faiblesses dans la conception de projets de recherche, dans des inférences faites etc. et avons constaté que le simple bon sens permettait de les repérer.

 

2.3

Nous avons commencé à parler de la problématique du choix du sujet de thèse.

 

La thèse implique une contribution à la connaissance de l’objet étudié à travers une « innovation » qui peut prendre la forme de faits nouveaux, d’idées nouvelles ou de méthodes de recherche nouvelles ou améliorées.

 

Nous avons insisté sur l’importance du choix d’une ou plusieurs questions de recherche susceptibles de vous conduire à une telle contribution et à une planification opérationnelle de la thèse, notamment en matière de corpus et de méthodes à mettre en œuvre pour avancer vers des réponses aux questions de recherche.

 

Lors de notre prochaine séance, nous allons parler plus en détail du choix du corpus.

 

_______________________________________________

 

3. Séance du 7 février 2009

 

3.1  Quelques idées abordées

Nous avons commencé par définir le corpus qui, pour nous, est l’ensemble des données qui serviront de base au développement de la thèse. Le corpus est un concept utilisé tant dans la recherche empirique que dans la recherche non empirique (« LAP »). Dans cette dernière, contrairement à la recherche empirique, il peut servir de base à une argumentation qui ne s’appuie pas directement et essentiellement sur les faits identifiés, exposés et traités dans le corpus.

 

La nature et la taille du corpus nécessaire à réalisation d’une thèse dépend des questions de recherche auxquelles on essaie de trouver des réponses et des ressources disponibles. Parfois (souvent), il est impossible de répondre complètement aux questions de recherche qui intéressent le chercheur avec les ressources dont il dispose. Dans ces conditions, il peut modifier les questions de recherche, ou alors se fixer des objectifs qui sont des étapes vers des réponses aux questions de recherche. On distinguera donc les questions de recherche des objectifs de la thèse (ou du projet de recherche de manière plus générale).

 

Les objectifs, une fois réalisés, devront aboutir à une contribution suffisante à la connaissance ou au processus d’exploration de l’objet de l’étude. Une contribution suffisante n’est pas déterminée de manière absolue ; elle est fixée dans chaque cas par le directeur de thèse et par les pré-rapporteurs (dans le système français).

 

Le corpus peut porter sur l’ensemble d’une population, sur un échantillon à des fins de généralisation à la population, et sur un cas unique ou un petit nombre de cas (échantillon-étude de cas) sans recherche de généralisabilité. L’étude de cas est légitime. Elle est suffisante si les informations qu’elle apporte (ou des nouvelles idées, ou de nouvelles méthodes de recherche) sont suffisamment riches même si la généralisabilité n’est pas assurée.

 

Si l’on veut généraliser d’un échantillon à la population, il faut que l’échantillon soit représentatif,  autrement dit que ses caractéristiques ne dévient pas systématiquement dans une direction donnée des caractéristiques de la population. Une telle déviation peut être causée par un biais invisible dans la méthode d’échantillonnage. Une manière ‘propre’ d’éviter le biais est l’échantillonnage aléatoire, mais celui-ci est souvent impossible à réaliser. Dans ce cas, on fait au mieux en essayant de tenir compte de toutes les variables dont on pense qu’elles pourraient causer un biais—et on n’oublie pas d’attirer l’attention du lecteur sur l’incertitude qui pèse sur la généralisabilité des résultats à la population du fait de l’existence possible d’un tel biais. La réplication d’études de cas peut conduire à une convergence des résultats qui renforce l’impression dégagée par chacune d’elles et ne diffère pas essentiellement de la réplication des études avec échantillons.

 

La taille de l’échantillon ne constitue pas en elle-même une défense contre un biais, mais si l’échantillon est représentatif, augmenter sa taille réduit l’écart entre ses caractéristiques et celles de la population. La taille de l’échantillon à constituer dépend des questions de recherche, des ressources, de la variabilité à l’intérieur de la population, du type de traitement des données prévu (notamment si l’on souhaite utiliser des tests statistiques).

 

3.2 Deuxième partie de la séance de travail : questions des participants

Plusieurs questions ont été posées par les participants quant au choix de leur corpus. Deux aspects sont apparus de manière frappante :

-         La difficulté qu’avaient des thésards à se détacher d’un engagement affectif qui les conduisait sur un chemin prescriptif

-         La nécessité de naviguer dans la constitution du corpus en fonction de questions de recherche et d’objectifs précis d’une part, et des ressources de l’autre

 

________________________________________

 

4. Séance du 7 mars 2009

 

La séance du 7 mars a commencé par une étude de la variabilité et de ses effets sur la détectabilité de phénomènes recherchés. Il a notamment été montré, à travers un exemple fictif à deux variantes, l’une où une variable externe importante n’était pas prise en compte dans l’étude d’un phénomène et l’autre où persistait une variabilité incontrôlée limitée à 30% par rapport aux valeurs ‘réelles’, qu’elle pouvait masquer des effets réels et donner l’illusion d’effets factices.

 

La suite de la séance a été consacrée à la démarche expérimentale.

 

Elle a commencé par une interrogation sur la définition même du concept de ‘recherche expérimentale’, pour aboutir à l’idée selon laquelle il s’agit d’une approche de la recherche dans laquelle certaines conditions sont mises en place pour que le phénomène à observer puisse être plus facile à étudier que dans les conditions dans lesquelles il intervient naturellement. Il a été souligné que la démarche expérimentale n’implique pas nécessairement des tests d’hypothèses – elle peut parfaitement être exploratoire.

 

Différentes caractéristiques de la démarche expérimentale ont ensuite été évoquées et discutées, notamment le problème de sa validité écologique et le fait que du fait même de la nécessité d’y ‘contrôler’ différents paramètres, les expériences restent le plus souvent, en tout cas dans les sciences comportementales, des études de cas, même si l’investigation sur des échantillons lissait une partie de la variabilité inter-individuelle. De ce fait, la généralisabilité des résultats des expériences dépend fortement de leur convergence avec les résultats de réplications ultérieures.

 

________________________________________

 

5. Séance du 14 mars 2009

 

Cette séance a été consacrée aux statistiques, avec un petit rappel sur les notions de tendances centrales et de dispersion, suivi d’une discussion plus approfondie sur les principes des tests de signification. Il a notamment été expliqué qu’une ‘différence significative’ n’indiquait qu’une probabilité de ‘faux positif’ (décider qu’une différence décelée entre des échantillons correspond à une différence ‘réelle’ entre les populations qu’ils représentent, alors qu’en réalité cette différence est due au hasard), que les niveaux de signification conventionnels (0,05 et 0,01) sont arbitraires, qu’ils n’indiquent pas l’ampleur de la différence, que les statistiques inférentielles constituent un outil parfois imposé alors qu’il n’est pas nécessairement utile. Voir la présentation powerpoint.

 

Dans la séance du 21 mars 2009, la dernière, nous ferons quelques commentaires supplémentaires sur les statistiques et leur emploi dans la recherche empirique et parlerons un peu des données en tant que telles. Nous aborderons également des questions plus générales sur la présentation des thèses présentant des travaux empiriques, sur leur évaluation et sur la soutenance. Si vous souhaitez que nous abordions d’autres questions, écrivez-moi à daniel.gile@yahoo.com .

 

Par ailleurs, pour la validation de ce séminaire avec un travail personnel, il vous est proposé un exercice. Nous en discuterons ensemble et déciderons de la date-limite pour le rendre.

 

________________________________________

 

6. Séance du 21 mars 2009

 

Lors de cette dernière séance de travail, nous avons commencé par un commentaire sur les corrélations, en précisant que si une variable A était liée à une variable B par un coefficient de corrélation de r, le pourcentage de variabilité de B expliqué par A était de r2. Autrement dit, il était de près de 50% pour un coefficient de corrélation de 0,7  et de 64% pour un coefficient de corrélation de 0,8 – laissant ainsi plus du tiers de la variabilité inexpliquée. Même un coefficient de corrélation de 0,9 laisse 19% de la variabilité d’une variable inexpliquée par l’autre. De la relativité de ces nombres et de leur interprétation.

 

Nous avons vu ensuite un cas où des informations étaient recherchées pour appuyer une théorie sous la forme de l’occurrence « non-rare » d’un phénomène (par opposition à un niveau d’occurrence précis). Un tableau permettait de tirer des conclusions sans que les statistiques inférentielles soient nécessaires ou utiles. L’article en question peut être consulté ici.

 

Nous avons brièvement évoqué l’interdisciplinarité dans la recherche empirique sous l’angle des difficultés qu’elle occasionne souvent : les échanges d’idées et de théories s’avèrent souvent fructueux, mais la coopération méthodologique et l’interprétation des résultats sont parfois plus délicates.

 

Nous avons également discuté de certaines limites de l’utilisation des données dans une recherche empirique strictement conforme à des normes conventionnelles (qui ne permet pas d’exploiter toutes les données disponibles) et avons évoqué la possibilité de compléter les résultats d’une démarche empirique principale par des démarches complémentaires données à titre accessoire, y compris des démarches où l’on adhère de manière moins rigide à des conventions de forme (avec la prudence qui s’impose dans les inférences et les conclusions).

 

Nous avons précisé la nature du travail personnel qui était demandé à ceux qui souhaitaient une validation du séminaire avec travail personnel et fixé la date de son envoi par voie électronique à mon adresse daniel.gile@yahoo.com à la fin du mois d’avril 2009.

 

J’ai également demandé des évaluations du séminaire, par voie anonyme et électronique, aux bons soins de Madame Ait-Atmane nouria.ait-atmane@univ-paris3.fr . Plutôt que de remplir une questionnaire, j’aimerais que chacun dise, ne serait-ce que brièvement, ce qu’il a aimé et ce qu’il a moins aimé dans ce séminaire, afin qu’en cas de récidive, celle-ci soit de meilleure qualité.

 

Enfin, nous avons évoqué certaines caractéristiques des conditions dans lesquelles des membres de jurys de thèse accueillaient des thèses à lire et discuté de certains moyens qui permettaient de leur faciliter la tâche et de mettre en place les meilleures conditions pour que la soutenance se passe au mieux.

 

Les combattants s’avouant épuisés, la séance a pris fin vers 13h20. Je remercie tous les étudiants de leur participation assidue, de leurs questions et de leurs interventions intéressantes, leur souhaite bonne chance, et espère les revoir docteurs et néanmoins satisfaits de leur sort.