Recherche d’information sur le web (RIW) et moteurs de recherche

Recherche d’information sur le web (RIW) et moteurs  de recherche

Connaissances sur le fonctionnement des moteurs

Comment apprécier les connaissances des participants sur les moteurs ? Des études remarquent le rôle de la connaissance du fonctionnement des utilisateurs dans l’utilisation des stratégies de recherche Thatcher & Greyling (3) ; le temps, le nombre et le type de pages consultées (Saito & Miwa, 2) ; l’utilisation efficace des moteurs (Blondel, a). Mais il n’a y pas encore d’étude portant sur la relation éventuelle entre les connaissances sur le fonctionnement de moteurs de RII et la performance en RIW. La transcription du post-entretien de la tâche constitue la source des informations principales pour apprécier la connaissance TxI des participants. Nous nous rappelons que dans la tâche , en donnant le mot ba-lô comme premier mot-clé, nous demandons aux participants :  d’ajouter un deuxième mot-clé (mot vietnamien) pour que le nombre de résultats soit le plus petit possible.  de remplacer le deuxième mot-clé par un autre mot-clé (mot vietnamien) pour que le nombre de résultats soit le plus grand possible. Recherche d’information sur le web et moteurs de recherche : le cas des lycéens Les connaissances GUI (l’utilisation de guillemets), ET (l’utilisation d’opérateur booléen ET), SAUF (l’utilisation de l’opérateur booléen SAUF), AfR (affichage des résultats) et E44 (l’erreur 44 ou page web non trouvée) des participants sont appréciées principalement grâce aux questions correspondantes dans le questionnaire. Des explications générales pour l’utilisateur sur le fonctionnement du moteur Google se trouvent dans des pages web officielles de Google : http://www.google. fr/support/websearch (en français), http://www.google.com/support/websearch/ (en anglais). 

Connaissance TxI

Pour savoir si un participant possède ou non la connaissance TxI, nous utilisons principalement les explications des participants sur ce qu’ils font pour que le nombre de résultats soit le plus petit (ou grand) possible. Le moteur Google recherche des pages web se basant sur la présence ou l’absence des mots dans ces pages ou dans les liens pointant sur ces pages. Mais, dans le post-entretien, aucun participant ne donne une explication qui porte sur la présence ou l’absence des mots dans les liens pointant sur des pages web. Ils ne donnent que des explications qui portent sur la présence ou l’absence des mots dans des pages web. Donc, le classement des participants selon leur connaissance TxI ne porte que sur leurs explications qui concernent la présence ou l’absence des mots dans des pages web. Selon leurs explications, nous pouvons classer les participants en deux catégories opposées : avoir des connaissances TxI et ne pas en avoir. Un participant est considéré comme maîtrisant connaissance TxI si dans le postentretien il montre que :  pour que le nombre de résultats soit le plus petit possible, il utilise un deuxième mot rare, particulier, sans lien avec le mot ba-lô. Et s’il explique que c’est parce que peu de pages web contiennent à la fois le mot ba-lô et le deuxième mot choisi.  pour que le nombre de résultats soit le plus grand possible, il utilise un mot fréquent, lié au mot ba-lô. Et s’il explique que parce que plusieurs pages web contiennent simultanément le mot ba-lô et ce deuxième mot. Un participant est considéré comme n’ayant pas la connaissance TxI s’il dit que:  il ne sait pas comment trouver un deuxième mot-clé  il essaie au hasard  il procède d’après ses expériences et ne peut pas en donner une explication relative à la connaissance TxI. Les explications d’un participant sur l’utilisation de guillemets et les requêtes utilisées dans la tâche sont des informations supplémentaires qui permettent d’apprécier sa connaissance TxI. Pour illustrer, ici nous citons ci-après deux participants qui donnent des explications claires et concises qui nous permettent de savoir clairement quelles sont leurs connaissances TxI. Ils représentent deux cas opposés : Ex_GV ayant la connaissance TxI et Ex_GV ne l’ayant pas. Leurs explications sont explictées le Tableau . Efficience en RIW et connaissances sur le fonctionnement des moteurs Explications des participants Catégories d’explications Ex_GV a la connaissance TXI Ex_GV n’a pas la connaissance de TxI Comment il a trouvé un deuxième mot-clé pour diminuer le nombre de résultats Ajouter un deuxième mot qui n’a pas de lien avec le mot ba-lô par rapport au sens du mot. Cela permet de diminuer le nombre de résultats, parce que peu de pages web contiennent ces deux mots en même temps. Utiliser un mot par hasard. Ne sait pas comment trouver le deuxième mot-clé pour diminuer le nombre de résultats Comment il a trouvé un deuxième mot-clé pour augmenter le nombre de résultats Au contraire, pour augmenter le nombre de résultats, il faut ajouter un mot lié au mot ba-lô qui apparaît souvent avec le mot ba-lô dans une page web. Utiliser un mot par hasard. Ne sait pas comment trouver le deuxième mot-clé pour augmenter le nombre de résultats Utilisation des guillemets Quand on met le mot ba-lô dans les guillemets, le nombre de résultats diminue parce que le moteur ne fournit que les pages web contenant exactement le mot ba-lô. C’est-à-dire, les mots ba et lô doivent être l’un à côté de l’autre dans l’ordre. Ne sait pas utiliser les guillemets Tableau 37. Les explications dans le post-entretien de la tâche des participants Ex_GV et Ex_GV et leur catégorie Aspect sémantique des mots-clés Remarquons que certains participants utilisent un deuxième mot-clé lié au mot ba-lô en considérant le sens du mot. Comme Google ne tient pas compte du sens des mots dans la RIW, un participant est considéré comme n’ayant pas la connaissance TxI si :  ses explications ne portent que sur le sens des mots  et il ne peut pas expliquer pourquoi avec un deuxième mot-clé n’ayant pas de lien avec le mot ba-lô, le nombre de résultats est plus petit. Il ne peut pas expliquer non plus pourquoi avec un deuxième mot-clé lié au mot ba-lô, le nombre de résultats est plus grand. Il est considéré comme ayant la connaissance TxI si ses explications portent sur le sens des mots et s’il explique que le nombre de résultats est plus petit (ou grand) parce que peu (ou plusieurs) de pages web contiennent ces deux mots en même temps. Le nombre de résultats obtenus Nous ne tenons pas compte du nombre de résultats obtenu par les participants pour apprécier la connaissance TxI des participants. Parce qu’il dépend de la capacité de la langue des participants dans leurs choix de mots. De plus, il dépend également du moment du passage de l’épreuve, des options du moteur choisies, des politiques de sécurités des lycées etc. Recherche d’information sur le web et moteurs de recherche : le cas des lycéens Classement relatif Il faut noter que pour chaque élément de connaissance, nous nous contentons de classer les participants en deux catégories : il a ou il n’a pas la connaissance. C’est simple pour des croisements ultérieurs. En effet, les participants dans une même catégorie ne sont pas pareils au sens de leurs connaissances TxI. Par exemple, parmi les participants ayant la connaissance TxI, des participants comprennent très bien et profondément la connaissance TxI. Dans le postentretien, ils donnent des explications profondes sur la RIW portant sur la présence et l’absence des mots-clés dans les pages web. Au contraire, des participants montrent qu’ils ont la connaissance TxI, mais ont des difficultés dans l’explication plus approfondie sur la connaissance. En outre, il faut aussi tenir compte des difficultés possibles des lycéens dans la verbalisation de leur connaissance Autrement dit, notre classement est relatif…2. Connaissance GUI La connaissance GUI correspond à la question : Dans la formulation de requêtes, comment faites-vous pour trouver des pages web contenant une expression exacte donnée ? Ne sait pas [ ]. Un participant est considéré comme maîtrisant cette connaissance s’il répond qu’il faut mettre l’expression désirée entre les guillemets ou l’entrer dans l’option « cette expression exacte » de la recherche avancée d’un moteur. Au contraire, un participant est considéré comme ne la maîtriant pas s’il donne d’autres réponses que les deux réponses précédentes ou s’il répond qu’il ne sait pas. Le post-entretien sur l’utilisation des guillemets dans la tâche nous fournit des informations supplémentaires pour mieux apprécier la connaissance GUI des participants…3. Connaissances ET, SAUF Les connaissances ET, SAUF correspondent à la question : Étant donné deux mots X et Y, comment écrivez-vous une requête pour trouver des pages web contenant : X et Y : Ne sait pas [ ] X mais pas Y : . Ne sait pas [ ] Connaissance ET Un participant est considéré comme possédant la connaissance ET si sa réponse est X Y ou l’utilisation d’option de « tous les mots suivants » dans la recherche avancée d’un moteur. Nous acceptons également la réponse X +Y comme une bonne réponse. Au contraire, un participant est considéré comme ne possédant pas la connaissance ET s’il donne d’autres réponses (par rapport aux trois questions précédentes) ou s’il répond qu’il ne sait pas. Efficience en RIW et connaissances sur le fonctionnement des moteurs Connaissance SAUF Un participant est considéré comme maîtrisant la connaissance SAUF si sa réponse est X -Y ou s’il utilisel’option d’ « aucun des mots suivants » dans la recherche avancée d’un moteur. Au contraire, un participant est considéré comme ne maîtrisant pas la connaissance SAUF s’il donne d’autres réponses (par rapport aux deux réponses précédentes) ou s’il répond qu’il ne sait pas…4. Connaissance AfR (affichage de résultats par ordre dit de pertinence) Elle correspond à la question : D’après vous, est-ce que le premier résultat est le plus convenable ? Oui [ ] Non [ ] Ne sait pas [ ] Pourquoi ?  Ne sait pas [ ] Parmi les 59 participants, participants répondent « oui », 34 participants répondent « non », participant répond « ne sait pas »3 participants sur 59 donnent des explications. participants sur qui ont coché la réponse « oui » ont donné des explications. La plupart de ces participants ( participants sur ) donnent des explications qui ne sont pas liées à la connaissance AfR. Elles portent principalement sur leurs expériences personnelles en RIW. Par exemple, Ex_GV écrit : « parce que normalement c’est comme ça » ; Gé_VM écrit que : « parce qu’en général, le premier résultat fournit suffisamment d’informations correspondant à la demande ». Seulement trois participants ont donné des explications concernant la connaissance AfR. Ils expliquent que les résultats sont affichés en ordre, en commençant par la page web la plus pertinente selon le moteur de recherche. Nous considérons que ces trois participants ont la connaissance AfR. participants sur 34 qui ont coché la réponse « non » ont donné des explications. Leurs explications n’ont pas à voir avec la connaissance AfR. Ils expliquent qu’il y a peut-être plusieurs résultats pertinents en même temps, que le moteur ne se base que sur les mots-clés et non pas sur le sens des mots, etc. Parmi ces participants, aucun ne parle de l’influence possible du commerce ou « Google bombing » sur l’affichage des résultats. Un participant ayant coché la réponse « ne sait pas » explique que ça dépend de l’objectif de la recherche. Nous avons du mal à classer les participants selon cette connaissance parce que nous n’avons que 43 participants sur 59 à avoir donné une explication. De plus, la plupart des explications ne portent pas sur la connaissance AfR. En outre, en analysant les explications des répondants nous trouvons seulement trois participants qui maîtrisent cette connaissance. Cette « rareté » constatée dans la population empêche une prise en compte dans nos analyses. Donc, nous laissons de côté cette connaissance. Elle n’est plus prise en compte dans nos analyses. 

Table des matières

Introduction
Internet, ressources et recherche d’information sur internet
.2. Études sur la recherche d’information sur internet (RII) du côté utilisateur
.3. Problématique
.4. Méthodes, outils et population étudiée.
.5. Plan de la thèse
2. État de l’art
2.. Qu’est-ce que la recherche d’information sur le web ?
2.2. Facteurs influençant la RIW.
2.3. Comment décrit-t-on la RII des utilisateurs ?
2.4. Des études sur la RIW des élèves
2.5. Conclusion
3. Contexte d’étude vietnamien
3.. Système éducatif du Vietnam et des chiffres clés de l’éducation
3.2. Deux types de lycées
3.3. Place de l’informatique
3.4. Utilisation des TIC pour l’enseignement général
3.5. Entretiens avec des enseignants d’informatique
4. Mise au point d’une méthode de recueil et d’analyse de données
à partir de la passation d’une épreuve de recherche
4.. Objectifs de l’épreuve ou du test
4.2. Outils d’études
4.3. Déroulement d’épreuve et population étudiée
4.4. Données récupérées
4.5. Analyse des données
4.6. Résultats
4.7. Bilan de l’épreuve, difficultés rencontrées et améliorations proposées
4.8. Perspectives
5. Première épreuve avec des lycéens vietnamiens : description
5.. Objectifs de l’épreuve
5.2. Choix des connaissances sur le fonctionnement d’un moteur de RII
5.3. Outils d’études
5.4. Déroulement de l’épreuve
5.5. Données récupérées
5.6. Analyse des données
5.7. Population étudiée
5.8. Premiers résultats
6. Relation entre l’efficience en RIW des participants et leurs connaissances
sur le fonctionnement des moteurs ainsi que leurs caractéristiques
6.. Connaissances sur le fonctionnement des moteurs
6.2. Efficience en RIW
6.3. Relation entre l’efficience et les connaissances
6.4. Relations entre les connaissances possédées, l’efficience en RIW et des caractéristiques de la population
Recherche d’information sur le web et moteurs de recherche : le cas des lycéens
6.5. Discussion
6.6. Conclusion et perspectives
7. Processus, schéma général de RIW, tendance dans la RIW et démarches de RIW
7.. Processus, schéma général de RIW et tendance de transitions entre les actions élémentaires
7.2. Démarches de RIW
7.3. Discussion
7.4. Conclusion et perpectives
8. Deuxième épreuve avec des lycéens vietnamiens : démarches en RIW
8.. Objectifs de l’épreuve
8.2. Tâches de recherche, déroulement et population
8.3. Données récupérées et analyse des données
8.4. Résultats
8.5. Confiances des participants dans la RIW
8.6. Description de RIW des participants
8.7. Discussion et perspectives
9. Conclusion et perspectives
9.. Résultats principaux
9.2. Perspectives
. Références bibliographiques
Annexe
Entretien du groupe d’enseignants d’informatique participantau premier colloque à Hai Phong
Entretien du groupe d’enseignants d’informatique participant au deuxième colloque à Da Lat
Entretien du groupe d’enseignants d’informatique participant au troisième colloque à Hai Phong
Entretien du groupe d’enseignants d’informatique participant au quatrième colloque à Hai Phong
Annexe 2 Questions du post-entretien dans la première épreuve en 9 .
Annexe 3 Canevas d’observation dans la première épreuve en 9
Annexe 4 Deux programmes développés pour compter la fréquence des suites des actions de recherche élémentaires

projet fin d'etudeTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *