Tutoriels
Cheat Sheet CQL - Feuille d'aide à la requête CQL pour TXM
TXM est un logiciel de traitement de corpus qui permet d’interroger des corpus textuels à l’aide de requêtes CQL (Corpus Query Language). Cet article propose une liste de requêtes CQL pour vous aider à comooser vos propres requêtes sur vos corpus. NB : Une partie de ces requêtes reposent sur des structures spécifiques présentes dans les fichiers XML importés dans TXM, vérifiez ce qui est disponible pour votre corpus au préalable. Pour approfondir les usages de TXM, vous pouvez consulter notre tutoriel avancé sur les usages de TXM. Ou encore consulter la documentation officielle de TXM…
TXM : Analyser un corpus de presse
TXM - Niveau 2 Progression Nous pouvons utiliser TXM pour étudier la progression de l’utilisation d’un mot au cours du temps. Dans le corpus Europresse-Prigojine, nous allons évaluer l’évolution de certains usages au fil du temps et des présidents grâce à la fonction progression. Dans un premier temps, comparez l’évolution de l’usage de ces 3 mots: , et . Il est possible d’ajouter les mots un par un en les recherchant successivement. Notez-vous quelque chose d’intéressant ? Affichez les paramètres de votre onglet progression (roue dentée) Dans la partie “Unité structurelle et propriété…
Tableau Public : visualiser la circulation des images en ligne
Atelier Tableau Public : cas d’étude de la circulation des images en ligne Il est à noter que ce tutoriel propose de reproduire des résultats de recherche partagés lors du congrès de la SFSIC en 2023. Voir Bouté E. (2023). « Militantisme transplateforme : la répression policière des Gilets jaunes entre Facebook et Twitter », XXIIIème Congrès de la Sfsic : la numérisation des sociétés. Bordeaux. 14-15-16 juin 2023 Description de Tableau Public Tableau Public est un logiciel en ligne gratuit qui permet de créer des visualisations interactives, hautement personnalisables et accessibles en ligne…
Excel : usages en SHS
Le 7 décembre 2023, Edouard Bouté a animé un atelier de présentation du logiciel de tableur Excel, focalisé sur les usages possibles en SHS, à travers l’étude de cas d’un corpus de presse de 40 000 articles. Le powerpoint de la séance, proposé sous forme de tutoriel, est mis à disposition ici. Vous pouvez le télécharger en cliquant ici.
Europresse : de la requête à la collecte
Tutoriel expliquant le requêtage sur la plateforme d'articles de Presse Europresse et comment en extraire un corpus qui puisse servir dans des outils de textométrie.
Octoparse
Découvrir l’outil Octoparse, permettant d’effectuer du scraping, c’est à dire de récupérer les données provenant de sites internet de façon automatisée.
Outils de visualisation de données
Cet article présente quelques logiciels de visualisation de données à travers des exemples de graphiques et leurs usages possibles en sciences sociales. Il est issu du cours de méthodes numériques proposé par Virginie Julliard, Félix Alié, Édouard Bouté et Victor Ecrement aux étudiant·es du master recherche du CELSA. Il est disponible en CC BY-SA 4.0, vous pouvez donc l'adapter en nous citant.
Nettoyer, trier, indexer, explorer un corpus avec Notion
Cet article offre une introduction sous forme de tutoriel au nettoyage, à l'indexation, au tri et à l'exploration de corpus textuels. Il est issu du cours de méthodes numériques proposé par Virginie Julliard, Félix Alié, Édouard Bouté et Victor Ecrement aux étudiant·es du master recherche du CELSA. Il est disponible en CC BY-SA 4.0, vous pouvez donc l'adapter en nous citant.
Collecter un corpus, appréhender un terrain
Cet article offre une introduction à la collecte de corpus numérisés ou en terrain numérique. Il est issu du cours de méthodes numériques proposé par Virginie Julliard, Félix Alié, Édouard Bouté et Victor Ecrement aux étudiant·es du master recherche du CELSA. Il est disponible en CC BY-SA 4.0, vous pouvez donc l'adapter en nous citant.
Le traitement automatique des langues
Gaël Lejeune met à disposition ses cours de traitement automatique de langues (TAL) sur Git.
Tableau Public pour les SHS (ancienne version)
Un court tutoriel pour commencer à utiliser Tableau Public. Il s'agit d'un logiciel en ligne gratuit qui permet de créer des visualisations interactives, hautement personnalisables et accessibles en ligne. Sa particularité est que les visualisations ne sont pas construites selon des diagrammes standards, mais de manière modulaire, permettant de tester différentes manières de représenter et spatialiser les métadonnées.
Notion dans la recherche en SHS
Un guide pour apprendre à utiliser Notion. C'est un logiciel de gestion de projet qui comprend des options de manipulation de base de données assez avancées, tout en restant intuitif et flexible. Bien qu’il ne soit pas destiné principalement à la recherche, Notion se révèle très utile pour tous types d’usages en sciences sociales : gestion d’écrits de recherche, suivi et codage d’entretiens, analyse de corpus d’images, etc.