bricolage/braconnage/sabotage


frédéric clavert, c2dh, université du luxembourg

6 février 2025 – msh mondes et huma-num lab, séminaire « les sciences humaines et sociales à l’ère numérique : entre low tech et informatisation générale des données »

bricolage

#ww1 - le centenaire de la grande guerre
sur twitter

  • collecter des données « massivement »
  • apprendre à dialoguer avec une api
  • apprendre à analyser les données
  • faire avec ce que l’on a

#ww1 - les logiciels

  • collecte: 140dev, DMI-TCAT
    • api: streaming, v1.1
  • stockage: mysql
  • préparation des données: gedit/textedit/notepadd++, dataiku dss
  • analyse: iramuteq, gephi, tableur, etc.

#ww1 - configuration matérielle

analyses: nombre de tweets par jour

analyses: répartition des langues

analyses: chd tweets francophones

analyses: chd tweets francophones - projection dans le temps

analyses: réseau

bricolage?

  • adaptation constante, avec les moyens du bord, au gré des affectations
  • ré-utilisation de savoir-faire antérieurs: collecte de données, mysql
  • adaptation d’un cadre méthodologique / théorique (mémétique)

création d’une zone de confort…

  • projet #covid19fr
  • 60 millions de tweets
  • rapidité de mise en place

…devenue plus confortable

  • twitter APIv2
  • academic research product track

braconnage

bricolage / braconnage

  • export/import de données intra/extra union-européenne…
  • adaptation au rgpd

prompting the past

  • difficultés d’obtention des données
  • techniques à employer sont plus borderline (scrapping)
  • détournement de données non prévues à cet effet
  • masses de données impliquant sortie d’une zone de confort
  • recherche bien plus difficile que prévu

europe et empire

sabotage?

apicalypse

  • fin de l’api
  • fin de la zone de confort
  • fin de mes recherches sur twitter

auto-sabotage

continuer à utiliser des données twitter (possible d’octobre 2022 à juillet 2023) était-il encore éthique?

est-ce que les changements induits par le passage de twitter à x permettent encore d’utiliser ces données pour une recherche sur les commémorations en ligne?

luddisme technophile

la technologie peut-elle être sauvée?

fond: Sashataylor, CC BY-SA 3.0

journal of digital history

toute recherche a une dimension politique