mercredi 5 octobre 2011

Pourquoi twitter?

Donc, je m'intéressais, à la base, à deux choses. Liées, mais différentes:


1) Les particularités du discours d'un individu 
2) Les particularités du discours d'un groupe (qui le différent d'autres groupes)


Pensant que,  pour 2), je pourrais trouver des données intéressants dans des réseaux sociaux, j'ai commencé à penser aux corpus possibles. 


Avantages des réseaux sociaux
Les réseaux sociaux nous donnent des grandes ensembles de données. On peut avoir beaucoup d’énonciations provenant d'un même locuteur.
On peut avoir aussi certains données sur les liens sociaux entre différents locuteurs.



Si on voulait, on pourrait aussi suivre des participants au longueur d'un temps, et essayer de voir émerger / diffuser les particularités linguistiques. Néanmoins, ça ne sera pas dans ce projet-ci.


Twitter
Sur twitter, nous avons la possibilité de récolter beaucoup de données. Des milliards de messages, par des milliards de personnes! Le réseau de chaque personne est parfois très étendu, mais nous avons quelques indicateurs de liens plus proches. Il se trouve que, en construisant une représentation de ce réseau, on pourrait voir émerger des petites groupes de personnes plus proches. Ça sera avec ce genre de données qu'on essayera de comparer les similarités linguistiques.


Il y a quand même quelques inconvénients. On peut utiliser les données sur les  abonnées/abonnements et messages "@" pour avoir une idée des liens sociaux, mais ces indicateurs sont-ils suffisants? 
(Et qu'est-ce qu'est un bon indicateur de lien, enfin?)


En discours, il y a un grande inconvénient - la restriction sur la longueur des messages. Déjà, une restriction à 140 caractères fais que nous avons un discours particulière. Une phrase, une idee, par tweet, en générale. 
Peut-être que ce type de contraint va réduire les différences qui seront autrement présents (peut-être que, dans ces mêmes conditions de restreint, tout le monde finirait par produire des discours assez similaires)


Il est fortement possible aussi que ces contraints amène à des énoncés plus rédigés. Je ne sais pas quel effet ça aura sur la stylistique -- est-ce qu'on trouve plus de variation dans des discours spontanés? (je dirais, à priori, que oui...)


Donc, je pense déjà que twitter n'est pas idéal pour le genre de phénomène que je veux étudier... mais il n'est peut-être pas trop mal pour un premier pas.

Aucun commentaire:

Enregistrer un commentaire