, Mais le sujet peut tromper, se taire, jeter un voile de fumée. S'il parle beaucoup et qu'on sait en connaître chaque parole, il sait aussi se taire. L'analyse du discours reste une analyse du discours. Même si le potentiel des techniques face à des corpus géants, dont l'avantage linguistique est de repérer des régularités rares. est vaste, on gardera à l'esprit que tout ne se verbalise pas, Mieux associer le discours aux actes, c'est le propre du numérique où on enregistre des déclarations, des commentaires et des actions en continu

, Cependant quand il est abondant et qu'on peut l'associer au déroulement des événements, qu'on peut y associer des actes et enregistrer les changements d'environnement. Il devient une matière précieuse pour comprendre la causalité sociale. La nouveauté c'est que désormais la physique peut mémoriser les pensées et les actions et leur mémorisation

, On glissera sans doute d'un point de vue linguistique (lexical, syntaxique, sémantique, pragmatique, phonologique, prosodique) vers celui de la littérature si on prend aussi en compte les formes de composition. Le sens n'est pas seulement dans ce qu

, Un horizon prochain, sera l'analyse des genres du discours : l'avis, la réponse, le dialogue, le chat

, Dans chacun de ces genres il faudra identifier des styles : argumentatif, narratif, descriptif, récriminatoire, poétique, diplomatique, revendicatif. Il faudra apprécier aussi comment la combinaison des styles et de ce qu'on dit est capable de persuasion. D'autres options seront sans doute engagées, la langue et ses productions vont redevenir au centre de l'attention

A. Abdaoui, J. Azé, S. Bringay, P. Et, and . Poncelet, « FEEL: A French Expanded Emotion Lexicon, Language Resources and Evaluation, vol.51, issue.3, pp.833-855, 2017.

S. Afroz, M. Brennan, R. Et, and . Greenstadt, « Detecting Hoaxes, Frauds, and Deception in Writing Style Online, 2012 IEEE Symposium on Security and Privacy, pp.461-75, 2012.

C. C. Aggarwal, Recommender Systems, 2016.

L. Anastasopoulos, . Jason, T. Tima, E. Moldogaziev, A. Tyler et al., « Computational Text Analysis for Public Management Research: An Annotated Application to County Budgets, 2017.

T. Arnold, 2017b. « A Tidy Data Model for Natural Language Processing Using CleanNLP, vol.9, p.248, 2017.

L. Aroyo, L. Dixon, N. Thain, O. Redfield, R. Et et al., « Crowdsourcing Subjective Tasks: The Case Study of Understanding Toxicity in Online Discussions, Companion Proceedings of The 2019 World Wide Web Conference on -WWW '19, pp.1100-1105, 2019.

B. , M. Et-george-kingsley, and . Zipf, Human Behavior and the Principle of Least Effort, 1951.

, An Introduction to, Human Ecology ». The American Journal of Psychology, vol.64, issue.1, p.149

K. Benoit, K. Watanabe, H. Wang, P. Nulty, A. Obeng et al., « quanteda: An R package for the quantitative analysis of textual data, Journal of Open Source Software, vol.3, issue.30, p.774, 2018.

D. M. Blei, Y. Andrew, M. I. Ng, and . Jordan, « Latent Dirichlet Allocation, J. Mach. Learn. Res, vol.3, pp.993-1022, 2003.

X. Ding, B. Liu, P. S. Et, and . Yu, « A Holistic Lexicon-based Approach to Opinion Mining, Proceedings of the 2008 International Conference on Web Search and Data Mining, 2008.

D. Duval and F. Pétry, « L'analyse Automatisée Du Ton Médiatique : Construction et Utilisation de La Version Française Du Lexicoder Sentiment Dictionary, Canadian Journal of Political Science, vol.49, issue.2, pp.197-220, 2016.

. Eyheramendy, D. D. Susana, D. Lewis, and . Madigan, On the Naive Bayes Model for Text Categorization, 2003.

J. R. Firth, « A synopsis of linguistic theory 1930-55. » Studies in Linguistic Analysis (special volume of the Philological Society, pp.1952-59, 1957.

A. Fotopoulou and N. Couldry, « Telling the Story of the Stories: Online Content Curation and Digital Engagement, Communication & Society, vol.18, issue.2, pp.235-284, 2015.

,

T. M. Fruchterman, E. M. Et, and . Reingold, Graph Drawing by Force-Directed Placement ». Software: Practice and Experience, vol.21, pp.1129-1164, 1991.

. Goldberg, Neural Network Methods for Natural Language Processing, vol.10, pp.1-309

,

G. Adorno, H. Montserrat, G. Rios, J. Pablo-posadas-durán, G. Sidorov et al., « Stylometry-based Approach for Detecting Writing Style Changes in Literary Texts, Computación y Sistemas, vol.22, issue.1, 2018.

G. Desagulier, « Word embeddings: the (very) basics, 2018.

T. Hastie, R. Tibshirani, J. Et, and . Friedman, The Elements of Statistical Learning, Springer Series in Statistics, 2009.

A. Humphreys and R. Wang, Automated Text Analysis for Consumer Research ». Édité par Eileen Fischer et Linda Price, Journal of Consumer Research, vol.44, issue.6, pp.1274-1306, 2018.

K. Jones and . Sparck, « Index Term Weighting ». Information Storage and Retrieval, vol.9, issue.11, pp.619-652, 1973.

V. B. Kobayashi, T. Stefan, H. A. Mol, G. Berkers, . Kismihók et al., Text Mining in Organizational Research, vol.21, pp.733-65, 2018.

T. V. Laer, J. E. Escalas, S. Ludwig, V. Ellis-a-van-den-hende-;-gita, J. Johar et al., What Happens in Vegas Stays on TripAdvisor? A Theory and Technique to Understand Narrativity in Consumer Reviews, 2018.

I. Lock and P. Seele, « Quantitative Content Analysis as a Method for, Business Ethics: A European Review, vol.24, pp.24-40, 2015.

C. Mabi, « La plate-forme « data.gouv.fr » ou l'open data à la française », Informations sociales, vol.191, issue.5, pp.52-59, 2015.

A. May and T. Ross, « The Design of Civic Technology: Factors That Influence Public Participation and Impact, Ergonomics, vol.61, issue.2, pp.214-239, 2018.

,

X. Meng, « Statistical Paradises and Paradoxes in Big Data (I): Law of Large Populations, Big Data Paradox, and the 2016 US Presidential Election, The Annals of Applied Statistics, vol.12, issue.2, pp.685-726, 2018.

T. Mikolov, I. Sutskever, K. Chen, G. S. Corrado, J. Et et al., Distributed Representations of Words and Phrases and Their Compositionality, p.9, 2013.

G. A. Miller, « WordNet: a lexical database for English, Communications of the ACM, vol.38, issue.11, pp.39-41, 1995.

S. M. Mohammad, P. D. Et, and . Turney, « Crowdsourcing a Word-Emotion Association Lexicon ». Computational Intelligence, vol.29, issue.3, pp.436-465, 2013.

F. Nielsen and . Årup, A New ANEW: Evaluation of a Word List for Sentiment Analysis in Microblogs, CEUR Workshop Proceedings. CEUR-WS.org, vol.718, pp.93-98, 2011.

J. Pennington, R. Socher, C. Et, and . Manning, « Glove: Global Vectors for Word Representation, Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing, pp.1532-1575, 2014.

P. Ratinaud and P. Marchand, Une première approche des thématiques dans les débats à l'Assemblée nationale (1998-2014) ». Mots, vol.108, pp.57-77, 2015.

M. Ribeiro, S. Tulio, . Singh, C. Et, and . Guestrin, Why Should I Trust You?": Explaining the Predictions of Any Classifier, 2016.

S. ?uster, « An investigation into language complexity of World-of-Warcraft game-external texts, 2015.

Y. R. Tausczik, W. James, and . Pennebaker, « The Psychological Meaning of Words: LIWC and Computerized Text Analysis Methods », Journal of Language and Social Psychology, vol.29, issue.1, pp.24-54, 2010.

A. Taylor, M. Marcus, B. Et, and . Santorini, « The Penn Treebank: An Overview, Treebanks, édité par Anne Abeillé, vol.20, pp.5-22, 2003.

R. Tibshirani, « Regression Shrinkage and Selection via the Lasso: A Retrospective: Regression Shrinkage and Selection via the Lasso », Journal of the Royal Statistical Society: Series B (Statistical Methodology), vol.73, issue.3, pp.273-282, 2011.

H. Wickham, « A Layered Grammar of Graphics, Journal of Computational and Graphical Statistics, vol.19, issue.1, pp.3-28, 2010.

L. Wilkinson, The Grammar of Graphics, 2005.

T. Xiong, P. Zhang, H. Zhu, Y. Et, and . Yang, « Sarcasm Detection with Self-Matching Networks and Low-Rank Bilinear Pooling, The World Wide Web Conference on -WWW '19, pp.2115-2139, 2019.