Россия:
Источники rbc.ru, lenta.ru, ria.ru, vedomosti.ru
Слова и частота упоминания (лемматизированные):
('россия', 667), ('назвать', 415), ('украина', 292), ('заявить', 284), ('сша', 282), ('рассказать', 276), ('российский', 275), ('новый', 268), ('изз', 227),('россиянин', 205),('коронавирус', 202),<br />('путин', 190),('шахта', 189),('оценить', 162), ('год', 155), ('москва', 147), ('глава', 144), ('человек', 135), ('раскрыть', 122), ('листвяжный', 121), ('граница', 117), ('против', 109), ('зеленский', 108), ('белоруссия', 106),
('кузбасс', 105), ('вакцина', 104), ('код', 104), ('предложить', 103), ('штамм', 102), ('сообщить', 101), ('дело', 93), ('объяснить', 88), ('рубль', 87), ('суд', 86), ('мигрант', 84), ('газ', 84), ('страна', 83),
('врач', 81),('число', 79),('госдума', 79),('польша', 79), ('вакцинация', 79), ('цена', 79), ('срок', 78), ('призвать', 77), ('погибнуть', 77), ('ребёнок', 76), ('первый', 76), ('северный', 74), ('санкция', 74)<br /><br /><br />
Мир:
Источники yahoo.com, bbc.co.uk, abcnews.com, foxnews.com, google.com, euronews.com, nbcnews.com, skynews.com, cbsnews.com, nytimes.com, wsj.com, dailymail.co, reutersagency.comСлова и частота упоминания (лемматизированные):
('covid', 341),('new', 311),('says', 180),('variant', 138),('us', 132),('news', 132),('thanksgiving', 107),('man', 106),('black', 103),('omicron', 97), ('biden', 92), ('police', 88), ('uk', 83), ('first', 77), ('friday', 77), ('york', 75),('dead', 71),('say', 69),('rittenhouse', 68),('back', 67),('cases', 67),('times', 67),('today', 65),('vaccine', 64),('could', 64),('amid', 59),('south', 59),('parade', 57),('people', 56),('christmas', 54),<br />('two', 54),('state', 54), ('migrants', 53), ('get', 53), ('channel', 53), ('home', 51), ('killed', 51), ('travel', 51), ('top', 50), ('australia', 50), ('trial', 49), ('house', 49), ('found', 49), ('watch', 48), ('murder', 48), ('day', 48),('case', 45), ('europe', 44), ('million', 43), ('woman', 43)
Прохожу курсы data science, как раз изучаем модуль NLP.