И кое-что ещё, и кое-что другое,
О чём не говорят, чему не учат в школе...
Предлагаю вашему вниманию новый пост о применении data mining к текстам, спарсенным из блогов Смартлаба.
Идея исследования: ежемесячно парсить все посты со Смартлаба и применять к ним метод из класса методов тематического моделирования.
В прошлый раз был применён метод BigARTM из класса методов тематического моделирования. Ряд темы оказались не вполне интерпретируемы. Кроме того этот метод — несмотря на всю его прогрессивность (детальное описание: Воронцов К.В. Вероятностное тематическое моделирование: обзор моделей и аддитивная регуляризация) по сравнению со, скажем, методом LDA - не лишён существенных недостатков. Так, он не позволяет юзеру автоматически выбирать число тем, а также не предлагает метрики для выяснения, какую долю исходной информации позволяет сохранить модель в целом и отдельные темы — в частности
Поэтому моя команда разработала собственный оригинальный метод тематического моделирования. Он позволяет группировать слова («термы», «токены») из множества документов по темам. При этом — в отличие от большинства аналогов — он позволяет автоматически выбирать число тем, а также включает простые и понятные метрики, которые позволяют выяснить, какую долю исходной информации позволяет сохранить модель в целом и отдельные темы — в частности.
Зато своих маршалов он увешал по достоинству орденами и медалями с ног до головы, потому что понимал – это важный стимул.
Брежнев, напротив, сам любил ордена, увешал ими себя, не понимая как он смешон.Стоим в Port Moresby, грузимся. Выгрузка в Японии, в порту Wakayama. Из Японии лечу домой, контракт закончился. За четыре месяца заработал 55000$. Теперь надо научится на бирже зарабатывать столько же, или около того. Реально ли это? Думаю реально, с моими знаниями реально. Но до сих пор не определился со стратегией. Внутри дня много не заработаешь – мешают гэпы, на среднесроке нельзя сильно загружать депозит, чтобы не влететь, как 25 декабря. В общем, дилемма. На данный момент позиция по нефти вышла из -78% до – 12,5%. Пора уже в плюс выходить. В любом случае придётся добавить на счёт тысяч 300, чтобы свободнее себя чувствовать.
Смартлаб что-то не радует в последнее время, нет драйва. Даже стычки между патриотами и либералами проходят вяло: позиции все известны и аргументов новых нет. Клоун выдохся с новыми темами и следует за смартлабовским трендом, что, конечно, не от большого ума. ТМ сделал ошибку, убрав оппозицию на смартлабе. Ему нужно было, как римляне, разделять и властвовать, а он занял позицию одной стороны, а это путь к деградации. Ну, это и понятно – какие книги читаешь, такими мыслями и наполняешься.
Ну а у меня, великолепное настроение – скоро домой….пора домой))