Всем привет,
если кому-то все еще интресно, мы продолжаем. Ох и медленно длится у меня процесс )
В общем в этом выпуске начинаем работу с тенсорфлоу тфх пайплайном. Стоит сказать что как бы гугл не рекламировал тфх, продук все еще в стадии развития и как только пытаешься отступиться от примеров, возникают некоторые проблемы.
Код представленный в видео имеется на гитхабе, ссылка в описании. Так же имеются субтитры на русском.
Как я в видео упоминал, возникает первая же проблема при использовании ExampleGen компонента. Он отвечает за ввод данных в конвеер, а так же производит разбиение данных, однако что бы найти как это все работает надо покопаться :) и как выясняется, хоть этот компонент поддерживает разбиение данных на разные подсеты, остальные компоненты конвеера все еще продолжают работать только с test,eval подсетами.
Так же к сожалению он не поддерживает разбиение времянных рядов по заданному времени. Люди предлагают написать свой компонент, но выглядит это как то не очень красиво.
Что ж, эти проблемы решаемы предобработкой данных.
Статистика генерируется на удивление без проблем :) так же как и генерирование описания данных, однако как я понял, если описание данные сгенерино исходя из статистики, то поменять его нельзя, ну или это не просто. Можно просто свое описание на вход подать. Но тут я глубоко не копал.
Еще было замечено что именно перавый компонент не очень быстро работает. :) Надо будет посмотреть как обработка и генерация фич будет работать.