Блог им. KonstantinChaschegorov

Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

На данный момент голосовое управление в 1С в самом развитии. Пока реализовано только распознавание речи в конфигурации 1С Документооборот корп версия 3.
speech.1c.ai/apps/1c-do_30/
Достаточно удобная интеграция, помогает связать распознавание речи и голосовое управление.


1 Для итого необходимо сделать типовые настройки работы с речью в конфигурации 1С Документооборот корп 3
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


2 Дополнить их настройками детализации процесса распознавания (выводить или нет сообщения)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

3 Создадим справочник «Голосовые команды»
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

4  В котором будут содержаться варианты произношения фраз
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

5 Так же в этом справочнике будет последовательность выполняемых действий на встроеннном языке 1С
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

6 Общий внешний вид рабочего места отображает строку, в которую вписывается распознанный текст
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
7 Сама строка распознавания содержит кнопки запуска процесса распознавания
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

8 Индикатор распознавания меняет цвет 
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

9 Процесс распознавания так же отображается визуально
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
10 Распознанные фразы отображаются на экране (при включенной настройке на шаге 2)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

11 Так как у нас пример действий это вывод сообщений (Описано на шаге 5), то мы увидим результат.
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
12 Итоговый общий внешний вид рабочего места
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


На данный момент распознавание речи пока реализовано не во всех конфигурациях.
В нашем конкретном случае можем воспользоваться еще и типовыми возможностями соответствующей конфигурации
1С Документооборот 3 КОРП
v8.1c.ru/doc8/vozmozhnosti-1s-dokumentooborota/




13 комментариев
О, коллеги программисты:) Тоже такое делал на qt5, но в итоге не нашёл заказчика и забил
avatar
Ivan Gurov, В одиночку наверно только на 1С можно большие проекты делать. Скорость разработки большая. Наработок много интерфейсных и т.п. На других языках как говорят можно сделать все, но на них и придется делать это все.
Да, на самом деле особой разницы нет, единственное в 1с, да чуть быстрее конфигурацию можно своять. Зато с qt5 и qml можно под мобильные перенести и будет работать. :)
avatar
Ivan Gurov, 1с даже не надо переносить. Просто опубликовать и работает с мобильного
v8.1c.ru/platforma/mobilnyi-klient/
Но только надо везде таскать с собой приложение 1с:)
avatar
Вот правильное направление www.anthropic.com/news/3-5-models-and-computer-use

youtu.be/2Yjsl8vDebc демонстрация на русском.
avatar
Gambler , Если я правильно понял суть, то это что-то типа съемки фильма на камеру с экрана кинотеатра. Будут потери качества картинки и звука. Мне так кажется. Все таки лучше с диска на диск переписывать и по скорости и по качеству.
Биржевой Спекулянт Инвестор, он не записывает экран, он понимает как человек, что на экране. И делает манипуляции согласно своему пониманию и внешним командам (от человека).
avatar
Gambler , Да спасибо. Я так и понял. Я неточно выразился. Именно при этом процессе и будет происходить потеря точности. Аналогия со съемкой экрана просто пример. Типа как «испорченный телефон» игра между людьми.
Биржевой Спекулянт Инвестор, если говорить про «узкие» места, то в случае ИИ «распознавание» будет иметь куда меньшие потери, чем у Speech-2-Text старым нейро сетевым способом. Дело в том, что у вашего подхода всего один источник — это микрофон (убираю за скобки саму устаревшую технологию).

В случае ИИ чем больше источников, тем точнее целевое действие. У ИИ в распоряжении и микрофон, и монитор, и данные (да, да, он анализирует и сами данные, а не просто расположение окон относительно друг друга).

Поэтому ИИ лучше распознает текст, даже если человек ошибается в словах. Например, вмесло Налево сказал Направо. ИИ распознает по контексту ошибочную команду.

Плюс ИИ не просто управляем кнопками. Он может и заполнять данными форму ввода, может вносить формулы (он их поймет, если сказать какой формат), внести контент.
avatar

теги блога Биржевой Спекулянт Инвестор

....все тэги



UPDONW
Новый дизайн