Биржевой Спекулянт Инвестор
Биржевой Спекулянт Инвестор личный блог
29 октября 2024, 18:21

Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

На данный момент голосовое управление в 1С в самом развитии. Пока реализовано только распознавание речи в конфигурации 1С Документооборот корп версия 3.
speech.1c.ai/apps/1c-do_30/
Достаточно удобная интеграция, помогает связать распознавание речи и голосовое управление.


1 Для итого необходимо сделать типовые настройки работы с речью в конфигурации 1С Документооборот корп 3
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


2 Дополнить их настройками детализации процесса распознавания (выводить или нет сообщения)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

3 Создадим справочник «Голосовые команды»
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

4  В котором будут содержаться варианты произношения фраз
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

5 Так же в этом справочнике будет последовательность выполняемых действий на встроеннном языке 1С
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

6 Общий внешний вид рабочего места отображает строку, в которую вписывается распознанный текст
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
7 Сама строка распознавания содержит кнопки запуска процесса распознавания
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

8 Индикатор распознавания меняет цвет 
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

9 Процесс распознавания так же отображается визуально
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
10 Распознанные фразы отображаются на экране (при включенной настройке на шаге 2)
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)

11 Так как у нас пример действий это вывод сообщений (Описано на шаге 5), то мы увидим результат.
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)
12 Итоговый общий внешний вид рабочего места
Голосовое управление торговлей в программе Биржевой Спекулянт Инвестор (Платформа 1С Предприятие 8)


На данный момент распознавание речи пока реализовано не во всех конфигурациях.
В нашем конкретном случае можем воспользоваться еще и типовыми возможностями соответствующей конфигурации
1С Документооборот 3 КОРП
v8.1c.ru/doc8/vozmozhnosti-1s-dokumentooborota/




13 Комментариев
  • Ivan Gurov
    29 октября 2024, 23:16
    О, коллеги программисты:) Тоже такое делал на qt5, но в итоге не нашёл заказчика и забил
  • Gambler <osaengine.ru>
    30 октября 2024, 15:27
    Вот правильное направление www.anthropic.com/news/3-5-models-and-computer-use

    youtu.be/2Yjsl8vDebc демонстрация на русском.
      • Gambler <osaengine.ru>
        31 октября 2024, 11:33
        Биржевой Спекулянт Инвестор, он не записывает экран, он понимает как человек, что на экране. И делает манипуляции согласно своему пониманию и внешним командам (от человека).
          • Gambler <osaengine.ru>
            31 октября 2024, 12:34
            Биржевой Спекулянт Инвестор, если говорить про «узкие» места, то в случае ИИ «распознавание» будет иметь куда меньшие потери, чем у Speech-2-Text старым нейро сетевым способом. Дело в том, что у вашего подхода всего один источник — это микрофон (убираю за скобки саму устаревшую технологию).

            В случае ИИ чем больше источников, тем точнее целевое действие. У ИИ в распоряжении и микрофон, и монитор, и данные (да, да, он анализирует и сами данные, а не просто расположение окон относительно друг друга).

            Поэтому ИИ лучше распознает текст, даже если человек ошибается в словах. Например, вмесло Налево сказал Направо. ИИ распознает по контексту ошибочную команду.

            Плюс ИИ не просто управляем кнопками. Он может и заполнять данными форму ввода, может вносить формулы (он их поймет, если сказать какой формат), внести контент.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн