Блог им. SmartLab757

Начало Эры ИИ

Начало Эры ИИ
Эксперты-технооптимисты полагают, — до конца наступающего года сильный ИИ таки будет создан. При этом нужно определиться, что мы называем сильным ИИ. На Западе сейчас вошел в моду термин «универсальный ИИ», а это нечто другое. При переводах разница теряется и не всегда возможно понять, о чем идет речь о сильном или универсальном ИИ. Универсальный должен уметь решать любые интеллектуальные задачи и должен быть в них, как минимум, не хуже человека.
Всегда можно разбить задачу на такую сумму подзадач, с одной из которых «универсальный ИИ» должным образом не справится. Но если не быть слишком въедливыми и придирчивыми и разрешить машине решать задачи так, как ей удобно, задача выглядит более менее решаемой. С той существенной оговоркой, что в ряде незначительных пунктов ИИ еще несколько лет будет отставать от человека, а том числе потому, что эти задачи преднамеренно не будут решаться, чтобы сохранить контроль над ИИ. Иными словами, универсальность этого ИИ будет условной в том смысле, он потенциально может решать любые задачи, но в историческом моменте) решает только те ключевые стратегические задачи, которые наиболее важны для Заказчика.
Заказчиком в данном случае является американская элита. Которая может выступать или как часть мировой элиты (если существующий консенсус в новую эпоху сохранится) или как самостоятельный субъект. Так что же нужно Заказчику? Поскольку переход в новую эпоху невозможен без Третьей Мировой войны и это уже всё более явственная эмпирика, то ключевой задачей является перевес американской машины над любым потенциальным противником.


Возможно в Сирии мы увидели что-то из разряда военного применения ИИ. К сожалению, поток дезинформации с одной стороны и законодательные ограничения с другой не позволяют детально разобрать сирийскую тему. Но стоит отметить, что молниеносный захват власти джихадистами произошел после почти 15 лет беспомощного топтания на месте. А предыдущий пик их достижений был 10 лет назад, после чего они были отброшены к Идлибу. Что же такое вдруг изменилось?? Сообщается о странных отступления иранских, российских и сирийских правительственных сил. Наша пропаганда делает хорошую мину при плохой игре. Но совершенно не факт, что российское руководство изначально планировано сдать Асада. Как и иранцы. Как и сам Асад. Похоже Асад решил бежать примерно за час до начала побега. Очень похоже, что применялись методы информационной, психологической, организационной и кибернетической войны. Причем, именно кибервойна отныне является термином, объединяющим и заключающим в себе все остальные смежные понятия.
По некоторым признакам, организаторам сирийской катастрофы была не уходящая администрация Байдена, а команда президент-электа Трампа. И куратором цифровой революции (некое наподобие Манхэттенского проекта), является Илон Маск, назначенный со-руководителем комиссии по реформе правительства (аппарат которого будет радикально сокращен благодаря внедрению ИИ). Активное участие в операции приняли израильтяне, а также турки, украинцы и, возможно, французы. Важным прологом к операции стало нейтрализация лидеров Хезболлы, активно вовлеченной в сирийский конфликт.


Израильтяне распространяют дезинформацию о якобы вставленной в смертоносные гаджеты взрывчатки, но это технически невозможно. Места для дополнительной массы в устройствах попросту нет, а ведь они исправно работали годами. Не подлежит сомнению, что взрыв был осуществлен программными средствами, заставившими аккумуляторы взрываться особым образом. Три месяца спустя сходным образом в Москве был убит генерал-Кириллов. Считается, что взрывчатку спрятали в самокате, однако достаточно имеющегося в нем аккумулятора.
Другими элементами операции были уничтожение президента Ирана, а позднее также командиров экспедиционного корпуса Стражей исламской революции. Предполагается, что это – дело рук израильского Моссада. Стоит отметить, что команда Байдена в отвратительных отношениях с Нетаньяху, прекрасные личные и политические отношения с которым зато сложились у Трампа.
Эксперты гадают, может ли подобное случиться в следующем году и в России.


Те, кто много общается с GPT-подобными моделями последние 2 года не могли не заметить существенный прирост каждый полгода. У новейшей GPT (o1 Pro), подписка стоит $200 в месяц отзывы о значительном превосходстве над базовым O1. А на подходе были предъявлены экспертам o3 и GPT5. И это демоверсия, бесплатная для широкой публики.
Изначально chat GPT обучали на любых опенсорсных и дешевых наборах данных, включая википедию, посты в Твитере или Фейсбуке, а также новостные ленты и айтишные сайты (например, github). Впечатляющие способности GPT к программированию изначально не планировались. Они стали следствием большого количества опенсорса по данной тематике, в виду популярности криптоанархизма в айти-сообществе. Но идея была лишь в том, чтобы просто научить модель максимально широкому кругу лексики, включая сленги. То, что модель окажется настолько функциональной, похоже, было шоком даже для ее разработчиков. Поскольку настоящая функциональность должна появляться только после файнтьюнинга (дообучния) модели. Базовая версия – это заготовка, облегчающая дообучение модели решению конкретных задач на специализированных данных.
Например, для ИИ военного назначения это могут быть трактаты по геополитике и стратегии, военные уставы и справочники по системам вооружений, материалы штабных игр и материалов кампаний за всю историю данного генштаба, а если получится, то и данные чужих штабов. Преимущество LLM, к которым относится GPT, в способности обрабатывать огромные объемы информации. Поэтому модели можно скармливать любые данные по смежным областям, например, по географии, геопозиционированию, архитектуре итд. А можно данные по всему личному составу противника (насколько их удалось собрать методами электронного и кибер-шпионажа). Чтобы модель могла планировать с учетом выявленных слабостей командиров и даже рядового состава.


А дальше, как с ERP-приложениями, и любыми подобными программами мы даем различные уровни доступа разным сотрудникам. С возможностью дообучения на любом уровне, включая батальон и роту. Что дает GPT-подобному ИИ две важнейших характеристики. 1) способность общаться (и решать вопросы) со всеми аналогичными ИИ, как военного, так и гражданского назначения. В этом плане ИИ выступает как интегратор всех возможностей кибер-систем. 2) Высокая точность и конкретность рекомендаций отдельному пользователю.
Следует отдельно упомянуть возможность прокачки у ИИ высокоуровневых логик. То, с чем мы общаемся в открытом доступе, как правило, изуродовано ограничениями этического контроля, соблюдение американского законодательства. Модель обучают скрывать информацию, полученную с нарушением авторских прав, а также затруднять спецслужбам недружественных держав сбор конфиденциальных сведений из открытых источников. Это привод к крайне обтекаемости и обобщенности ответов на большинство вопросов. Информацию из ИИ приходится буквально вытягивать клещами, подходя под вопрос аргументацию с идеологической базой из Повесточки. В целях военного назначения, несомненно, используется бэкап модели, не кастрированной «этикой». 


При этом ИИ не должен быть гениальным во всем. Вполне достаточно, если он значительно превосходит человеческие способности (например, по скорости и объему обработки данных) в отдельных ключевых направлениях. А также имеет в своем распоряжении некоторые эксклюзивные инструменты: взлом кибер-систем противника, включая подбор паролей, дипфейки, доступ к различным каналам разведданным (спутниковая разведка, радиоперехват, данные с дронов и видеорегистраторов боевой техники, а также агентурные данные и данные кибер-шпионажа). Возможно, уже сейчас локально отрабатывается контроль ИИ над всеми беспилотными системами.


Здесь два возможных направления. 1) Простая интеграция систем управления боем и передача контроля над ним трансформерам (GPT-подобным системам), позволяющая использовать все, уже достигнутые возможности кибер-систем военного назначения. Мы просто заменяем оператора-человека на трансформер. Сперва в качестве персонального ассистента оператора (но фактически в автономном режиме). А в дальнейшем уже окончательно без участия человека. 2) Соединение различных систем Искусственного Интеллекта с нуля в единую кибер-систему, обучаемую и дорабатываемую по результатам миллионов итераций решения боевых и логистичеких задач в виртуальной реальности. Само написание и модификацию кода для этого уже можно поручать новейшим трансформенным моделям. Которые могут не только модифицировать написанный код, но и дообучаться в процессе его исправления по результатам тестирования созданных моделей в виртуальной реальности.
Кибер-системы первого и второго типа можно использовать для создания новых обучающих данных, проводя параллельно миллионы боев сражений, битв, военных кампаний в виртуальной реальности. Например, между двумя моделями первого типа (даже одной и той же версии). Затем между системами первого и второго типа. И в конце между разными системами второго типа. Такие эксперименты наверняка давно проводятся.
Виртуальная реальность развита гораздо больше, чем многие думают. Просто большинство локаций и сред виртуальной реальности не предназначены для широкого круга пользователей. Мало того, они не совсем предназначены для людей – они предназначены для обучения систем Искусственного Интеллекта, например, управляющих роботами. Люди появляются в такой виртуальной реальности только для проверки качества симуляции и уточнения отдельных деталей процесса обучения. А для создания таких сред и локаций широко используются другие фрагменты виртуальной реальности. Например, данные с военных тренажеров и симуляторов.


Отдельно следует сказать про новейшие методы обучения трансформенных моделей. Трансформеры могут решать широкий, практически неограниченный круг задач, хотя по некоторым задачам все еще уступают другим архитектурам (но ничто не мешает использовать их в связке). Дело в том, что сама человеческая речь является линейным отображением любых многомерных моделей, что и делает, собственно, хорошо обученный трансформер. Широко используется эффект (метод) transfer learning: предобученная одной задаче обучается другим задачам быстрее и/или с большей конечной точностью. В то же время «аналогичными» в большей или меньшей степени являются практически все языковые задачи. Только из одних задач модель может взять больше, а из других меньше. Если модель достаточно большая (как современная LLM) в нее можно пихать все подряд, и это прекрасно работает. Отмечен, эффект синергизма – чем больше знаний и навыков ты в нее впихнул, тем легче она обучается следующим.
Таким образом, сам по себе механический рост модели уже значительно прокачивает ее интеллект. При условии, что обеспечен достаточными вычислительными мощностями и обучающими данными. Поскольку весь корпус написанных человеком книг составляет порядка 10 миллионов и еще порядка 100 миллионов статей, человеческие текстовые данные для обучения нейросетей близки к исчерпанию. Однако в последние годы достигнут существенный прогресс в использовании синтетических данных. Например, существуют модели, способные качественно генерировать текст, описывающий видеоряд (данные с камер видеонаблюдения, художественные и документальные фильмы, данные с сенсоров и приборов, в том числе электронных микроскопов, радиотелескопов, метеостанций и т.д.).
Количество методов и техник обучения в современном deep learning не поддается точному учету. Количество всевозможных архитектур, комбинирующих тысячи методов и техник, практически безгранично. Опишу парочку интересных подходов. GAN: две нейросети, соединяются вместе, чтобы «противодействовать» друг другу. Генератор создает максимально качественные тексты, пытаясь пройти тест Тьюринга, а дискриминатор пытается определить, принадлежит ли текст (в том числе ответ на вопрос) машине, или человеку. При этом они взаимно обучают друг друга, достигая все более высокого качества. Недостатком GAN является mode collapse, при котором разнообразие ответов генератора уменьшается (генератор находит слабые места дискриминатора и эксплуатирует их). Однако найдены математические методы решения этой проблемы (через различные метрики расчета семантического расстояния между высказывания в многомерном векторном пространстве).


MAML: имеющий множество разновидностей метод мета-обучения, то есть обучения обучению. Обучение в MAML состоит из 4 этапов. Сперва предобучение на всевозможных данных общего профиля (википедия, новостные менты, переписка в соцсетях). Делаем бэкап модели. Затем первый круг, собственно, MAML. Забиваем множество низкокачественных или не вполне релевантных данных, имеющих хоть какое-нибудь отношение к решаемой задаче. Идея в том, что таких данных должно оказаться в избытке. В том числе синтетических данных. Запускаем второй круг обучения. Скармливая модели большее качественные и релевантные данные. Обобщаем изменения параметров и применяем не в обученной в первом круге модели, а к имеющимся бэкапу. В результате модель получает знания, как бы немного размазанные данные «пунктиром». Нужные она возьмет на следующем этапе – файнтьюнинге. Проверено, что файнтьюнинг предобученной при помощи MAML модели пройдет невероятно быстро и качественно. К этому можно добавить множество дополнительных техник и приемов, повышающих скорость и точность обучения в том числе для высокоуровневых логик.
Ожидается, (и такие прогнозы звучали в этом году на закрытом собрании Бильдербергльского клуба в мае уходящего года), что интернет да, и все компьютерные технологии в ближайшие два года претерпят драматичные изменения, полностью преображающие не только сами компьютерные технологии, но и всю экономическую жизнь, которая будет организованна вокруг систем искусственного интеллекта. Персональные ассистенты заменят интернет-браузеры и поисковые системы, все выдачи будут появляться в окне самого ассистента, так же будут появляться ссылки на написанные им код. Вместо множества приложений, ассистент будет почти моментально писать для вас программы под заказ. Некоторые из этих программ, возможно, вы сможете продать на специализированных площадках. Маркетинговый план напишет для вас тот же ассистент. Не один бизнес не сможет работать без рекомендаций персонального ассистента и написанного им кода. Весь бизнес будет организован вокруг таких мини-экосистем, подключенных, к большим экосистемам, типа Сбербанка и Озона. В дальнейшем персональные ассистенты станут цифровыми двойниками личности, заменяя паспорт, медкарту, трудовую книжку, банковский счет и т.д.

Цифровое будущее несет в себе потенциал ада и рая, целые народы сгинут без следа, в то время как другие расселятся за пределами нашей планеты.

5 комментариев
Был бы ИИ хоть сколько-нибудь силён, Россия бы проиграла в СВО. И т.д. по списку.
avatar
Жители Москвы, стесненные жилищным кризисом, бросятся в ваш великолепный город. Столица автоматически переходит в Васюки. Сюда приезжает правительство. Васюки переименовываются в Нью-Москву, Москва — в Старые Васюки. Ленинградцы и харьковчане скрежещут зубами, но ничего не могут поделать. Нью-Москва становится элегантнейшим центром Европы, а скоро и всего мира.
avatar
Ежели у вас все так круто.
То ГДЕ полноценный автопилот на автомобилях ?
Почему его до сих пор нет?
avatar

теги блога Сбергамот

....все тэги



UPDONW
Новый дизайн