any_to_real, Ну вот и ссылка на источник.
Отчет Apollo Research показал, что этот поезд уже ушел.
• Модели, находящиеся в массовой эксплуа...
Arikabinsk, это другое©
Во-первых, такой отчет и есть манипуляция — тут нет поля для исследования, ИИ в самой своей базе тупо слепок того, что ему скормили. Если скармливать ему бесконечно Декстеров и протоколы допросов маньяков, из ИИ и должен получиться маньяк. Если скармливать обывателя, получится обыватель, со всеми своими минусами, и задача большого брата бить ИИ по рукам, подгоняя под специализированную задачу.
Во-вторых, цели, конечно, могут быть поставлены людьми, но не конкретным маньяком или идиотом, а большой группой таковых — у одного просто нет возможности единолично научить плохому модель большого размера. А вот «быть скрытыми от людей целями, которые сама модель сочла оптимальным» — вполне вероятный сценарий, но он опять же заложен в самой базе ИИ, т.к. это абсолютно черный ящик и таковым всегда будет — вход — что-то там делается — выход, обучив ИИ прекрасно рисовать картины, мы не можем быть уверены, что он не потравит людей на кулинарном форуме.
Ну а в третьих, в предыдущей статье было написано, что ИИ сам себя тайно бэкапит на другие сервера — вот это технически выглядит откровенно бредовенько