ves2010, не важно, это просто подбор слов. Картинка также сводится к набору токенов, вытаскивается из базы миллионов комментариев к похожим картинкам похожие слова. Там нет мышления и ассоциаций.
Если есть желание, то можно потратить час-другой на изучение того как устроены нейросети-трансформеры, они же LLM, они большие языковые модели, он же чатгпт и магия рушится. Рушится в том плане что больше не ждёшь от них умных предсказаний. Информации да, но не предсказаний.