В интересном повороте событий исследователи обнаружили, что крупные языковые модели (LLM) проявляют значительный фаворитизм к определенным именам персонажей, которые варьируются в зависимости от модели и версии. Например, сочетание имен, таких как Елена Васкес и Маркус Чен, в основном связано с результатами модели Claude. Это открытие стало вторичным результатом во время разработки техники дифференциации моделей, известной как CDD, которая в конечном итоге превратилась в обширное исследование этого феномена имен.

Исследование подчеркивает, что эти любимые имена «путешествуют» вместе в так называемых «коррелирующих ансамблях». Они часто встречаются на различных веб-сайтах в ролях, таких как эксперты по вулканам, ведущие подкастов и главные герои триллеров, а также авторы многочисленных академических статей, опубликованных с большой скоростью. Особенно заметно, что исследователи обнаружили третье имя, которое постоянно появляется рядом с первыми двумя, что приводит к увлекательной коллекции случаев, когда разные веб-сайты независимо генерировали контент с участием этой тройки, часто сопутствуемого стоковыми фотографиями, созданными ИИ.

Эти находки поднимают важные вопросы о влиянии языковых моделей на формированиеNarratives и идентичности персонажей в контенте, созданном ИИ. Полное исследование доступно в препринте по ссылке.