(no subject)
Dec. 29th, 2022 11:51 amСлушаю "Беседы о русской культуре" Лотмана. В одной из лекций он говорит про то, что речь во многом избыточна. В качестве примеров наибольшей избыточности он приводит (по исследованию какого-то венгра) газетную передовицу и девичий разговор на улице. Дальше он объясняет, как собственно измерить избыточность: если можно угадать, какое слово следующее, то оно никакой новой информации не несет. Например, если мы видим в передовице "передовики", то следующее слово "производства".
Ну, здравствуй, GPT и другие языковые модели.
no subject
Date: 2023-01-01 11:29 am (UTC)Я не знаю, как работает GPT, но подозреваю, что они просто подставляют наиболее вероятное следующее слово, с какими-то вариациями (вероятность использования моделью в зависимости от вероятности в корпусе), чтобы не все время один и тот же текст получался.