(no subject)
Dec. 29th, 2022 11:51 amСлушаю "Беседы о русской культуре" Лотмана. В одной из лекций он говорит про то, что речь во многом избыточна. В качестве примеров наибольшей избыточности он приводит (по исследованию какого-то венгра) газетную передовицу и девичий разговор на улице. Дальше он объясняет, как собственно измерить избыточность: если можно угадать, какое слово следующее, то оно никакой новой информации не несет. Например, если мы видим в передовице "передовики", то следующее слово "производства".
Ну, здравствуй, GPT и другие языковые модели.
no subject
Date: 2022-12-29 01:10 pm (UTC)Но то, что речь избыточна — совершенно очевидно. Контекст, борьба с ошибками, туда-сюда...
no subject
Date: 2022-12-29 01:17 pm (UTC)Мне кажется не было такого.
Ну да, шум, плохо слышно. И вообще, речь не для информации - по одной из теорий, изначальное предназначение речи это сплетни, когда группа выросла до такого размера, что человек не успевает увидеть кто кому что сделал. Или успевает, но не все. Хотя это тоже информация в научном смысле слова
no subject
Date: 2023-01-01 11:29 am (UTC)Я не знаю, как работает GPT, но подозреваю, что они просто подставляют наиболее вероятное следующее слово, с какими-то вариациями (вероятность использования моделью в зависимости от вероятности в корпусе), чтобы не все время один и тот же текст получался.