gianthare: (Default)
[personal profile] gianthare

Слушаю "Беседы о русской культуре" Лотмана. В одной из лекций он говорит про то, что речь во многом избыточна. В качестве примеров наибольшей избыточности он приводит (по исследованию какого-то венгра) газетную передовицу и девичий разговор на улице. Дальше он объясняет, как собственно измерить избыточность: если можно угадать, какое слово следующее, то оно никакой новой информации не несет. Например, если мы видим в передовице "передовики", то следующее слово "производства".
Ну, здравствуй, GPT и другие языковые модели.

Date: 2022-12-29 01:10 pm (UTC)
From: [identity profile] mopexod.livejournal.com
Ну почему же, может и 'передовики животноводства'.
Но то, что речь избыточна — совершенно очевидно. Контекст, борьба с ошибками, туда-сюда...

Date: 2022-12-29 01:17 pm (UTC)
From: [identity profile] gianthare.livejournal.com

Мне кажется не было такого.
Ну да, шум, плохо слышно. И вообще, речь не для информации - по одной из теорий, изначальное предназначение речи это сплетни, когда группа выросла до такого размера, что человек не успевает увидеть кто кому что сделал. Или успевает, но не все. Хотя это тоже информация в научном смысле слова

Date: 2023-01-01 11:29 am (UTC)
From: [identity profile] green-fr.livejournal.com
Речь не только для информации, но и для информации тоже. Собственно, это же одно из определений информации — количество возможных вариантов для следующего слова / сигнала. Слово "производства" несёт в этом смысле мало информации, оно почти что преопределено словом "передовики".
Я не знаю, как работает GPT, но подозреваю, что они просто подставляют наиболее вероятное следующее слово, с какими-то вариациями (вероятность использования моделью в зависимости от вероятности в корпусе), чтобы не все время один и тот же текст получался.

Profile

gianthare: (Default)
gianthare

February 2026

S M T W T F S
1234567
891011121314
15161718192021
222324 25 262728

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 6th, 2026 04:27 pm
Powered by Dreamwidth Studios