Про связь трех современных идей: неавтономность синтаксиса, происхождение сложного от сложного и большие данные

Заметка про связь трех современных идей из трех разных областей: неавтономность синтаксиса (иконичность), происхождение сложного от сложного со своей структурой (или как говорит С. Чебанов, «идеография номотетична») и большие данные как новая парадигма науки.

У лингвистов хомскианского склада (то есть в 1950-1980е) считалось, что синтаксис произволен и независим от семантики. Эта линия мысли идет от позитивизма в его американском, бихевиористском прагматическом варианте: мол, раз мы ничего не знаем про то, как работает мозг, то психологию рассматриваем как черный ящик, а при изучении языка принимаем во внимание только внешную сторону языка, которая является автономной системой. После, с развитием когнитивных наук, выяснилось, что синтаксис иногда все же зависит от семантики (примеры есть, но они сложные и неуклюжие, например, Лакофф на сотне страниц в книге «Женщины, огонь и опасные вещи» обосновывает, что два разных значения слова there связаны именно с этим). Но в упрощенном варианте это идея «иконичности» (iconicity), что символ не всегда произволен, а иногда напоминает обозначаемое. Я люблю афоризм, который сам придумал: символическим ключом иногда можно открыть реальную дверь. Другими словами, стена между предметом и символом не всегда непроницаема. И соссюровское разделение на язык и речь тоже не абсолютно.

На другом уровне это соотношение между правилом и ситуацией. Правила — это синтаксис или грамматика. А ситуация — это конкретная реализация. И тут мы подходим ко второй области, совсем другой, но тоже современной и интересной.

Я знаю об этом из лекций Чебанова, а он использует такие несколько замшелые, антикварные термины, как «идеография» и «номотетика». Эти термины были предложены в конце XIX века философами баденской школы неокантианства, Вильгельмом Виндельбандом и Генрихом Риккертом. Упрощенно я бы сказал, что идеография — это описательные науки, а номотетика — это науки индуктивные, основанные на общих законах. Как сказал известный физик (кажется, Резерфорд): науки делятся на физику и коллекционирование марок. Вот физика в этом смысле это номотетика, а коллекционирование марок — идеография.

Но ближе к концу ХХ века оказалось, что описания тоже имеют свои законы, то есть «идеография номотетична». Структуры, которые даны нам в многообразии, то есть списком, на самом деле тоже имеют некоторые внутренние принципы, а не совсем произвольны. Даже телефонный справочник является литературным произведением (вспомним жанр Вербатум, за который Алексиевич получила нобелевскую премию по литературе). На самом деле еще интереснее — телефонный справочник подчинен распределению Бэнфорда и распределению Ципфа. Но дело не в телефонном справочнике, а в понятии популяции, с которым связано множество парадоксов, поскольку с одной стороны популяция — просто совокупность похожих индивидуумов, с другой стороны все они разные, а популяция имеет свою сущность.

Популяция это «многообразие», и это связано с другой глубокой идеей, что сложное не сводится к простому, а происходит от другого сложного. Точнее, многообразие происходит от другого многообразия, а не от единообразия. В начале ХХ века ученые наивно думали, что возникновение языка или письменности происходило примерно так: сначала было, скажем, четыре слова (вот Н. Я. Марр даже считал, что знает, какие конкретно) или знака, потом они стали сочетаться, их стало скажем двадцать, потом сто, потом тысяча, потом десять тысяч и появился язык. Но на деле такого нет, никаких промежуточных стадий никто никогда не наблюдал. Система появляется сразу и целиком как многообразие. Языки «примитивных» народов зачастую сложнее грамматически, чем у развитых.

Аналогична ситуация с химической эволюцией, абиогенезом и происхождением жизни. Современная наука считает, что жизнь появилась от самовоспроизводящихся молекул РНК. От них уже появились ДНК. Однако, чтобы РНК воспроизводилась, она должна уже быть достаточно длинной, не менее тысячи нуклеотидов, кодирующих соответствующие белки. Вероятность спонтанного зарождения такой сложной молекулы примерно равна нулю. Биологи вроде Е. Кунина прибегают к антропному принципу, чтобы как-то это объяснить (мол, среди миллиардов миров в одном образовлась жизнь, и мы в нем находимся, потому что остальные некому наблюдать — не очень то убедительно). Геном примитивных живых существ не намного проще (а иногда и сложнее), чем у сложных, то есть промежуточных стадий между сложным геномом и простым нет.

Многообразное (сложное) не происходит от простого. Говорят, что становление, истоки сложного не даны нам как феномен, и в этом смысле становление сходно с математическим понятием актуальной бесконечности и ее парадоксами. Но это другая тема.

Ясно, что между двумя этими идеями, к которым пришло человечество в конце ХХ века — «семантика влияет на синтаксис» и «идеография номотетична» (список имеет свой закон) есть много общего. В обоих случаях речь о том, что фактический материал и формальное обобщение фактического материала не вполне независимы друг от друга. Закон природы — это обобщение, и закон синтаксиса — это обобщение определенной фактуры.

И тут уместно упомянуть третью область — искуственный интеллект, большие данные и машинное обучение. Наука со времен Галилея и Ньютона мысленно разбирала сложную систему на простые части, которые можно унести в лабораторию и исследовать по отдельности. Скажем, закон гравитации, задача двух тел — две массы взаимодействуют. К этому сводятся сложные взаимодействия между небесными телами. Аналогично взаимодействие между заряженными частицами, закон Кулона. Но в законе Кулона только два типа зарядов — положительные и отрицательные. А как быть, например, в биологии, где взаимодействовать могут белки (протеины) любые попарно друг с другом, и все по разному, а общее число протеинов — порядка десяти миллионов? Тут только компьютер может каталогизировать, что происходит. Отсюда у биоинформатиков возникла вычислительная наука «протеомика» и другие «-омики» (геномика, метаболомика). В больших данных компьютер ищет корреляции между сложным и сложным и создает, увы, интеллектуально непрозрачную, но работающую модель системы.

В машинном обучении закономерности записываются не в виде формулы, а в виде алгоритма. И это похоже на то, о чем я говорил до того: грань между формальным обобщением и между списком ситуаций стирается. По одной из интерпретаций, до Галилея аристотельянская наука изучала «происшествия» (occurrences), и только после Галилея стала рассматривать их как воспроизводимые «феномены», за которыми стоят свои обобщенные законы. А здесь выясняется, что грань между происшествиями и феноменами не всегда неприницаема. Это, конечно, связано и с еще одной моей любимой темой — причинность vs. синхрония (по Юнгу), но на этом я пока остановлюсь в своих рассуждениях, это будет уже четвертая область.

Ссылки («а где про эти идеи можно почитать подробнее?»)

* Википедия, «Интерфейс между семантикой и синтаксисом». https://en.wikipedia.org/wiki/Syntax%E2%80%93semantics_interface

* Википедия, «Иконичность». https://en.wikipedia.org/wiki/Iconicity

* С. Чебанов «Рефренность мира». Особенно вот это место: https://polit.ru/article/2009/11/26/chebanov/
«Если говорить по очень большому счету, крупнейшими достижениями 20-го века в этом отношении явились, на мой взгляд, два. Первое — когда мы говорим об истории, об эволюции, о чем угодно, то это не происхождение многообразия из однообразия (как это, в общем, мыслилось в 18-м, 19-м и в большой мере в 20-м продолжало мыслиться), а смена многообразий. То есть происхождение из одного многообразия, свойственного одному историческому периоду, других многообразий.

Второе – осознание, обнаружение, выявление того, что у нас есть организованность этого многообразия. Само многообразие оказывается номотетичным. Стало возможным говорить о номотетике многообразия.»

* Вот это замечание Д. Каждана https://blogs.7iskusstv.com/?p=60281
«На самом деле, бесконечность находится не так далеко. Мы, видимо, вылезаем в нее всегда, когда мы пытаемся рассмотреть истоки чего-то… Другими словами, попытка посмотреть в свои истоки, попытка разобраться со своими истоками, разложить их на полочкам, представить как все возникло, ведет нас, оказывается, к невозможному… Когда я говорю слово «бесконечен», я его ставлю в кавычки. Под «бесконечностью» я понимаю вещи, которые не даны нам как явления. Скажем, у Канта — которые не существует внутри пространства и времени. Или, другими словами, к тому, к чему язык описания вещей, которые существуют рядом с нами, не подходит.«

4 комментария для “Про связь трех современных идей: неавтономность синтаксиса, происхождение сложного от сложного и большие данные

  1. Но тут выясняется, что слова «птица» (циппор), «рыба» (даг), «животное» (баъал хайим) в библейском иврите есть, и наша гипотеза, уже почти сводившая сложное к простому, в очередной раз рассыпается.
    __________________________________________
    « И ты прав, сын мой», как сказал ребе в одном анекдоте.
    Но что вкладывал древний человек в эти понятия?
    Так, пишет Леви Строс, «индейцы осэдж и сиу объединяют существа и вещи в три категории, соответственно связанные с небом (солнце, звезда, журавль, небесные тела, ночь, созвездие Плеяд и т.д.), с водой (мидия, черепаха, тростник, туман, рыбы и т.д.) и с твердой землей (медведь, черный и белый, пума, дикобраз, олень, орел и т.д.).
    А «индейцы навахо, считающие себя великими классификаторами, делят живых существ на две категории, исходя из того, наделены ли они речью. К существам, не обладающим речью, относят, как животных, так и растения».
    Устанавливаемые индейцами отношения между терминами основываются чаще всего на смежности, как например «змея и термитник», либо на сходстве — красный муравей и кобра похожи по цвету, как считают индейцы пуэр.
    По мнению Леви-Строса, смежность и подобие играют решающую роль в установлении отношений между разными видами, населяющими землю.
    «… это классификация на уровне чувственных качеств, систематизация на уровне чувственных данных, к чему наука долгое время поворачивалась спиной».
    А теперь возьмите древнееврейский этимологический словарь и увидите, что одноименным корнем древняя мысль обобщала слова по признаку внешнего сходства, аналогии или смежности. Поэтому ничего удивительного в том, что в новом иврите мы видим такие обобщения, как «поезд и вакцина», «бровь и домкрат», «веко и охрана», «мясник и бюджет», «юг и полотенце», » брюки и вход» и т.д. и т.п.

  2. » …сложное не сводится к простому, а происходит от другого сложного. Точнее, многообразие происходит от другого многообразия, а не от единообразия…. Система появляется сразу и целиком как многообразие. Языки «примитивных» народов зачастую сложнее грамматически, чем у развитых»
    _____________________________
    Не знаю, читали ли вы, Михаил, статью («7искусств») СМЫСЛОВАЯ КВАЗИКЛАССИКА НА СТЫКЕ ПРОСТРАНСТВА МЫШЛЕНИЯ С ПРОСТРАНСТВОМ ЯЗЫКА КАК ВСТРЕЧИ КВАНТОВОГО И КЛАССИЧЕСКОГО МИРОВ
    Ее авторы физики теоретики: Владимир Аршинов, Борис Лукьянчук,
    Анатолий Никольский, Владимир Рубанов, Андрей Шелудяков
    Так вот, в ней среди прочего утверждается, что «Не существует внутренних законов эволюции/развития языка отдельно от эволюции человека говорящего как биологического вида, поскольку эволюция живых систем — это «эволюция ниш, образуемых единствами взаимодействий».
    Да, языки примитивных народов сложнее, чем у развитых, никто не спорит. Но тщетно было бы искать у них слова для отвлеченных понятий растения, животного, цвета, звука, пола, вида и т.д. В языке лушей есть 10 слов для муравья, обозначающих, вероятно отдельные разновидности муравьев, 20 слов для корзины, много разных слов для разновидностей оленя, и ни одного слова для понятия «олень» (Леви-Брюль).
    В иврите, например, также: насекомое «саранча» имеет не один синоним, отражающий ее разные свойства, но слова «насекомое» как понятия нет в языке.
    По сути речь идет о двух способах мышления: конкретном, чувственно-образном и понятийном.
    По словам Фрейденберг, это «два метода мировосприятия, исторически различные, имеющие свои датировки».

    1. Не знаю, читали ли вы, Михаил, статью («7искусств») СМЫСЛОВАЯ КВАЗИКЛАССИКА НА СТЫКЕ ПРОСТРАНСТВА МЫШЛЕНИЯ С ПРОСТРАНСТВОМ ЯЗЫКА КАК ВСТРЕЧИ КВАНТОВОГО И КЛАССИЧЕСКОГО МИРОВ

      Не читал. Пожалуй, побоюсь открывать статью с таким мудрёным названием. 🙂

      Но тщетно было бы искать у них слова для отвлеченных понятий растения, животного, цвета, звука, пола, вида и т.д.

      Я не знаю этих языков, но не уверен, что Вы тут правы. Я думаю, что в большинстве языков есть слова для понятий растения, животного, цвета, звука, пола, и т.д.

      В иврите, например, также: насекомое «саранча» имеет не один синоним, отражающий ее разные свойства, но слова «насекомое» как понятия нет в языке.

      Вот это, по-моему, удачная иллюстрация того, о чем я Вам писал вчера в соседней ветке. Во многих случаях свести сложное многообразие, систему элементов, к происхождению от простых источников не удается. Как только уже вроде бы наметилась схема, на основании которой многое удалось упростить и объяснить и свести к более простым деталям, так находится сначала несколько, а потом множество исключений, которые разбивают универсальность гипотезы.

      Вот вы нашли удачный пример: слова «насекомые» в древнееврейском языке нет. И уже почти готовы высказать обобщаюшее суждение: в древнееврейском [якобы] нет обобщаюших понятий, а только названия конкретных живых существ. И у уже почти готовы сделать вывод, что «Всякое слово в основе — троп», и что «Для первобытного сознания один предмет и есть другой». И прочие далеко идушие выводы о становлении чувственно-образного и понятийного мышления.

      Но тут выясняется, что слова «птица» (циппор), «рыба» (даг), «животное» (баъал хайим) в библейском иврите есть, и наша гипотеза, уже почти сводившая сложное к простому, в очередной раз рассыпается.

Добавить комментарий