Современная электронная библиотека ModernLib.Net

Звуки и знаки

ModernLib.Net / Кондратов Александр Михайлович / Звуки и знаки - Чтение (стр. 1)
Автор: Кондратов Александр Михайлович
Жанр:

 

 


Александр Михайлович Кондратов
Звуки и знаки
Издание 2-е, переработанное

      Моей первой учительнице, преподавательнице Каменской базовой школы Зинаиде Анфимовне Данченко эту книгу о языке посвящаю.

Двенадцать лет спустя
(Вместо предисловия)

      В начале шестидесятых годов А. М. Кондратов, тогда начинающий автор и молодой исследователь в области кибернетической лингвистики, опубликовал свои очерки о современном языкознании и его первых контактах с математикой и кибернетикой. В 1966 году издательство «Знание» выпустило его книгу «Звуки и знаки». В нее вошли переработанные очерки, что печатались в журнале «Знание — сила», и новые, написанные специально для этой книги.
      Книга «Звуки и знаки» не залежалась на полках книжных магазинов. Она была переведена на английский, французский, итальянский, эстонский и арабский языки. Ее с интересом читали не только профессионалы-лингвисты, литературоведы, историки и археологи. Эта книга стала популярной и среди представителей точных наук — математиков, кибернетиков, программистов. Вместе с тем «Звуки и знаки» использовались в качестве учебного пособия по курсу языкознания в десятках университетов и педвузов нашей страны, а отрывок из книги попал в «Учебник русского языка» для четвертого класса.
      Конечно, популярность книги во многом определялась ее темой — нашим человеческим языком, неисчерпаемым хранилищем духовных богатств человеческого разума, универсальным средством общения, принадлежащим всем нам, — языком, всю сложность и богатство которого раскрывает лингвистическая наука. Однако основной секрет успеха «Звуков и знаков» состоял в том, что их автор сумел в простой и увлекательной форме профессионально рассказать о тех сложных и подчас загадочных проблемах языка, которые волновали языковедов, математиков и кибернетиков в начале шестидесятых годов.
      Теперь выходит второе издание «Звуков и знаков». Оно сохраняет ту же простоту и увлекательность изложения, сочетающуюся с высоким профессионализмом, Остался в основном неизменным круг тем, о которых она повествует.
      Однако следует иметь в виду, что прошедшее десятилетие стало периодом небывало быстрого развития языкознания. Был, в частности, реализован экспериментальный, а затем промышленный машинный перевод. Начаты работы по созданию искусственного интеллекта. Была раскрыта информационная структура текста. Эти работы показали, что наш язык имеет особое нечетко- логическое построение, принципиально отличное от строго логической структуры математического языка.
      Открытие «размытой» логики естественного языка, которая является более гибкой и в некоторых ситуациях более сильной, чем жесткая логика математики, заставило ученых отказаться от таких романтических проектов, как создание всеобщего языка-посредника или универсального семантического кода, с помощью которых можно было бы описать любую бытовую или научно-техническую ситуацию. Возникли принципиально новые подходы к решению таких научно-технических проблем, как машинный перевод, автоматический информационный поиск, диалог «человек — компьютер».
      Для того, чтобы сделать второе издание книги злободневным, актуальным и полезным для широкого круга читателей, автору нужно было учесть те изменения, которые претерпела в общем ходе научно-технической революции наука о языке. Иными словами, из второго издания «Звуков и знаков» нужно было убрать устаревшие и поэтому малополезные знания и включить в него те новые знания, которые необходимы не только в сегодняшней практике, но и для правильного прогнозирования развития науки о языке, кибернетики, информатики и других смежных дисциплин. Автор успешно справился с этой задачей, принципиально обновив теоретическую основу своей книги.
      Вот несколько примеров. Двенадцать лет назад лингвисты-структуралисты, моделируя язык, с гордостью заявляли, что они умеют совершенно формально описать не только звуковой и грамматический строй языка, но и его словарный состав. Значение же их не интересовало — разве можно в формулах и числах выразить неуловимый и многозначный смысл слов и фраз? Если же говорить о современном языкознании, то один из его главных девизов — это «штурм значения».
      Анализом значения занимаются в наши дни самые различные дисциплины, родившиеся на стыке науки о языке с другими областями знания: инженерная лингвистика и теория информации, семиотика и психолингвистика, структурная семантика и теория нечетких множеств, информатика и теория порождающих грамматик. Эта современная стратегия языкознания отражена в новом очерке «В поисках значения», включенном во второе издание книги. Он рассказывает о том, как современная наука пытается описать неуловимое значение с помощью теории нечетких множеств и вероятности ной логики, толерантных пространств и статистики, психологических ассоциаций и методики «измерения значений». По существу же, этим поискам значения посвящены и все остальные очерки «Звуков и знаков».
      Звуки речи, «атомы языка» — фонемы служат нам для различения смысла слов. И методика описания, созданная фонологией, начинает применяться в других областях языкознания, имеющих дело с грамматикой и смыслом, значениями слов (очерк «Формулы фонемы»). Не решив проблемы значения, невозможно развивать машинный перевод и создавать достаточно эффективные информационные языки (очерк «МП, ЯП, ИЯ»). Поискам значения все чаще уделяет внимание инженерная лингвистика, опирающаяся на статистическое описание языка (очерк «Жар холодных числ»). Язык как уникальный нежесткий «код», служащий для передачи смысла, изучает теория информации (очерк «Наш удивительный код»). Именно значение позволяет человеческому языку быть не только средством передачи информации об окружающем мире, но и своеобразным средством моделирования этого мира (очерк «Модель мира»).
      Первое издание «Звуков и знаков» завершалось очерком «Лингвистика космоса». В начале шестидесятых годов, после первых космических полетов, человечество крайне оптимистично смотрело на возможность скорого общения с нашими звездными «братьями по разуму». Создавались даже специальные языки для подобного разговора, например линкос…
      В наши дни, как считают крупные специалисты по космической радиосвязи, шансы человечества вступить в разговор с разумными инопланетянами весьма и весьма скромны. Вот почему второе издание книги завершается иным очерком, названным «Черный ящик». Этим термином кибернетики и психологи называют систему, устройство которой неизвестно, и мы можем судить о нем лишь по поведению этой системы.
      Именно таким «черным ящиком» является человеческий мозг, который представляет собой самую сложную систему из всех, что нам известны во Вселенной. И система эта пользуется языком: сложным и вместе с тем доступным каждому человеку, произвольным и тем не менее осмысленным, нечетким и одновременно точным, универсальным и в то же самое время различным у отдельных племен и народов.
      Ни одно из тех разнообразнейших средств связи, которые существуют в человеческом обществе, не может сравниться с нашим обычным языком, всеобщим богатством и достоянием. Это — подлинное чудо, принадлежащее людям, независимо от их нации, расы, образования и возраста. С помощью языка происходит превращение младенца из простого биологического существа в социального индивидуума — Человека.
      Шаг за шагом раскрывает наука тайны языка. И чем больше мы их узнаем, тем больше растет наше восхищение перед этим языком. Он поистине неисчерпаем, как неисчерпаемы чудеса мира, который нас окружает и который мы не можем познать без помощи того же языка.
      профессор Р. Г. Пиотровский,
      руководитель лаборатории инженерной лингвистики
      Ленинградского педагогического института
      им. А. И. Герцена

ЖАР ХОЛОДНЫХ ЧИСЛ…

      «Числа не управляют миром, но показывают, как управляется мир», — писал великий поэт и мыслитель Гёте. В нашем веке числа начинают служить не только инженерам и физикам, но и психологам! социологам, биологам. Счет и число пришли и в науку о языке. Вот почему наш первый очерк получил название
      ЖАР ХОЛОДНЫХ ЧИСЛ…

О чем говорит семиотика?

      «Симпозиум по структурному изучению знаковых систем» — название довольно-таки сухое. Симпозиум этот состоялся в Москве в декабре 1962 года. И всякому, кто посетил бы это собрание ученых или просто прочитал тезисы докладов, представленных на нем, стало бы ясно, что за академически официальным наименованием скрываются вопросы, затрагивающие самые различные аспекты жизни человеческого общества.
      На симпозиуме читались доклады о числовом языке-посреднике и о структуре литовской народной баллады; о гадании на игральных картах как особой знаковой системе и о языковых контактах; об алгоритмах дешифровки и о пространственно-временном единстве живописного произведения; о возможностях построения структурной поэтики и о знаках рекламы, выкриках разносчиков товаров и газет; об анализе абхазских народных игр и о транскрипции санскрита китайскими иероглифами; о функциях сложносокращенных слов и о культовом поведении в тантризме, одной из самых сложных и эзотерических, закрытых для непосвященных, систем йоги; о «тайных языках», включая воровские жаргоны, и о регулировании уличного движения как специфической системе знаков…
      Один из крупнейших советских ученых не без юмора заметил, что симпозиуму недостает лишь двух докладов: первый — о моде как системе знаков, второй — о самом симпозиуме как знаковой системе. Но в словах его была не только ирония — в них содержалось и предсказание будущего.
      Подавляющее число участников симпозиума, включая автора этих строк, в ту пору были совсем еще молодыми исследователями. Им казалось, что с помощью семиотики, то есть теории знаков, можно быстро и окончательно решить проблемы, над которыми вот уже сколько веков бьется человечество. Это была неизбежная дань юношескому азарту, заставляющему штурмовать «с налета» неприступные твердыни науки.
      Но, с другой стороны, благодаря симпозиуму — первому научному совещанию по семиотике не только в нашей стране, но и во всем мире — развитию этой науки был дан мощный толчок. Были проведены международные конгрессы по теории знаков в Варшаве. В Советском Союзе начались интересные и обстоятельные исследования знаковых систем. Участие в них приняли видные советские философы, логики, языковеды, математики. Да и сами участники симпозиума, в ту пору еще начинающие исследователи, за истекшие полтора десятка лет превратились в ученых с мировым именем. Достаточно назвать докторов. филологических наук И. И. Ревзина, Б. А. Успенского, А. А. Зализняка, М. В. Софронова и Вяч. В. Иванова, главного инициатора симпозиума по семиотике в Москве.
      Теорией знаков в наши дни занимаются специалисты в самых различных областях знания. Более того, на стыке семиотики и других наук возникли самостоятельные области исследования. Назовем, например, биосемиотику, изучающую сигнализацию в животном мире с позиций теории знаков; этносемиотику, исследующую знаковые системы человеческого общества, «смысл и роль которых самими членами общества не сознается»; абстрактную семиотику, родившуюся на стыке математики, логики и теории знаков; кибернетическую семиотику, рассматривающую человеческий мозг как «черный ящик», производящий операции со знаками. В Советском Союзе за последнее десятилетие вышли замечательные работы, посвященные семиотическому анализу искусства, будь то пословицы или живописные произведения, поэтическое творчество или «язык кино». Вопросы лингвистической семиотики освещались в монографиях профессоров Ю. С. Степанова, В. М. Солнцева, Ю. В. Рождественского, А. Г. Волкова, И. И. Ревзина и в работах многих других советских исследователей.
      «О чем говорит семиотика» — так назывался очерк, открывавший первое издание «Звуков и знаков». Вы, вероятно, и сами догадались, почему такого очерка во втором издании книги нет. Рассказ о семиотике наших дней, о ее достижениях, проблемах, перспективах потребовал бы большой книги. Будем надеяться, что такая книга появится, ибо интерес к семиотике с каждым годом возрастает. А в этой книге, посвященной не семиотике, а лингвистике, мы коснемся лишь одного частного, но крайне важного для нас вопроса: что такое язык с точки зрения теории знаков? Что отличает его от других знаковых систем людей — таких, как жесты, этикет, дорожная сигнализация или языки программирования кибернетических машин?
      Наш язык совершенно справедливо называют самой полной, уникальной и незаменимой системой связи. «Другие, искусственно созданные человеком системы и языки (например, письмо, сигнализация флажками, азбука Морзе, азбука Брайля для слепых, искусственные языки типа эсперанто или волапюк, информационно-логические языки и др.) воплощают лишь некоторые из свойств естественного языка, — пишет профессор Ю. С. Степанов. — Эти системы могут значительно усиливать язык и превосходить его в каком-либо одном или нескольких отношениях, но одновременно уступать ему в других, точно так же, как телефон, телевидение, радио (вообще всякое орудие, всякий инструмент) усиливают некоторые свойства отдельных органов человека».
      Почему же наш язык, такой, казалось бы, обычный и привычный, является одновременно и самой полной, и самой совершенной, и самой богатой, и самой экономной системой знаков изо всех, что мы знаем в человеческом обществе и в сообществах животных?
      Потому, отвечает семиотика, что он иерархичен. У всех остальных знаков есть выражение и содержание, означающее и означаемое. Язык же устроен гораздо сложней.
      Поясним на таком примере. Знак немыслим без системы знаков. Однако один и тот же символ «!» может иметь пять совершенно различных значений. Для школьника это, вне всякого сомнения, восклицательный знак. Для шахматиста — обозначение сильного хода. Для математика— факториал. Для водителя-знак «Осторожно!». А для лингвиста — условное обозначение характерного щелкающего звука, который имеется в некоторых языках Южной Африки!
      Но во всех этих случаях знак соотнесен с каким-либо понятием, звуком, нормами пунктуации. Короче говоря, это знаки, имеющие значение, заданное системой знаков… А в нашем человеческом языке?
      Строго говоря, в языке знаки — это только слова. Звуки и буквы, очевидно, никакого значения не имеют. Это не знаки, а только составные части, своего рода кирпичики, или, как говорят в семиотике, фигуры, из которых строится знак.
      Мы сказали выше, что знаками в нашем языке могут быть названы только слова (хотя есть точка зрения, что и слова — это не знаки, а лишь элементы знаковой системы, человеческого языка). Слова сочетаются в предложения, число которых практически бесконечно. Предложения, в свою очередь, являются элементами, из которых строится наша речь. Таким образом, перед нами иерархическая лестница: звук — корень слова или служебная частица — слово — предложение — речь или письменный текст. Причем во многих случаях один и тот же элемент языка может выступать в этой иерархии на разных уровнях.
      Приведем классический пример. Два римлянина заспорили, кто скажет самую короткую речь или напишет самую короткую фразу.
      — Eo rus (еду в деревню), — таков был текст первого.
      — I, — отвечал второй (в переводе с латыни значит: езжай!).
      Рассмотрим это, действительно, предельно краткое высказывание. Во-первых, оно и в самом деле высказывание, текст, речь. Состоит этот текст из одного предложения. Предложение, в свою очередь, состоит из одного слова. Слово — из одного корня. Наконец, и корень выражен с помощью одного звука или же передающей этот звук на письме буквы. Мы имеем здесь и фонетику, и морфологию, и лексику, и синтаксис! И все это — в одном значке, вертикальной палочке «I», передающей звучание «и».
      Число звуков речи в любом языке мира меньше сотни. Даже в самом бедном словами языке число слов равно нескольким тысячам. Число предложений, которые можно построить, пользуясь словами, достигает астрономических величин. Число различных текстов, которые можно записать с помощью предложений, практически бесконечно. «Таким образом, язык организован так, что с помощью горстки фигур и благодаря их все новым и новым расположениям может быть построен легион знаков, — пишет датский ученый Луи Ельмслев, перекинувший мост между лингвистикой, наукой о языке, и семиотикой, наукой о знаках. — По своей цели языки прежде всего знаковые системы, но по своей внутренней структуре они прежде всего иное, а именно — системы фигур, которые могут быть использованы для построения знаков».
      Благодаря этому свойству языка мы получаем возможность в любое время высказать любую мысль, любое чувство, любую фантазию или причуду. С помощью горстки фигур строится все бесконечное многообразие и богатство языка, подобно тому, как с помощью горстки химических элементов строится тот удивительный мир, в котором мы живем.

Структуры и числа

      Анализ языка с позиций семиотики, по сути дела, открыл науке язык как таковой. До того времени лингвисты интересовались не языком как таковым, не системой знаков и составляющих эти знаки фигур, а речью, текстами, порожденными системой. Наиболее четко это выразил основоположник современной структурной лингвистики Фердинанд де Соссюр.
      «Единственным и истинным объектом лингвистики является язык, рассматриваемый в самом себе и для себя», — такими словами завершал свой знаменитый «Курс общей лингвистики» Соссюр. Не следует думать, что это было открытым провозглашением формализма, принципиальным отказом понимать общественные функции языка и т. д. Напротив, сам Соссюр считается создателем так называемой социологической школы в языкознании, исходящей из того, что наш язык — продукт общественный, и понять его невозможно без связи с другими общественными науками и явлениями. Но есть, так сказать, лингвистика внутренняя и лингвистика внешняя, лингвистика языка и лингвистика речи.
      «Наше определение языка предполагает устранение из понятия «язык» всего того, что чуждо его организму, его системе, — одним словом, всего того, что известно под названием «внешней лингвистики», хотя эта лингвистика и занимается очень важными предметами и хотя именно ее главным образом имеют в виду, когда приступают к изучению речевой деятельности, — писал Соссюр. — Язык есть система, которая подчиняется лишь собственному порядку. Уяснению этого может помочь сравнение с игрой в шахматы, где довольно легко отличить, что является внешним, что внутренним. То, что игра пришла в Европу из Персии, есть факт внешнего порядка; напротив, внутренним является все то, что касается системы и правил игры. Если я фигуры из дерева заменю фигурами из слоновой кости, то такая замена будет безразлична для системы; но если я уменьшу или увеличу количество фигур, такая перемена глубоко затронет «грамматику» игры».
      Продолжая аналогию Соссюра, мы можем заметить, что фигуры вообще могут отсутствовать: вспомним об игре опытных шахматистов вслепую, не глядя на доску, не притрагиваясь к шахматам. Если правила игры в шахматы являются системой, языком, то любая партия, которую мы станем играть, будет текстом, порожденным этой системою, «речью».
      Число шахматных фигур невелико, так же как и число полей доски и число правил, которым подчиняется игра в шахматы. А вот число различных партий в шахматы настолько велико, что его можно считать бесконечным. Так и с помощью языка, состоящего из конечного числа элементов и грамматических правил, можно образовывать любое число фраз и текстов.
      Язык и речь, система и текст — их взаимоотношение интересует не только лингвистику, но и семиотику. Методы теории знаков применяются ныне в фольклористике и литературоведении, в теории музыки и театра, искусствоведении, этнографии, поэтике, инженерной и социальной психологии. И везде мы имеем дело с ситуацией язык — речь, система — текст,будь то «язык» жестов или «текст» человеческого поведения.
      Более того, в естественных науках, вроде этологии, изучающей поведение животных, или генетики, исследующей механизм наследственности, мы также сталкиваемся с проблемой система — текст.Наконец и в технических дисциплинах, например в машиностроении или электронике, стоят сходные вопросы: построение из системы — конечного числа деталей или полупроводников— неисчерпаемого количества «текстов» машин, транзисторов и т. п.
      Современную структурную лингвистику сравнивают иногда с лоцманом для целого ряда общественных и естественных наук. Именно она первой осознала знаковый характер языка и отличие его от речи. Систему языка структурные лингвисты стараются описать в строгих терминах математической логики и семиотики. Естественно, что тексты описаны так быть не могут. Ведь число их практически бесконечно!
      Здесь вместо формул и символов нужны иные методы — и в первую очередь математической статистики, тот «жар холодных числ», о котором писал Блок в своих «Скифах», позволяющий, казалось бы, сухим колонкам цифр превращаться в яркие картины, показывающие скрытые механизмы языка, порождающего речь. Самое же ценное в этом знании — это то, что оно начинает в наши дни все чаще оказывать помощь людям в их практике, в повседневной жизни. Например, в обучении языку.

Числа, учебники и ЭВМ

      Ни для кого не является секретом, что есть учебники хорошие и есть плохие. Опытный педагог порекомендует вам такой-то учебник, а такой-то брать отсоветует… Но на каком основании? На основании опыта, интуиции, наконец, своих взглядов. Но взгляды, как известно, бывают разные. Вот если бы можно было вычислять степень эффективности того или иного учебника! Тогда вместо споров о его достоинствах и недостатках можно было оперировать точными числами.
      На первый взгляд все это кажется фантастикой. Однако первые попытки в этом направлении уже делаются. Не так давно в Минске с помощью ЭВМ сравнивалась эффективность учебников иностранных языков, и эта разработка белорусских ученых была удостоена серебряной медали ВДНХ… Вот вам и фантастика!
      В основе знания языка — знание слов. Но сколько именно этих слов нужно дать в одном уроке учебника? И сколько слов вообще должен содержать словарный минимум? Чтобы новые слова усвоились, они должны встречаться и далее в учебнике, это очевидно. Но каким должен быть интервал между повторениями одного и того же слова?
      Долгое время все эти вопросы решались на глазок, у одного педагога своя точка зрения, у второго — своя, третий считает ошибочными обе эти точки зрения и предлагает свою собственную. В наши дни союз педагогов, лингвистов, психологов, программистов и ЭВМ позволяет решать подобного рода вопросы с помощью точных чисел. Например, установлено, что темп введения новых слов не должен превосходить пяти процентов от всех слов, что встречаются в учебном тексте данного урока. А текст, содержащий 3,6 процента новых слов, оптимален — и прежние слова хорошо повторяются, и новые лучше всего усваиваются.
      Чем большее число раз встретилось слово в уроке и во всем учебнике, чем более равномерно распределено оно по всему учебнику, тем учебник лучше. Интуитивно мы все понимаем это. Но как доказать интуицию числами? Попробуйте-ка произвести нужные подсчеты — и вы убедитесь, что без вычислительной машины тут никак не обойтись. Нужно подсчитать, сколько раз встретилось то или иное слово в каждом уроке и в упражнениях, сопровождающих урок. Нужно высчитать средние арифметические и средние квадрэтические отклонения для каждого слова по каждому уроку, затем суммировать данные по всему учебнику.
      В одном учебнике ряд слов будет иметь лучшие показатели, чем те же показатели в другом. С другой стороны, в «худшем» учебнике будут и слова, и целые уроки с лучшими показателями, чем в первом. Параметров же, по которым вычисляем мы все эти показатели, у нас несколько. Значит, нужно еще вычислять по формулам значимость того или иного параметра… Словом, без ЭВМ во всей этой бухгалтерии не обойтись.
      Вот такие подсчеты и провели белорусские исследователи, поручив ЭВМ сравнивать эффективность учебников. Разумеется, это только начало кибернетизации педагогики (ведь дело не только в количественных данных лексики, но и в ее качестве, да и не только в лексике). Трудно дать сразу ответы на все вопросы, над которыми бьется педагогика вот уже столько веков.
      Еще одним конкретным примером союза лингвистики, математики, педагогики и ЭВМ являются работы, проводимые во многих странах мира и связанные со словами и числами.

Сколько нужно слов?

      В любом языке мира насчитываются тысячи, десятки тысяч, а то и сотни тысяч различных слов, как, например, в русском, английском, немецком, французском и других, имеющих давнюю- письменную традицию. Все слова не знает даже носитель языка (вряд ли кто из русских знает значение тех четырехсот сорока тысяч слов, что собраны в академической картотеке Института русского языка).
      Значит, изучая иностранный язык, мы должны заучить не все, а самые нужные, самые важные слова. Именно их должен включать словарь-минимум, что обязательно прилагается почти к каждому учебнику языка. Но тут возникает вопрос: сколько же слов должно быть в этом словаре-минимуме?
      Одни специалисты полагают, что для чтения учебного текста достаточно и семисот пятидесяти слов, а при запасе в две с половиной тысячи можно читать простой неадаптированный текст с помощью словаря. Другие называют тысячу восемьсот — стольких слов, по их мнению, достаточно, чтобы понимать речь на чужом языке и вести на нем повседневное общение.
      Шестая Международная ассоциация преподавателей современных языков рекомендует тысячу пятьсот — три тысячи слов на шесть лет обучения. Нашей программой для языковых вузов и факультетов иностранных языков установлен минимум в пять тысяч слов, причем на первом курсе должно быть усвоено восемьсот слов. Программа для неязыковых вузов рекомендует на два года обучения минимум в две с половиной тысячи слов, из них тысячу двести — для активного усвоения.
      Согласимся с программой для вузов. Однако тут встает очередной вопрос: а какие именно слова нужно включать в словарь-минимум? Понятно, что самые важные, самые употребительные. Предлоги, местоимения, союзы… Правда, их не так-то уж и много в любом языке, А дальше? Какие глаголы, прилагательные, существа тельные нужно знать наизусть, а какими можно и не обременять свою память?
      Казалось бы, словари-минимумы в учебниках должны совпадать. Если не полностью, то хотя бы на три четверти, хотя бы наполовину… Когда же специалисты сравнили шестнадцать разных учебников французского языка для американских школ, то обнаружили, что общими для них является примерно два процента слов! В учебниках насчитывалось в общей сложности шесть тысяч разных слов. И только сто тридцать четыре из них входили во все словари-минимумы!
      Представим, что два американца, изучив французский по разным учебникам, попробуют общаться друг с другом на этом языке. Вряд ли они поймут друг друга: ведь общими у них будет менее полутораста слов.
      Ту же печальную картину показал анализ и других словарей-минимумов. Десять учебников испанского языка содержали четыре с половиной тысячи слов, общими же было двести сорок девять. А в двадцати шести учебниках того же испанского языка было обнаружено тринадцать тысяч слов. Хороший же словарь-минимум для тех, кто изучает испанский язык! Требовать от новичков, изучающих иностранный язык, знания всех этих слов нелепо и бессмысленно, не всякий переводчик-профессионал их знает.
      Какие же слова считать употребительными, а какие нет? Ответ на этот вопрос дает статистика, так называемые частотные словари.

Частоты и слова

      Чем чаще встречается в текстах слово, тем оно употребительнее, или, говоря языком математики, имеет большую частоту. Но как избежать слов, характерных только для данного текста, а в других почти не встречающихся? Самый лучший путь — брать не один источник, а несколько. А затем, подсчитав, сколько раз встречаются в этих книгах различные слова, сравнить результаты. Если они совпадают, то слово действительно является частым (или редким). Если не совпадают, то, значит, в одном из текстов оно было завышено из-за сюжета или пристрастия автора к этому слову.
      Так, весьма частое для «Капитанской дочки» слово крепость,встретилось всего лишь в четырнадцати источниках из ста тридцати трех. Значит, слово это отнюдь не частое и занимает скромное место в списке самых употребительных слов русского языка. А составляй мы список лишь по «Капитанской дочке», то оно вошло бы едва ли не в первую двадцатку самых ходовых слов нашего языка!
      В «Истории Пугачева» оно встречается еще чаще — сто тридцать четыре раза (ведь там речь то и дело идет о крепостях, взятых Пугачевым). В «Путешествии в Арзрум» оно встречается шестнадцать раз. Зато во всех художественных произведениях (кроме «Капитанской дочки») Пушкин употребил слово крепостьвсего один раз (в «Дубровском») и два раза в стихотворениях и поэмах.
      Но не только количество разных текстов может гарантировать наши подсчеты от случайности. Не менее важно взять большой объем этих текстов. И чем он больше, тем вернее мы гарантированы, что никакие случайные факторы не повлияют на точность наших подсчетов.
      Подсчеты частот слов производились давно: еще в средние века составлялись индексы к религиозным текстам, в которых указывалось, сколько и где упоминаются слова бог, ангели т. д. Но только на пороге нашего века появляется серьезная потребность в частотных словарях. Первым таким словарем считается словарь немецкого языка, выпущенный в Берлине в 1897–1898 годах. Его составитель Ф. Кединг обработал колоссальный материал в одиннадцать миллионов слов!
      Вслед за тем приходит черед частотных словарей английского языка. В Лондоне в 1904 году священник Дж. Ноулз составляет список из слов, которые встретились более двадцати пяти раз в текстах, объемом в сто тысяч слов.
      Американец Р. Элдридж, управляющий небольшой фабрикой, где в основном работали иммигранты, за два года расписал на карточки двести пятьдесят статей из газет, составивших около пятидесяти тысяч слов, и подсчитал частоты этих слов.
      Первоначально, как говорил Элдридж в предисловии к своему словарю, выпущенному в 1911 году, его целью было выявить минимум слов, который помог бы рабочим-иностранцам быстро овладеть разговорной речью. Но затем, продолжает Элдридж, он понял, что частотные словари могут принести и более существенную пользу, в том числе оказать помощь в реформе английской орфографии, которую справедливо называют «чудовищной».

  • Страницы:
    1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14