ПЕРЕВОДЧИК В СФЕРЕ ПРОФЕССИОНАЛЬНОЙ КОММУНИКАЦИИ
Информация для поступающих

(8422)778-145
(8422)778-345
(8422)778-372

Прикладная Лингвистика > Соснина Екатерина Петровна > О проблеме определения границ предметной области компьютерной лингвистики


О проблеме определения границ предметной области компьютерной лингвистики

Е.П.Соснина

Проблема определения границ предметной области какого-либо научного направления в первую очередь актуальна при решении терминологических и терминографических задач, в том числе в задачах инвентаризации терминов [1], а также при преподавании соответствующих дисциплин.

Определение границ предметной области такого научного направления как «Компьютерная лингвистика» является одной из самых сложных, на наш взгляд, задач. Обычно границы предметной области устанавливаются путем составления перечня образующих ее рубрик и подрубрик (направлений) [2].

Основная сложность в данном случае заключается в том, что компьютерная лингвистика сравнительно молодая наука, зародившаяся в конце 20 века. Данное направление стало активно разрабатываться за рубежом в 60-70 гг., и под ним в первую очередь понималось использование статических методов в языкознании, отсюда и название «Computational Linguistics» (т.е. «Вычислительная лингвистика»). В России родственный термин «Математическая лингвистика» получил распространение в 70-х годах. В связи с развитием компьютерных технологий и их активным приложениям в лингвистических задачах, этот термин как название науки трансформировался, и наука получила более четкое определение «Компьютерная лингвистика». Таким образом, можно сказать, что существует два подхода в определении направлений, рассматриваемых под этим термином – это наш российский подход и зарубежный.

Что касается взгляда зарубежных языковедов на предметную область компьютерной лингвистики, можно отметить, что большую организационную и научную работу проводит Ассоциация компьютерной лингвистики, которая имеет региональные структуры в нескольких странах мира [6]. На официальном сайте этой организации дается общее определение - «computational linguistics is the scientific study of language from a computational perspective. Computational linguists are interested in providing computational models of various kinds of linguistic phenomena». Эта организация проводит международные конференции по компьютерной лингвистике COLING. В США ежеквартально выходит журнал «Computational Linguistics». Соответствующая проблематика обычно бывает также широко представлена также на различных конференциях по искусственному интеллекту.

С точки зрения западного подхода основным направлением компьютерной лингвистики является Natural Language Processing (Автоматическая обработка естественного языка и речи). При анализе документов (архивов конференций, содержания базовых сайтов) Ассоциации Компьютерной лингвистики COLING было отмечено, что западные лингвисты включают следующие прикладные направления в область компьютерной лингвистики:

  • Computational Morphology and Syntax (Компьютерная морфология и синтаксис).
  • NLP (Автоматическая обработка языка и речи).
  • Digital Libraries (Электронные библиотеки).
  • Information Extraction (Извлечение информации).
  • Information Retrieval (Информационный поиск).
  • Knowledge Representation and Semantics (Представление знаний и семантика).
  • Machine Translation (Машинный перевод).
  • Speech Processing (Распознавание и синтез речи).
  • Statistical Language Processing (Статистическая обработка языка).
  • Summarization (Реферирование и аннотирование).

С точки зрения российского восприятия рассматриваемой проблемной области, то основную работу в этом направлении проводит российская ассоциация компьютерной лингвистики КОЛИНТ [7], на сайте которой можно ознакомиться со всеми научными докладами, представленными на конференции по проблемам компьютерной лингвистики. Хотя на этом сайте не представлено рубрикации проблемных задач, можно заметить, что российские лингвисты приоритетно выделяют такие направления как:

  • Машинный перевод;
  • Системы поиска и классификации;
  • Компьютерная лексикография;
  • Лингвистическая компьютерная семантика;
  • Корпусная лингвистика;

Формальные модели анализа и распознавания языковых структур.

Анализ существующих учебных пособий и справочников [1,3, 5] пока не дает полной и четкой картины об этом практическом направлении языкознания.

Большой энциклопедический словарь: Языкознание [5] под редакцией Ярцевой В.Н. вообще не включает этот термин в словник.

Известный российский лингвист Марчук Ю.Н. в первую очередь определяет компьютерную лингвистику как «лингвистические основы информатики», что собственно предполагает решение задач, связанных с разработкой и использованием искусственных языков, обеспечивающих общение человека с компьютером. Но одновременно в своей работе «Основы компьютерной лингвистики» [3] Марчук Ю.Н. последовательно рассматривает компьютерное моделирование естественного языка, а именно, морфологии, синтаксиса, представление семантики и прагматики в компьютерных средах. Кроме того, в работе упоминаются такие прикладные задачи как организация машинных словарей, банков терминологических данных, и даже рассматриваются основы терминологии.

По мнению российского языковеда, профессора МГУ Баранова А.Н. под термином «Компьютерная лингвистика» понимается широкая область использования компьютерных инструментов - программ, компьютерных технологий организации и обработки данных – для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также сфера применения компьютерных моделей языка в не только лингвистике, но и в смежных с ней дисциплинах». В своей работе [1] Баранов А.Н. выделяет некоторые направления компьютерной лингвистики как базовые – это моделирование общения, моделирование структуры сюжета, гипертекстовые технологии представления текста, компьютерную лексикографию, машинный перевод, системы обработки естественного языка.

Проблема определения границ предметной области также стоит перед разработчиками программ учебных дисциплин в области прикладной и компьютерной лингвистики. Для этих целей были проанализированы учебные программы по компьютерной лингвистике таких российских университетов, как Московский Государственный Университет, Московский Государственный Лингвистический Университет, Российский Государственный Университет.

Разработчики программы курса МГЛУ основное внимание уделяют компьютерному моделированию естественного языка в решении задач искусственного интеллекта, фундаментальным принципам моделирования языка, т.е. направлениям, которые связаны с моделированием общения человека и компьютера.

Разработчики программы курса в МГУ выделяют такие задачи и направления, как проблемы лингвистического обеспечения современных автоматизированных информационных систем, автоматическую обработку естественного языка, создание словарных и текстовых процессоров.

Основными направлениями, рассматриваемыми в курсе компьютерной лингвистики в РГУ являются: информационный поиск, машинный перевод, терминология, терминоведение, терминография, компьютерная лексикография, распознавание и синтез речи, проблемы обучения языку с помощью компьютера. Программа этого университета наиболее близка программе Ульяновского государственного технического университета.

Приведенный анализ показывает, что на практике часто к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании, в связи с чем и происходит путаница задач с практическими решениями. Таким образом, при определении границ предметной области компьютерной лингвистики необходимо более четко разграничивать 2 точки зрения:

1. АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ЯЗЫКА (Language Processing), что будет включать задачи анализа и моделирования языковой структуры, а именно:

  • графематический/фонематический анализ языка;
  • морфологический анализ;
  • лексико-грамматический анализ языка;
  • синтаксический анализ, или парсинг;
  • анализ и моделирование семантической структуры;
  • задача синтеза языковых элементов, в т.ч. генерация текстов;
  • автоматическая лингвостатистика.

    2. ПРИКЛАДНЫЕ НАПРАВЛЕНИЯ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ, а именно:

  • машинный перевод;
  • распознавание и синтез речи;
  • разработка и использование искусственных языков, в том числе языков программирования, языков информационных систем;
  • компьютерная лексикография и терминография;
  • лингвистические основы информационного поиска;
  • автоматическое индексирование, реферирование и классификация текстов;
  • автоматический контент-анализ и авторизация текстов;
  • гипертекстовые технологии представления текста;
  • корпусная лингвистика;
  • компьютерная лингводидактика.

    Данное разграничение не претендует на полноту, но дает более определенную картину о предметной области этой комплексной науки, и может использоваться как база для разработки терминологического словаря или рабочей программы курса «Компьютерная лингвистика».

    ЛИТЕРАТУРА

    1. Баранов А.Н. Введение в прикладную лингвистику. – М.: Эдиториал УРСС, 2001. – 360 с.
    2. Гринев С.В. Введение в терминологическую лексикографию. – М.,1986.–106с.
    3. Марчук Ю.Н. Основы компьютерной лингвистики: Учебное пособие. – М., 1999. – 225 с.
    4. Соснина Е.П. Введение в прикладную лингвистику: Учебное пособие. – Ульяновск: УлГТУ, 2000. – 46 с.
    5. Ярцева В.Н. Языкознание. Большой энциклопедический словарь. – 2-е изд. – Я41 М.: Большая Российская энциклопедия, 1998. – 685 с.
    6. http://www.aclweb.org
    7. http://www.dialog-21.ru
    Вы нашли ошибку
    Если Вы:
    - нашли грамматическую ошибку;
    - спам, рекламу;
    - увидели дублирующися текст;
    Выделите этот фрагмент текста, и нажмите клавиши Ctrl + Enter. Данное выделение будет отправлено нам на исправление.