Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Вопрос 37. Лингвистические аспекты искусственного интеллекта. Текстовые процессоры



История науки имеет дело не только с достижениями, добытыми средствами всей совокупности наук, но и с такими «внешними» к их содержанию фактами, как возникновение, членение и объединение (создание «пограничных») наук. Когда появилась научная дисциплина, получившая наименование «искусственного интеллекта» (ИИ), новичок, как это было положено в устоявшемся обществе солидных наук, был принят в штыки. Уже само название этой дисциплины таило в себе что-то вызывающее. Ученые, стоявшие на страже традиционных рубежей принялись обличать её и бдеть. Аргументы при этом черпались главным образом из прошлого наук, в той или иной мере стоявших близко к проблематике искусственного интеллекта.

Научная дисциплина «Искусственный интеллект» появилась сравнительно недавно – в конце прошлого столетия. Однако идея создания машины, у которой было бы произвольное число чувствительных и исполнительных элементов, достаточный запас энергии и память огромной ёмкости возникла ещё в 50-ые годы 20в. у академика И.А.Полетаева.

Искусственный интеллект – раздел информатики, занимающийся формализацией задач, напоминающих задачи, выполняемые человеком. При этом в большинстве случаев заранее известен алгоритм решения задачи.

Искусственный интеллект – область исследований, ориентированных на разработку компьютерных программ, способных выполнять функции, обычно ассоциируемые с интеллектуальными действиями человека: анализ, обучение, планирование, решение, творчество. Наиболее продуктивные направления работ по искусственному интеллекту связаны с разработками экспертных систем (позволяющих работникам средней квалификации принимать решения, доступные узким специалистам), баз данных (позволяющих разными способами анализировать информацию и выбирать варианты, оценивая последствия принятых решений), исследовательских моделей (позволяющих визуализировать реальность, недоступную непосредственному наблюдению)

Однако точного определения этой науки не существует, так как в философии не решён вопрос о природе и статусе человеческого интеллекта. Нет и точного критерия достижения компьютерами «разумности», хотя на заре искусственного интеллекта был предложен ряд гипотез. (см.:http://ru.wikipedia.org/wiki/A.I.)

Искусственный интеллект самым непосредственным образом связан с развитием компьютерной техники, достигшей поразительных успехов, и, по сути дела, порождён ею.

Но всю суть искусственного интеллекта нельзя сводить лишь к машинам. Это комплексная наука, немалую роль в которой играют другие науки, так или иначе связанные с самим понятием интеллекта. В частности, немалая роль принадлежит лингвистике.

Сравнительно недавно возникло понятие «система класса искусственного интеллекта», под которым подразумевается система, оперирующая знаниями и извлекающая из них то, что диктуется теми или иными потребностями. Системы класса искусственного интеллекта многообразны, но все они состоят из трёх основных элементов: компьютерной техники, соответствующих программ и знаний. Все 3 составляющие тесно связаны между собой. Исходной же величиной являются знания. (см.: В.А.Звегинцев 2001: 227)

Знания – многомерная величина, но общественно ценные знания, которыми оперируют системы класса искусственного интеллекта, всегда выражаются на языке.

Возникает вопрос: «В какой мере естественный человеческий язык способен передавать фиксированные в нём знания и может ли он вообще служить средством общения между человеком и машиной?» (см.: В.А.Звегинцев 2001: 227)

Проблемы языка носят всепроникающий характер, и любая проблема информатики, искусственного интеллекта, экспертных систем имеет языковой аспект, что, к сожалению, не всегда понимается в полной мере. Корень многих недоразумений кроется в неточном определении информационной природы естественного языка. Здесь важно иметь в виду, что язык – это не только форма выражения готовых мыслей, сколько способ содержательной организации и представления знаний. Этот способ первичен, универсален, он возник с самим зарождением человеческого интеллекта и служит надежным инструментом его развития.

Что же конкретно заставляет уже сегодня говорить об острой потребности в лингвистическом обеспечении компьютеризации? Прежде всего, это гигантские объёмы накопленной и постоянно пополняемой информации, которая подлежит обработке с помощью ЭВМ. Поскольку эта информация часто организована средствами естественного языка, её реальное освоение возможно лишь при автоматической смысловой обработке текстов, без предварительной обработки их человеком. (см.: А.Н.Колмогоров, «Повсеместная компьютеризация»: http://www.erudition.ru/referat/ref/id.21703)

Эффективное использование знаний, содержащихся в текстах, требует новых стратегий обработки информации, отличных от традиционных логических подходов. Такие стратегии должны учитывать смысловые законы естественного языка. Например, из высказывания «Иван вернул мне книгу» следует, что книга была ранее у меня; этот вывод мы делаем, исходя из контекста.

Оперативная, удобная, развивающаяся кооперация человека и машины будет опираться на естественный язык, точнее, на определённый подъязык, связанный с некоторой сферой общения или классом решаемых задач.

Лингвистическое обеспечение автоматизированных систем – это совокупность средств, позволяющих осуществлять компьютеризацию языковой деятельности. Речь, в частности, идет о создании того или иного типа автоматизированной системы обработки текста (АСОТ) – некоторого процессора, на входе и на выходе которого присутствует текстовая информация на естественном языке. Типы АСОТ многообразны и могут быть нацелены на моделирование различных языковых процессоров, таких, например, как диалоговое взаимодействие, сжатие информации, реферирование текста, логическая обработка содержания, перевод на другой естественный язык и т.д. С собственной лингвистической точки зрения процессы, осуществляемые в машине при решении подобных задач, сводятся к перезаписи информации на тех или иных (естественных и искусственных) языках. Внешние критерии, которыми руководствуются создатели АСОТ, подводятся под общую формулу «оптимизация общения человека и машины».

Можно назвать некоторые из наиболее фундаментальных качеств естественного языка:

1) принципиальная нечёткость значения языковых выражений

2) динамичность языковой системы

3) образность номинаций, основанная прежде всего на метафоричности

4) бесконечные творческие возможности в освоении новых знаний

5) семантическая мощь словаря, позволяющая выражать любую информацию с помощью конечного инвентаря элементов

6) гибкость в передаче информации

7) разнообразие функций

8) специфическая системность. (см.: А.А.Реформатский 1996: 310)

В целом естественный язык может быть с полным основанием оценен как сложнейший объект для моделирования.

По мере развития компьютерных систем становится всё более очевидным, что использование этих систем намного расширится, если станет возможным использование человеческой речи при работе непосредственно с компьютером, и, в частности, станет возможным управление машиной обычным голосом в реальном времени, а также ввод и вывод информации в виде обычной человеческой речи. (см.: А.Тьюринг, «Человек и машина»: http://www.liceum3.info/SCIENCE/i_intel.htm)

Существующие технологии распознавания речи не имеют пока достаточных возможностей для их широкого использования, но на данном этапе исследований проводится интенсивный поиск возможностей употребления коротких многозначных слов (процедур) для облегчения понимания. Распознавание речи в настоящее время нашло реальное применение в жизни, пожалуй, только в тех случаях, когда используемый словарь сокращен до 10 знаков, например при обработке номеров кредитных карт и прочих кодов доступа в базирующихся на компьютерах системах, обрабатывающих передаваемые по телефону данные. Так что насущная задача – распознавание, по крайней мере, 20 тысяч слов естественного языка – остается пока недостижимой. Эти возможности пока недоступны для широкого коммерческого использования. Однако ряд компаний своими силами пытается использовать уже существующие в данной области науки знания.

Для успешного распознавания речи следует решить следующие задачи:

1) обработать словарь (фонемный состав),

2) обработать синтаксис,

3) сократить речь (включая возможное использование жёстких сценариев),

4) выбрать диктора (учитывая возраст, пол, родной язык и диалект),

5) тренировать диктора,

6) разработать особенного вида микрофон (принимая во внимание направленность и местоположение микрофона),

7) разработать условия работы системы и получения результата с указанием ошибок. (см.: В.А.Абидин, «Речевые технологии»: http://speetech.com/raspoznavanie-rechi/)

Существующие сегодня системы распознавания речи основываются на сборе всей доступной (порой даже избыточной) информации, необходимой для распознавания слов.

Исследователи считают, что задача распознавания образца речи, основанная на качестве сигнала, подверженного изменениям, будет достаточной для распознавания, но, тем не менее, в настоящее время даже при распознавании небольших сообщений нормальной речи, пока невозможно после получения разнообразных реальных сигналов осуществить прямую трансформацию в лингвистические символы, что является желаемым результатом.

Язык – незаменимый помощник в сфере рационального мышления, так же как и в сферах эмоционального общения. Язык – фактор регулирования практически любой человеческой деятельности. Компьютерное моделирование языка и речевой деятельности нуждается в солидной теоретической базе. Нужны специальные теории, которые в настоящее время существуют в зачаточном состоянии либо отсутствуют вовсе. Думается, моделирование языков (естественных и искусственных) вписывается в проблему моделирования способностей человека. Языковая способность – это способность, делающая человека человеком, возникающая и развивающаяся под воздействием практических потребностей. Проявления её многообразны, но особо следует подчеркнуть роль языка в мыслительной деятельности, в организации памяти, в процессах коммуникации человека с окружающими и самим собой.

Следовательно, лингвистика должна повернуться лицом к новым задачам, выдвигаемым компьютеризацией, и в то же самое время компьютерная грамотность должна непременно включать в себя и грамотность лингвистическую. А это, в частности, значит, что по-новому должно вестись и преподавание языковедческих предметов в школе и вузах.

Текстовый процессор (word processor)– компьютерная программа, используемая для подготовки печатной документации.

Наиболее известный текстовый процессор TeX был разработан Дональдом Кнутом после написания первых трёх томов «Искусства программирования».

Текстовым процессором также называют электронное или электронно-механическое устройство (а позже – специализированный компьютер), предназначенное для обработки текстов – развитие электрической печатной машинки. Сейчас такие устройства практически не применяются, но были распространены на Западе в 60е-70е гг. прошлого века.

(создан на базе реферата Филипповой Елены)





Дата публикования: 2015-01-24; Прочитано: 5542 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...