Stanislav Taktaev personal web site
Персональный сайт Станислава Тактаева.
 

Search

 | 

Новости/News

 | 

Русский

 | 

English

Форум / Discussion ||

Состояние исследований

В настоящее время нет единого подхода, аналогичного координатной теории семантического пространства в известных автору исследованиях, проводимых научными организациями и отдельными исследователями. КТПП предлагает объединяющий теоретический подход для теории информации по Винеру -Шеннону - Колмогорову и лингвистики и семантики на качественно ином уровне по сравнению с существующими подходами.

В то же время, идея классификационной модели знаний стара как мир, а по сути любая классификационная модель – это карта пространства понятий конкретной предметной области. Более того, суть любого языка (в том числе и технического – языка химии, биологии) – это описание данной понятийной области, то есть любой язык – это своеобразная карта пространства понятий.

Так, астрономические таблицы, составленные Тихо Браге позволили Иоганну Кеплеру вывести новые законы движения планет; данные по систематизации растений, собранные Карлом Линнеем, легли в основу эволюционной теории Чарльза Дарвина; данные о точных весах химических элементах, элементов их физических и химических свойствах, собранные Генри Кавендишем и Антуаном Лавуазье помогли Дмитрию Менделееву сформулировать периодический закон и построить таблицу химических элементов. По сути, перечисленные примеры и есть попытки построения карт пространств понятий отдельных областей науки.

Однако, данные карты фрагментарны и, зачастую, «нарисованы от руки» - то есть построены по интуиции отдельных исследователей, в них нет возможности точного расчета смыслового расстояния между понятиями. Это нисколько не умаляет значения гениальной Периодической системы элементов Д.И. Менделеева для развития химии, но, если вдуматься, насколько названия элементов отражают их химические и физические свойства? Водород – еще понятно? А гелий? А стронций?

В КТПП делается попытка описания единого семантического пространства, базируясь на Теории информации, достижениях геометрии абстрактных многомерных пространств, и дискретной математики.

Подход теории пространства понятий также можно считать расширенной и дополненной трактовкой семиотического пространства Ю.Лотмана, хотя этот подход вырабатывался без влияния работ по семиотике. Здесь основное представление описано не как набор семиосфер по Лотману, а как единое многомерное пространство, обладающее анизотропной структурой и состоящее из подпространств (семиосфер) в которые структурированы понятия. То есть, пространство понятий – это метасемиосфера, по отношению к семиосфере, так же как соотношение «метагалактика» - «галактика». Понятие близко по значению к знаку в семиотике, однако, в отличие от знака, как область пространства понятий, каждое понятие имеет размер и координаты.[Ю.М.ЛОТМАН Семиосфера Культура и взрыв Внутри мыслящих миров Статьи Исследования Заметки]

Дифференциальный подход к построению семантического пространства обозначен у нескольких авторов, но наиболее развито и полно он представлен в работе Е.В. Луценко «Автоматизированный системно-когнитивный анализ в управлении активными объектами (Системная теория информации и ее применение в исследовании экономических, социально-психологических, технологических и организационно-технических систем)» см. (http://lc.kubagro.ru). Однако, в данной работе автор не ставит задачу построения и исследования семантического пространства, а развивает концепцию распознавания смыслов как участков частных семантических пространств для решения задач адаптивного управления и искусственного интеллекта.

Представляется достаточно релевантной (именно релевантной, а не близкой!) темой исследований с КТПП теория семантических сетей [Д. Норманн. Теория семантических сетей.]. Да, семантические сети можно считать в какой то мере прообразом идеи КТПП, и с позиции теории, семантические сети – это искаженная проекция многомерного семантического пространства в ограниченное число измерения.

Искажение обуславливается тем, что в настоящее время преобладает подход, когда вместо расстояний используются различные безразмерные заменители расстояния – «семантические связи», «весовые коэффициенты» и т.д. , как правило, отражающие только иерархические и сетевые связи между понятиями, без учета расстояний. «Близость», «отдаленность» в этих контекстах являются неизмеримыми величинами, они не дают возможности хоть какого то измерения ( а значит и точной оценки) расстояния. Можно говорить только об очень грубой, неточной оценки только для понятийно близких вещей (белый и черный, теплый и холодный). А насколько далеки друг от друга понятия «черный» и «холодный»? Это расстояние больше, чем между «шершавый» и «синий»? А какие вещи понятийно ближе друг к другу – кресло и бутылка или компьютер и кружка?

КТПП позволяет, выработав методику измерения и определив единичные расстояния между понятиями, измерить информационные расстояния между понятиями, что открывает ряд перспектив (см. ниже.)

Близкие по смыслу исследования ведутся в области поиска информации в глобальных информационных сетях – это создание семантических каталогов, . В КТПП они представлены как иерархически структурированные области пространства понятий – домены. В теории поиска информации сейчас преобладает лингвистический подход, базирующийся на структуре языка и словоформах. КТПП предлагает семантический, смысловой подход, с численной, координатной оценкой расстояний между областями пространства понятий. Наиболее близкий подход, связанный с использованием при поиске информации и создании каталогов дескрипторных методов прослеживается в работах П.И. Браславского [Фасетная организация интернет-каталога и автоматическая жанровая классификация документов П.И. Браславский, ИМаш УрО РАН (pb@dpt.ustu.ru), Е.А.Е.А Вовк, ООО "Яндекс" (lenka@yandex-team.ru), М.Ю. М.Ю Маслов, ООО "Яндекс" (maslov@yandex-team.ru)].

Развитием данного подхода является подход «семантической сети / сетевого языка онтологий» (Semantic web / Web ontology language – OWL), проводимых консорциумом W3C (www.w3c.org) и возглавляемым Тим Бернсом Ли, где предполагается создание глобального иерархического семантического каталога. Однако, такой подход, являющийся дальнейшим развитием идей SGML, XML не предполагает расчета семантических расстояний между понятиями, предложенного в данной работе.

Большим проектом по систематизации смыслов на основе естественных языков является проект Cyc проводимый компанией Cycorp в США в (http://www.cyc.com/). В рамках данного проекта проделана огромная работа по систематизации признаков понятий через их формулировки на формальном языке описания Cyc. Однако в данном подходе не говорится ничего о систематизации понятий в многомерном пространстве. Данные этого проекта будут очень полезны для создания карты семантического пространства.

Также, Близкие исследования ведутся в области сжатия информации можно выделить работу исследующую  возможность оценки информационного расстояния между документами «Language Trees and Zipping» [Language Trees and Zipping Dario Benedetto1, Emanuele Caglioti1 and Vittorio Loreto, 21, ”La Sapienza” University, Mathematics Department, P.le A. Moro 5, 00185 Rome, Italy. benedetto@mat.uniroma1.it, caglioti@mat.uniroma1.it and ”La Sapienza” University, Physics Department, P.le A. Moro 5, 00185 Rome, Italy and INFM, Unit`a di Roma 1, loreto@roma1.infn.it ] , «Классификация и разметка текстов с использованием методов сжатия данных». Д.В.Хмелёва [Классификация и разметка текстов с использованием методов сжатия данных. Краткое введение. Д.В.Хмелёв; http://www.compression.ru/download/articles/classif/index.html] и работу по применению семантических подходов в сжатии текстов «Semantic and Generative Models for Lossy Text Compression» [Semantic and Generative Models for Lossy Text Compression IAN H. WITTEN,* TIMOTHY C. BELL,+ ALISTAIR MOFFAT++ CRAIG G. NEVILL-MANNING,* TONY C. SMITH§ AND HAROLD THIMBLEBY] . Однако, данные работы базируются на эмпирических и интуитивных оценках, авторы выделяют области пространства понятий (словари) и записывают кодируемую информацию в терминах локальных областей пространства понятий.

Терминология «алгебра понятий» представлена в работе «Алгебра понятий - подход к моделированию креативного мышления» Суворова В. В., но у автора не было возможности ознакомиться с ней полностью.[УДК 512:681.3 Алгебра понятий - подход к моделированию креативного мышления Суворов В. В. Науково-теоретичний журнал 'Штучний інтелект' No.3'2000]

Резюмируя,  можно сказать, что, несмотря на ряд близких концепций, концепция координатного подхода для создания карты семантического пространства, является оригинальной и представляется наиболее продуктивной, поскольку открывает возможности расчета семантических расстояний, что необходимо в решении задач распознавания смысла и построении систем искусственного интеллекта. Более того, по мнению автора, именно отсутствие координатного подхода и не позволило решить до сих пор качественно задачи распознавания связанные с учетом смыслового контекста, что является одним из основных препятствий на пути создания систем искусственного интеллекта.

You can ask author:

Pls, carefully type your email!

Your E-mail:
Your Question:

Website from "Summatech"
I'll ready to answer to you: Stanislav Taktaev