Информационно-технологическая структура полнотекстовых ИПС

Информационно-технологическая структура полнотекстовых ИПС

Полнотекстовые ИПС строятся на базе информационно-поисковых языков дескрипторного типа. Их информационно-технологическая структура представлена ниже (Набросок 4.1):

Поступающие через интерфейс ввода / вывода документы подвергаются индексированию в механизме индексирования по глобальному словарю системы. Механизм индексирования в полнотекстовых ИПС стопроцентно автоматизирован и заключается в разработке специального двоичного вектора, составляющие которого демонстрируют наличие (1) либо отсутствие (0) в данном документе Информационно-технологическая структура полнотекстовых ИПС слова с подходящим номером из глобального словаря. Слова из проиндексированного документа пополняют глобальный словарь, а сделанный ПОД

документа поступает в поисковое место. Проиндексированный документ отчаливает в хранилище документов. Аналогично регистрирует запрос, в каком юзер через интерфейс запросов выражает свои информационные потребности. Сделанный в механизме индексирования ПОЗ поисковая система посылает в поисковое место, где методом сопоставления с ПОД Информационно-технологическая структура полнотекстовых ИПС осуществляется поиск документов. Механизм извлечения по номерам отысканных документов посылает их юзеру из хранилища.



Набросок 4.1. Структура полнотекстовых ИПС

Хранилище документов может быть скооперировано как показано ниже ().


Набросок 4.2. Организация хранилища

Элементы глобального словаря выступают в качестве дескрипторов информационно-поискового языка системы. Глобальные словари могут быть статическими и динамическими (Набросок 4.3).


Набросок 4.3. Виды глобальных словарей

Морфологический Информационно-технологическая структура полнотекстовых ИПС разбор значительно оказывает влияние на эффективность полнотекстовых ИПС. Он позволяет распознавать как одну общую словоформу все однокоренные слова (вода, аква, водяной), также лексемы – слова отличающиеся в тексте разными окончаниями, приставками и суффиксами (аква, аква, аква, воду, воде и т.п.). Таковой процесс основывается на нормализации глобального словаря системы, объединяющей в одну словоформу Информационно-технологическая структура полнотекстовых ИПС все однокоренные слова и лексемы. Не считая того, отбрасываются неинформативные слова (стоп-слова) – предлоги, союзы, восклицания, междометия и некие другие грамматические категории. Обычно морфологический разбор осуществляется в системах со статическим глобальным словарем. Для российского языка в качестве такового нормализованного глобального словаря употребляется составленный в 1968 году академиком И.К.Зализняком морфологический словарь Информационно-технологическая структура полнотекстовых ИПС российского языка, позволяющий распознать и восстановить более 3 млн. словоформ.

На практике ИПС могут поставляться как готовый информационный продукт с уже сформированной базой документов и интерфейсом поиска и доступа к ним. В других случаях поставляется программная среда (полнотекстовая СУБД), позволяющая такую базу сделать и сформировать, таким макаром, документальную ИПС.


informacionnij-listok-k-putevke-turistskogo-puteshestviya-po-marshrutu-gori-more.html
informacionnij-material-o-rabote-administracii-goroda-rostova-na-donu-v-2012-godu-stranica-3.html
informacionnij-memorandum-firmennoe-naimenovanie-obshestva.html