В ходе поиска производится отсечение очевидно нерелевантных (неподходящих) источников, случайно попавших в выборку. Необходим постоянный семантический (смысловой) анализ промежуточных результатов для уточнения тезауруса и модификации дальнейших запросов.
Исследуется каждый найденный документ и анализируется содержащаяся в нем информация для получения неизвестных лексических образов. Если обнаруживаются устойчивые неподходящие контексты (термины или их сочетания, не имеющие отношения к предмету поиска), то они включаются в запрос в режиме логического отрицания.
Произведя серию различных запросов и проанализировав найденную информацию, можно определить момент, когда будет исчерпано поступление новых сведений. То есть процесс поиска останавливается при минимизации так называемого информационного шума, когда разумными усилиями уже не удается получить новые данные при подобной постановке задачи. |