Язык запросов русскоязычных поисковых систем

Заказать работу

Реферат подготовила ученица 11 класса Зимина Марина

МОУ Коробовская СОШ

Управления образования Администрации Шатурского района Московской области

2005 год

Введение.

При проведении поиска информации в службе www, когда тема задана достаточно широко, целесообразно использовать поисковые каталоги и поисковые указатели. Знание основных понятий и терминов позволяет провести углубленный поиск с применением ключевых слов, наиболее точно характеризующих искомую тему. При этом следует различать приемы простого, расширенного и контекстного поиска.

Под простым поиском понимается поиск Web-ресурсов по ключевому слову. Недостаток этого вида поиска заключается в том, что обычно он выдает слишком много документов, причем наряду с ценной информацией попадается много «мусора».

При использовании расширенного поиска ключевые слова связываются между собою операторами логических отношений(так называемый язык запросов). При помощи логических отношений поисковое задание формулируется так, чтобы более точно детализировать задание и ограничить область отбора.

Контекстный поиск – это поиск по точной фразе. К сожалению доступен не во всех поисковых системах. К тому же эта операции достаточно медленная.

Язык запросов – язык манипулирования данными, позволяющий описывать условия поиска информации, не задавая для этого последовательность действий, нужных для получения ответа.

Порядок действий логических операторов: сначала выполняются действия в скобках ( ), потом операторы AND, NOT и лишь потом OR.

В разных поисковых системах используются различные приемы связывания между собой ключевых слов при помощи логических операторов. В дальнейшем будут приведены правила построения запросов в трех наиболее распространенных русскоязычных системах.

Язык запросов в поисковой системе РАМБЛЕР [1]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.
Регистр (shift) Если подряд идёт не менее чем два, три или четыре слова с большой буквы, то будет производиться только по имени собственному ДОМ и дом, nOt и Not воспринимаются одинаково

слово1 пробел слово 2

слово 1 & слово 2

слово 1 AND слово 2

Будут найдены все документы, где в одном предложении есть оба слова

машина самолёт

машина & самолёт

машина AND самолёт

Слово 1 or слово 2

Слово 1 | слово 2

Будут найдены документы, содержащие или одно слово, или другое

самолёт or аэродром

самолет | аэродром

Слово 1 not слово 2

Слово 1! слово 2

Будут найдены документы, содержащие первое слово, но без второго

машина not самолёт

машина! самолёт

" " Слова, заключенные в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они указаны в запросе* самолёт "заправился" посадка не будет найдено: самолёт совершил посадку, чтобы заправиться
(X,Y) Будут найдены документы, в которых расстояние между словами не более Х слов (2,красная армия) между словами не стоит ни одного слова, поскольку лишь в случае непосредственного их соседства разница в порядковых номерах слов меньше 2, по умолчанию максимальное расстояние – 40 слов
( ) Сначала слова группируются по операторам AND и NOT, и лишь потом по операторам OR

машина (самолёт | аэродром)

машина и одно из слов самолёт

или аэродром

${counter =ID} Будут найдены страницы, на которых размещены счетчики Top100, TopShop, TopList, SpyLog, HotLog сounter – это название счетчика, а ID – это номер счетчика ${top100 =193680}- это открытки

Оформление запросов в поисковой системе Яндекс [2]

Написано Результат поиска Примечания и примеры
идти Все формы по правилам русского языка найдётся идти, идёт, шёл, шла и т.д.

Путина

путина

Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы, в противном случае будут найдены как слова с большой, так и с маленькой буквы по запросу ‘путина’ найдется и президент, и сезон интенсивного рыболовства. А по запросу ‘Путина’ – президент и те случаи рыболовного сезона, когда он написан с большой буквы.

слово 1 && слово 2

слово 1 & слово 2

+слово 1 +слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

+лечебная +физкультура

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

слово 1 ~~ слово 2

слово 1 ~ слово 2

слово 1 –слово 2

Будут найдены документы с первым словом, но без второго

руководство Visual C ~~ цена

рак -гороскоп

одинарный оператор ищет в пределах предложения, двойной – в пределах документа

именно знак минус, а не тире и не дефис через пробел от предыдущего и слитно с последующим словом

слово 1 пробел слово 2 пробел слово 3 Будет найдено много документов с этими словами

частные объявления продажа

велосипедов

несколько слов, разделённые пробелами, означают, что все они должны входить в одно предложение искомого документа

слово 1 | слово 2 Будут найдены документы либо с первым словом, либо со вторым фото | фотография
Таблица «Оформление запросов в поисковой системе «Яндекс» (продолжение)
" " Будут найдены документы, в которых слова, заключенные в кавычки, идут подряд

"красная шапочка"

контекст "а шапочка у неё была красная" найден не будет

!слово Будут найдены документы, содержащие это слово !Лужкову
слово 1 /число слово 2 Будут найдены документы, в которых первое слово находится на расстоянии заданного числа от второго

поставщики /2 кофе

найдутся "поставщики колумбийского кофе", "поставщики кофе из Колумбии" и т.д.

слово 1 /(+n –n)

слово 2

Будут найдены документы, в которых известны расстояния между словами

+n – это минимальное число слов, а –n – максимальное

музыкальное /(-2 4) образование

музыкальное должно находиться от образования в интервале от 2 слов слева до 4 слов справа

если знаки ограничения стоят после двойных операторов, то употреблённые там числа – это расстояние не в словах, а в предложениях

$title X Будут найдены документы с заголовком Х

$title Comp Tek

ищет в заголовках документов слово Comp Tek

$anchor (X | Y) Будут найдены документы, в ссылках которых есть одно из слов Х или Y $anchor (Comp Tek | Dialogic)
#url="www.X.ru" Ограничить поиск информации сервером Х

Comp Tek

#url=www.comptek.ru

упоминание компании Comp Tek на сервере www.comptek.ru и в адресах начинающихся с данной последовательности символов

#linkl="http://www.x.ru/*" Будут найдены документы, содержащие ссылки на определённые URL

#linkl=www.comptek.ru*

найдутся документы, которые сослались на сервер компании

#image="X*" Будут найдены документы, содержащие ссылки на документы с изображениями Х

#image="tort*"

найдутся ссылки на документы с изображением тортов

возможно, найдётся и портрет черепахи Тортиллы

#hint=(X) Будут найдены документы, содержащие изображение с подписью Х

#hint=(кино)

документы, содержащие изображение с подписью кино

Таблица. «Оформление запросов в поисковой системе Яндекс» (окончание)

#keywords=(X Y Z)

#abstrakt=(X Y Z)

Будут найдены документы по ключевым словам и аннотациям X Y Z keywords – краткое описание содержания страницы. Эта служебная информация и она не видима на странице
Х <- Y Будут найдены документы, содержащие слова Х и Y, при этом будут выданы первыми документы, содержащие слово Y

компьютер <- телефон

первыми будут выданы документы, содержащие слово телефон

Оформление запросов в поисковой системе Апорт [3]

Написано Результат поиска Примечания и примеры
идти

Все формы по правилам

русского языка

найдётся идти, идёт, шёл,

шла и т.д.

Регистр(shift) Если вы набрали слово с большой буквы, будут найдены только слова с большой буквы красная площадь

слово 1 AND слово 2

слово 1 + слово 2

слово 1 и слово 2

слово 1 & слово 2

Будут найдены документы, в которых есть оба слова

лечебная & физкультура

лечебная и физкультура

лечебная + физкультура

лечебная AND физкультура

слово 1оr слово 2

слово 1│ слово 2

слово 1 или слово 2

Будут найдены документы, содержащие любое из указанных слов или оба слова одновременно фото | фотография

слово 1 не слово 2

слово 1 not слово 2

слово 1 - слово 2

Будут найдены документы с первым словом, но без второго

рак - гороскоп

рак не гороскоп

рак not гороскоп

” ” Будут найдены документы с данными словосочетанием или близкое к нему

”яблоки на снегу ”

будут найдены ”яблоки на снегу”, ”яблоки и снег”, ”яблокам под снегом”, ”яблоко снег”

слХ(слова)

сХ(слова)

wX(слова)

[Х, слова]

Будут найдены документы, где между словами стоит не более двух других слов

сл5(папа мама сын)

между словами ”папа”, ”мама” и ”сын” стоит не более двух других слов, т.е. общее число слов во фрагменте не более 5

Таблица «Оформление запросов в поисковой системе Апорт» (продолжение)

url:

url=

Ограничение поиска одним или несколькими серверами, или даже частью сервера

url=www.intel.ru

документы, на сервере www.intel.ru. В случайном порядке

url=www.intel.ru & soft & условия

все документы, сервера www.intel.ru, содержащие слова ”soft” и ”условия”

url=www.intel.ru/soft/*

все документы, на сервере www.intel.ru в каталоге soft и его подкаталогах

url=*.agama.com

все документы, на серверах www.agama.com, russia.agama.com и т.д.

дата:

дата=

date=

date:

Поиск по датам

папа дата=01/01/97-01/02/97

документы, содержащие слово папа, и имеющие дату от 1 января 1997 года до 1 февраля 1997 года

date=01/01/97 папа

документы, содержащие слово папа, и имеющие дату 1 января 1997 года

дата:<01/02/97 папа

дата:-01/02/97 папа

все документы, содержащие слово папа, и имеющие дату не позже 1 февраля 1997 года

title=

t=

title( )

заг=

з=

Поиск в заголовках

title(папа │мама)

будут найдены документы, содержащие в заголовке слово папа или слово мама, или оба одновременно

перед круглыми скоками знак равенства можно опустить

keywords=

kw=

клсл=

кл=

Поиск в поле МЕТА KEYWORDS

kw(папа мама)

будут найдены документы, для которых автор в ключевых словах указал оба слова: папа и мама

Таблица «Оформление запросов в поисковой системе Апорт» (окончание)

alt=

a=

рис=

р=

Поиск в комментариях к картинкам

alt=(Билл Гейтс)

документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Билл и Гейтс

anchor= Поиск в тексте ссылок

anchor=(ненавижу Интернет)

документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и Интернет

description= Поиск в тексте описаний сайтов и в поле DESRIPTION

description=(”уксусная кислота”)

будут найдены корневые документы сайтов, в тексте описаний которых встречается словосочетание уксусная кислота

text=(оглавление или содержание)

x=(оглавление или содержание)

текст=(оглавление или содержание)

т=(оглавление или содержание)

Поиск в обычном тексте.

Будут найдены документы, в которых любое из указанных слов встречается в пределах основного текста документа

текст=(Последний звонок)
* Произвольное число любых букв

зелен*

найдутся: зеленка, зелень, зеленый, Зеленоград

!слово Будут найдены документы, содержащие это слово !Лужкову

Список литературы

1. http://www.rambler.ru/doc

2. http://www.yandex.ru/info/syntax

3. http://www.glossary.ru

Другие материалы

  • Поисковые системы Интернета
  • ... рядом, то такой документ более полно удовлетворяет запросу. Так как большинство систем осуществляет интеллектуальный поиск в Интернете, то степень соответствия запросу, определённая поисковой системой, не всегда будет совпадать с вашими представлениями. Следует отметить, что при выполнении запроса ...

  • Обзор современных поисковых систем в интернет
  • ... Апорт 0,155 1,5 Другие 0,39 3 Диаграмма 2 – Рейтинг основных Российских поисковых систем (2007г.) 1.4 Обзор основных мировых поисковых систем На сегодняшний день всемирная сеть Интернет насчитывает огромное множество поисковых систем во всех странах мира, из них всех можно ...

  • Справочно-поисковые системы сети Интернет
  • ... , используя стандартные cетевые протоколы.   4. Наиболее популярные русскоязычные справочно-поисковые системы в интернет   4.1 Rambler Поисковая система Рамблер начала свое существование с 1996 года. На сегодняшний день она является одной из самых популярных в РуНете, уступая ...

  • Методы поиска информации в сети интернет. Информационно-поисковые системы
  • ... и являющийся коммерческой тайной компании-разработчика поисковой системы. 1. Основные методы поиска информации в Интернете Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации ...

  • Информационно-поисковые системы на примере Рамблера
  • ... обратимся к механизму работы поисковой машины Рамблер, и на примере ее устройства продемонстрируем, как достигается повышение качества и скорости поиска в условиях постоянного роста объема информации в сети Интернет. Полнота Полнота - это одна из основных характеристик поисковой системы, которая ...

  • Информационно-поисковая система
  • ... ), насчитывающей уже двадцатилетнюю историю, трудно эффективно использовать даже такие скорострельные сервисы, как AltaVista или Lycos. Информационно-поисковые системы появились на свет достаточно давно. Теории и практике построения таких систем посвящено множество статей, основная масса которых ...

  • Всемирная паутина www: гипертекст, поисковые машины
  • ... в своем окне WWW-страницы. Браузер отображает картинки в теле страницы, проигрывает аудио и видео, загружает следующую страницу, когда пользователь щелкает мышью по ссылке и пр. и пр. для того, чтобы сделать путешествие по Всемирной Паутине как можно более комфортным. Гипертекст и web-страницы ...

  • Поисковые системы
  • ... свою информацию. Эти данные передаются базе данных. Когда кто-либо хочет найти информацию, доступную в Интернет, он посещает страницу поисковой системы и заполняет форму, детализирующую информацию, которая ему необходима. Здесь могут использоваться ключевые слова, даты и другие критерии. Критерии ...

  • Организация Web-доступа к базам данных с использованием SQL-запросов
  • ... пользовательского интерфейса для доступа к базам данных. Многие организации используют электронные базы данных для поддержки своих рабочих процессов. Часто это системы на одного – двух пользователей, выполненные с использованием dbf – ориентированных средств разработки: Clipper, Dbase, FoxPro, ...

  • Новации в процессе обучения иностранным языкам
  • ... партнерами (в той же группе или в параллельной, в другом городе и даже стране). Проанализировав опыт использования электронной почты в процессе обучения иностранным языкам, Марк Варшауэр и другие преподаватели пришли к следующим выводам: 1. Предпочтение отдается работе в небольших группах, без ...

  • Язык гипертекстовой разметки HTML в разработке информационных систем
  • ... Web-технологий в современных условиях заключается в их простоте и как следствие в повышении эффективности их применения. 2.1.     Язык гипертекстовой разметки HTML Популярность Internet во многом вызвана появлением World Wide Web (WWW), так как это первая сетевая технология ...

  • Формирование запроса в поисковике. Расчеты в MS EXCEL. Машина Тьюринга
  • ... которых встречаются именно СЛОВОСОЧЕТАНИЕ "компьютерная пресса". Помимо операторов, при формировании запроса часто используются и специальные символы, позволяющие уточнить запрос либо, наоборот, предоставить поисковику большую свободу. Дело в том, что для любого слова, как нам известно, ...

Каталог учебных материалов

Свежие работы в разделе

Наша кнопка

Разместить ссылку на наш сайт можно воспользовавшись следующим кодом:

Контакты

Если у вас возникли какие либо вопросы, обращайтесь на email администратора: admin@kazreferat.info