Здравствуйте, уважаемые читатели блога сайт. Все мы с вами живем в эпоху глобального интернета и пользуемся терминами сайт, веб, www (World Wide Web — всемирная паутина, глобальная сеть) довольно часто и особо не вдаваясь в то, что же это такое.

Тоже самое я наблюдаю и у других авторов, да и обычных собеседников. «Сайт», «интернет», «сеть» или аббревиатура «WWW» стали для нас настолько обычными понятиями, что даже задумываться об их сути не приходит в голову. Однако первый вебсайт появился на свет всего лишь каких-то двадцать лет назад. А что такое интернет?

Ведь он имеет довольно длинную историю, однако, до появления глобальной сети (WWW), 99.9% жителей планеты даже не подозревали о его существовании, ибо он был уделом специалистов и энтузиастов. Сейчас же о всемирной паутине знают даже эскимосы, в языке которых это слово отождествляется со способностью шаманов отыскивать ответы в слоях мироздания. Так давайте же откроем для себя — что такое интернет, сайт, всемирная паутина, и все остальное.

Что такое Интернет и его отличие от глобальной паутины WWW

Самым замечательным фактом, который сейчас можно констатировать, является то, что Internet не имеет владельца . По сути это объединение отдельных локалок (благодаря принятым когда-то общим стандартам, а именно протоколу TCP/IP), которое поддерживается в рабочем состоянии сетевыми провайдерами.

Есть мнение, что из-за все возрастающего медийного трафика (видео и другого тяжелого контента, перемещаемого тоннами в сети) вскоре случится коллапс Интернета из-за его ограниченной на текущий момент пропускной способности. Основной проблемой в этом плане является обновление сетевого оборудования, составляющего глобальную паутину, на более скоростное, что в первую очередь сдерживается необходимыми при этом дополнительными расходами. Но думаю, что проблема будет решена по мере назревания коллапса, да и уже существуют отдельные сегменты сети работающие на высоких скоростях.

Вообще, в свете тог, что интернет по сути ничей, следует упомянуть, что многие государства, пытаясь внедрить цензуру в глобальной сети, хотят отождествить ее (а именно его самую популярную на данный момент составляющую WWW) со .

Но под этим хотением на самом деле нет никакой почвы, потому что интернет это всего лишь средство коммуникации или, другими словами, носитель информации сравнимый с телефоном или даже обычной бумагой. Попробуйте применить санкции к бумаге или ее распространению по планете. Отдельные санкции отдельные государства, на самом деле, могу применять только к сайтам (островкам информации в сети), которые становятся доступны пользователям посредством всемирной паутины.

Первые предпосылки создания глобальной паутины и интернета были предприняты... Как вы думаете в каком году? Удивительно, но аж в дремучем 1957. Понадобилась такая сетка, естественно, военным (и, естественно, США, ну куда же без них) для связи в случае развертывания военных действий с применением ядреного оружия. Создавали сеть довольно долго (около 12 лет), но это вполне объяснимо тем, что в то время компьютеры находились в зачаточном состоянии.

Но тем не менее их мощности вполне хватало на то, чтобы к 1971 году получить возможность между военными ведомствами и ведущими университетами США. Таким образом протокол передачи Емайл стал первым способом использования интернета для нужд пользователей. Еще через пару о том, что такое интернет уже узнали за океаном. К началу 80x были стандартизированы основные протоколы передачи данных (почтовый, ), а так же появился протокол так называемых новостных конференций Usenet, который был похож на почтовый, но позволял организовывать что-то похожее на форумы.

А спустя еще несколько лет появилась идея создания системы доменных имен (DNS — сыграет важнейшую роль в становлении WWW) и появился первый в мире протокол для общения через интернет в реальном времени — IRC (в русском разговорном — ирка). Он позволял чатиться в сети. Фантастика, которая была доступна и интересна очень и очень малому числу жителей планеты Земля. Но это только пока.

На стыке 80x и 90x годов происходят настолько значимые события в истории развития инфраструктуры, что они, собственно, и предопределили ее дальнейшую судьбу. Вообще такое распространение глобальной сети в умах современных жителей планеты обязано практически одному единственному человеку — Тиму Бернерсу-Ли :

Бернерс-Ли является англичанином, родившимся в семье двух математиков, посвятивших свою жизнь созданию одного из первых компьютеров в мире. Именно благодаря ему мир узнал, что такое интернет, сайт, электронная почта и т.п. Изначально всемирную паутину WWW (World Wide Web) он создал для нужд ядерных исследований Церн (тот самый коллайдер находится у них). Задача состояла в удобном размещении всей имеющейся у концерна научной информации в их собственной сети.

Для решения этой задачи он придумал все, что сейчас является основополагающими элементами WWW (то, что мы и считаем интернетом, немного не понимая его суть). За основу он взял принцип организации информации, называемый . Что это такое? Данный принцип был придуман задолго до этого и заключался в такой организации текста, когда линейность повествования заменялась возможностью перехода по разным ссылкам (связям).

Интернет — это гипертекст, гиперссылки, Урлы и железо

Благодаря этому гипертекст можно читать в разной последовательности, тем самым получая различные варианты линейного текста (ну, вам это, как пользователям интернета со стажем, сейчас должно быть понятно и очевидно, но тогда это была революция). В роли узлов гипертекста должны были , которые мы сейчас называем просто ссылками.

В результате, всю существующую сейчас в компьютерах информацию можно представить как один большой гипертекст, включающий в себя бесчисленное множество узлов (гиперссылок). Все, что было разработано Тимом Бернерсом-Ли, было перенесено с локальной сетки ЦЕРНа в то, что мы сегодня называем интернетом, после чего Web (веб) стал бешеными темпами набирать популярность (первые пятьдесят миллионов пользователей World Wide Web были зарегистрированы всего лишь на протяжении первых пяти лет существования).

Но для реализации принципа гипертекста и гиперссылок понадобилось с нуля создать и разработать сразу несколько вещей. Во-первых, нужен был новый протокол передачи данных, которым стал всем вам сейчас известный протокол HTTP (в начале адресов всех веб сайтов вы найдете упоминание о нем или о его защищенной версии HTTPs).

Во-вторых, был разработан с нуля , аббревиатура которого сейчас известна всем вебмастерам в мире. Итак, мы получили инструменты для передачи данных и создания сайтов (набора веб страниц или web документов). Но как же ссылаться на эти самые документы?

Первый позволял идентифицировать документ на отдельном сервере (сайте), а второй позволял подмешать в идентификатор URI доменное имя (полученное и однозначно указывающее на принадлежность документа вебсайту, размещенному на определенном сервере) или IP адрес (уникальный цифровой идентификатор абсолютно всех устройств в глобальной или локальной сети). Про читайте поподробнее по приведенной ссылке.

Осталось сделать всего лишь один шаг для того, чтобы всемирная паутина WWW, наконец-то, заработала и стала востребована пользователями. Знаете какой?

Ну, конечное же, нужна была программа, которая бы на компьютере пользователя могла отображать содержимое любой запрошенной в интернете (с помощью URL адреса) веб страницы. Такой программой стал . Если говорить про сегодняшнее время, то основных игроков на этом рынке не так уж и много, и обо всех из них я успел написать по небольшому обзору:

  1. (IE, MSIE) - старая гвардия еще в строю
  2. (Мазила Фаерфокс) - еще один ветеран не собирается сдавать позиций без боя
  3. (Гугл Хром) - амбициозный новичок, которому удалось захватить лидерство в максимально короткие сроки
  4. — любимый многими в рунете, но постепенно теряющий популярность браузер
  5. — засланец из яблочного стана

Тимоти Джон Бернерс-Ли самостоятельно написал программу первого в мире Internet обозревателя и назвал его, не мудрствуя лукаво, World Wide Web. Хотя это и не было пределом совершенства, однако именно с этого браузера началось победное шествие всемирной паутины WWW по планете.

Вообще, конечно же, поражает тот факт, что все необходимые инструменты для современного интернета (имеется в виду его самая популярная составляющая) были созданы всего лишь одним человеком за столь короткое время. Браво.

Чуть позже появился первый графический браузер Мозаика, от которого ведут начало и многие из современных обозревателей (Мазила и Эксплорер). Именно Мозаика стала той каплей, которой не хватало, чтобы появился интерес к интернету (а именно к всемирной паутине) у обычных жителей планеты Земля. Графический браузер — это уже совсем другое дело, чем текстовый. Все любят смотреть картинки и лишь немногие любят читать.

Что примечательно, Бернерс-Ли не получил каких-то жутко больших сумм денег, которые, например, в результате получили или , хотя сделал он для глобальной сети, наверное, все же больше.

Да, со временем в дополнение к разработанному Бернерсом-Ли языку Html добавился еще и . Благодаря этому часть операторов в Html стала не нужна, а им на замену пришли гораздо более гибкие инструменты каскадных таблиц стилей, которые позволили существенно повысить привлекательность и гибкость дизайна у создаваемых сейчас сайтов. Хотя в изучении правила CSS, кончено же, более сложны, чем язык разметки. Однако, красота требует жертв.

Как устроены интернет и глобальная сеть изнутри?

Но давайте посмотрим, что такое Web (www) и каким образом осуществляется размещение информации в Internet. Тут мы с вами вплотную столкнемся с тем самым феноменом, который называется website (web — сетка, а site — место). Итак, что же такое «место в сети» (аналог места под солнцем в реальной жизни) и как его, собственно, получить.

Что же такое интет? Итак, он состоит из невидимых и не имеющих большого значения для пользователей каналообразующих устройств (маршрутизаторов, коммутаторов). Сеть же WWW (то, что мы называем Web или всемирной паутиной) состоит из миллионов веб серверов, которые представляют из себя программы, запущенные на немного модифицированных компьютерах, которые в свою очередь обязательно должны быть подключены (в режиме 24 на 7) к глобальной паутине и использовать для обмена данными протокол HTTP.

Веб сервер (программа) получает запрос (чаще всего от браузера пользователя, который открывает ссылку или же ввел Url в адресной строке) на открытие документа, размещенного на этом самом сервере. Документ в простейшем случае представляет из себя физический файл (с расширение html, например), который лежит на жестком диске сервера.

В более сложном случае (при использовании ) запрашиваемый документ будет сформирован программным способом на лету.

Для просмотра запрошенной страницы сайта используется специальное программное обеспечение на стороне клиента (пользователя) под названием браузер, который умеет отрисовывать закачанный фрагмент гипертекста в удобоваримом виде на том устройстве отображения информации, где этот самый обозреватель установлен (ПК, телефон, планшет и т.п.). В общем-то все просто, если не вдаваться в детали.

Раньше каждый отдельный вебсайт размещался физически на отдельном компьютере. Связано это было в основном со слабой вычислительной мощностью имеющихся на тот момент ПК. Но в любом случае, компьютер с программой web сервера и размещенном на нем сайтом обязательно должен быть круглосуточно подключен в интернету. Осуществить это в домашних условиях довольно сложно и дорого, поэтому для хранения веб сайтов обычно пользуются услугами специализирующихся на этом хостинг-компаний.

Услуга хостинга в силу популярности WWW является сейчас довольно востребованной. Благодаря растущим со временем мощностям современных ПК у хостеров появилась возможность размещать помногу вебсайтов на одном физическом компьютере (виртуальный хостинг), а размещение одного сайта на одном физическом ПК стало называться услугой .

При использовании виртуального хостинга всем размещенным на компьютере (тот, который называется сервером) вебсайтам может быть присвоен один IP адрес, а можете быть и отдельный каждому. Сути это не меняет и лишь косвенно может влиять на размещенный там Website (плохое соседство на одном IP может плохо сказаться на — поисковики иногда гребут всех под одну гребенку).

Теперь давайте немного поговорим за доменные имена вебсайтов и их значение во всемирной паутине WWW. Каждый ресурс в интернете имеет свое доменное имя. Причем может сложиться ситуация, когда у одного и того же сайта может быть несколько доменных имен (в результате получаются зеркала или же алиасы), а так же, например, на для многих ресурсов может использоваться одно и то же доменное имя.

Так же для некоторых серьезных ресурсов существует такое понятие, как зеркала. В этом случае файлы сайта могут находиться на разных физических компьютерах, а сами ресурсы иметь разные доменные имена. Но это все нюансы, только запутывающие начинающих пользователей.

Что означает WWW? Это и есть всемирная паутина, а аббревиатура расшифровывается как World Wide Web. Ее возникновение можно сравнить по значимости с первой книгой, положившей начало книгопечатанию, хотя в XXI веке информационные технологии проникли во все сферы деятельности. Человечество вряд ли уже сможет обходиться без нее.

Определение

По определению всемирная паутина – это распределенная система доступа к файлам на разных компьютерах при условии подключения последних к Интернету. Ее образуют десятки миллионов веб-страниц, в основе преимущественного большинства которых находится технология гипертекста.

В повседневности всемирная сеть называется интернет, поэтому пользователи, упоминая интернет, обычно подразумевают паутину.

Благодаря Королеву

Изобретение интернета – отчасти заслуга гениального советского конструктора Сергея Королева. Он не изучал компьютерные системы и все, что с ними связано, а разрабатывал межконтинентальные ракеты. Американцы всерьез испугались его достижений и раздумывали, чем ответить Королеву, Хрущеву и Советскому Союзу.

Так в кабинетах Пентагона впервые появилась идея об информационной сети, которую ни одна ракета не уничтожит. Произошло это в 1957 году, когда СССР вывел на орбиту новый спутник, способный преодолеть расстояние до США.

Тогда американское правительство поручило создать агентство ARPA, занимавшееся реализацией идеи. Гражданское учреждение финансировал Пентагон: перед сотрудниками стояла задача – разработать и представить неуязвимую компьютерную систему.

В проекте участвовали 4 крупных университета – Лос-Анджелеса, Санта Барбары, Стэнфорда и Юты. Сейчас уже не вспомнить поименно тех, кто придумал всемирную паутину, потому что результатов не было долгое время.

Ученые долго работали над структурой, не раз упирались в тупиковые ситуации. Случалось, что взрывы уничтожали компьютеры, разваливая схемы, выстраиваемые долгие месяцы. В 1968 году появилась первая рабочая сеть ARPANET. Еще год потребовался, что получить практический результат.

29 октября 1969 года

В этот день в 21 час состоялся первый сеанс между двумя компьютерами, находившимися на расстоянии 640 км друг от друга. За первой машиной сидел Чарли Клайн в Лос-Анджелесе, а за второй – Билл Дювалль в Стэнфорде.

Клайн передавал коллеге слово «logon» по одной букве. Дювалль принимал сообщение и отчитывался в телефонном режиме после очередного приема. Первый сеанс получился коротким – удалось передать лишь 3 буквы, после чего связь прервалась. На восстановление ушло 1,5 часа, и Дювалль в Стэнфорде успешно принял оставшиеся 2 буквы.

В 1971 году появилась сеть, объединившая 23 пользователей, а также первый сервис электронной почты. Через два года к американской сети добавились госслужащие в Норвегии и вуз в Лондоне – так она вышла на международный уровень.

Количество пользователей интернета увеличивалось с каждым годом: если в 1977 году их было 100 человек, то в 1989 году – больше 100 тысяч. В 1997 году численность приблизилась к 20 млн. пользователей. Сегодня компьютер с доступом в интернет есть в каждой европейской и российской семье – и не один.

Цели

С тем, кто изобрел всемирную паутину, разобрались, но у каждого проекта есть конкретные цели. Стояли они и перед научными сотрудниками, разрабатывавшими ARPANET.

Когда в 1966 году Пентагон пригласил Лоуренса Робертса возглавить проект, перед ним следующие задачи:

  1. Изучить способы связи и возможности их поддержания в случае ядерного удара.
  2. Создать концепцию децентрализованного управления на случай войны, что позволило бы нормально функционировать гражданским и военным объектам в случае повреждения нескольких из них.

Понятно, для чего в то время нужна была всемирная паутина. Военному ведомству США требовался такой канал связи, который смог бы работать даже в том случае, если узлы и линии связи были бы разрушены.

Работы, проведенные агентством перспективных исследований ARPA, оказались перспективными. В дальнейшем канал связи, неуязвимый перед ядерными ударами, неоднократно усовершенствовали.

Современность

Сегодня интернет нужен не только военным, а и гражданским. Его активно используют в бизнес-среде, образовании, медицине, финансовом секторе, индустрии красоты и развлечений. Задачи у пользователей разные – общение, обмен информацией, улучшение качества обслуживания и многое другое.

В современном интернете каждый находит что-то свое, но так было не всегда. До 1993 года сеть была скучной, ее функционал ограничивался обменом письмами, чтением новостей и объявлений. Никаких фотографий, видео и картинок не было – только черный шрифт на белом фоне.

Мировое содружество сетей;
♦ что такое World Wide Web;
♦ Web-сервер, Web-страница, Web-сайт;
♦ гиперструктура WWW;
♦ браузер - клиент-программа WWW; проблема поиска информации в Интернете.

Интернет - мировое содружество сетей

Хотелось бы вам заглянуть в резиденцию президента США - Белый дом, или посетить Лувр - крупнейший художественный музей мира, или узнать, какая погода в Антарктиде, или получить сведения о спектаклях, идущих сегодня вечером в московских театрах? Всего этого и многого другого можно достичь, не выходя из-за стола, на котором установлен персональный компьютер, подключенный к мировой сети Интернет.

Интернет объединяет в себе тысячи локальных, отраслевых, региональных компьютерных сетей всего мира. Отдельный пользователь, который не является абонентом какой-то из перечисленных сетей, также может подключиться к Интернету через ближайший узловой центр.

Все перечисленные выше услуги компьютерных сетей (электронная почта , телеконференции, файловые архивы и пр.) работают и в Интернете. При этом могут возникать лишь проблемы языка общения. Языком международного общения в мировой сети является английский. Вот вам еще один стимул старательно изучать английский язык !

Что такое World Wide Web

Самой интересной услугой, предоставляемой пользователям Интернета начиная с 1993 года, стала возможность работы с информационной системой World Wide Web (сокращенно - WWW). Это словосочетание можно перевести как «всемирная паутина». Именно работа с WWW имелась в виду, когда в начале этого параграфа вам предлагались всякие информационные чудеса.

Очень трудно дать точное определение, что такое WWW. Эту систему можно сравнить с огромной энциклопедией, страницы которой разбросаны по компьютерам-серверам, объединенным сетью Интернет. Чтобы получить нужную информацию , пользователь должен добраться до соответствующей страницы энциклопедии. Быть может, имея в виду такую аналогию, создатели WWW ввели понятие Web-страницы.

Web-сервер, Web-страница, Web-сайт

Web-страница - это основная информационная единица WWW. Она представляет собой отдельный документ, хранящийся на Web-сервере. Страница имеет свое имя (подобно номеру страницы в энциклопедии), по которому к ней можно обратиться.

Информация на Web-странице может быть самой разной: текст, рисунок, фотография, мультимедиа . На Web-страницах помещают также рекламу, справочную информацию, научные статьи, последние новости, иллюстрированные издания, художественные каталоги, прогноз погоды и многое, многое другое. Проще сказать: на Web-страницах есть «всё».

Некоторое количество Web-страниц могут быть связаны тематически и образовывать Web-сайт. У каждого сайта есть главная страница, которая называется домашней (Ноmе раgе). Это своеобразный титульный лист, начиная с которого можно просматривать документы, хранящиеся на сервере. Обычно домашняя страница содержит оглавление - названия разделов. Чтобы обратиться к нужному разделу, достаточно подвести указатель мыши к названию раздела и щелкнуть кнопкой мыши .

Гиперструктура WWW

Однако просматривать Web-страницы совсем не обязательно подряд, перелистывая их, как в книге. Важнейшим свойством WWW является гипертекстовая организация связей между Web-страницами. Причем эти связи действуют не только между страницами на одном сервере, но и между разными серверами WWW.

Обычно ключевые слова, от которых идут гиперсвязи, выделяются на Web-странице цветом или подчеркиванием. Щелкнув мышью на таком слове, вы по скрытой ссылке перейдете к просмотру другого документа. Причем этот документ может находиться на другом сервере, в другой стране, на другом континенте. Чаще всего пользователь Интернета понятия не имеет, где находится сервер, с которым он в данный момент общается. Образно говоря, за один сеанс работы можно несколько раз «облететь» вокруг земного шара.

Роль ключа для связи может выполнять не только текст, но и рисунок, фотография, указатель на звуковой документ. В таком случае вместо термина «гипертекст» употребляется термин «гипермедиа».

На одну и ту же Web-страницу можно выйти самыми разными путями. Аналогия со страницами книги здесь уже не работает. В книге страницы имеют определенную последовательность. Web-страницы такой последовательности не имеют. Переход от одной страницы к другой происходит по гиперсвязям, образующим сеть, которая напоминает паутину. Отсюда и происходит название системы.

Обобщая сказанное, можно дать следующее определение:

World Wide Web - это распределенная по всему миру информационная система с гиперсвязями, существующая на технической базе всемирной сети Интернет.

Браузер - клиент-программа WWW. Проблема поиска информации в Интернете

Перемещаться по «паутине» пользователю помогает специальное программное обеспечение, которое называется Web-браузером от английского «browse» - «осматривать, изучать». С помощью браузера нужную информацию можно найти разными способами. Самый короткий путь - с помощью адреса Web-страницы. Вы набираете на клавиатуре этот адрес, нажимаете клавишу ввода и попадаете сразу на место.

Другой путь - поиск. Вы можете начать движение со своей домашней страницы по гиперсвязям. При этом есть опасность не туда уйти, запутаться в «паутине», попасть в тупик. Впрочем браузер позволяет вернуться назад на любое количество шагов, продолжить поиск по другому маршруту. Такой поиск подобен блужданию в незнакомом лесу (правда, менее опасен).

Хорошими помощниками в навигации по WWW являются специальные поисковые программы. Они «знают» всё или почти всё о WWW. Такой программе достаточно указать набор ключевых слов по интересующей вас теме, и она выдаст список ссылок на подходящие Web-документы. Если список окажется слишком длинным, нужно добавить еще какие-нибудь уточняющие термины.

Пользователь Интернета во время сеансов работы в сети сказывается погруженным в информационное пространство с неограниченными ресурсами. В последнее время стал распространенным термин «киберпространство» о под которым понимается вся совокупность мировых систем телекоммуникаций и циркулирующей в них информации.

Система WWW очень быстро развивается. Уже сейчас все ее ресурсы плохо поддаются обзору. Выпускаются толстые справочники, каталоги, которые устаревают быстрее, чем телефонные книги. Поэтому одновременно с увеличение объема информации совершенствуется система поиска в World Wide Web.

Коротко о главном

Интернет - всемирная глобальная компьютерная сеть.

World Wide Web - Всемирная паутина: распределенная по всему миру информационная система с гиперсвязями, существующая на технической базе мировой сети Интернет.

Web-страница - отдельный документ WWW.

Web-сервер - компьютер в сети Интернет, хранящий Web-страницы и соответствующее программное обеспечение, для работы с ними.

Web-сайт - совокупность тематически связанных страниц.

Гипермедиа - система гиперсвязей между мультимедиа документами.

Web-браузер - клиент-программа для работы пользователя с WWW.

Поиск нужного документа в WWW может происходить: путем указания его адреса; путем перемещения по «паутине» гиперсвязей; путем использования поисковых программ.

Киберпространство - совокупность мировых систем телекоммуникаций и циркулирующей в них информации.

Вопросы и задания

1. Что такое Интернет?
2. Как переводится словосочетание «World Wide Web»?
3. Что такое WWW?
4. Какую информацию можно извлечь из WWW?
5. Как организована связь между Web-страницами?
6. В чем аналогия между WWW и паутиной?
7. Что такое гипермедиа?
8. Что такое Web-сервер?
9. Какими методами в WWW можно найти нужную страницу?

И. Семакин, Л. Залогова, С. Русаков, Л. Шестакова, Информатика, 9 класс
Отослано читателями из интернет-сайтов

Вся информатика онлайн, список тем по предметам, сборник конспектов по информатике, домашняя работа , вопросы и ответы, рефераты по информатике 9 класс , планы уроков

Содержание урока конспект урока опорный каркас презентация урока акселеративные методы интерактивные технологии Практика задачи и упражнения самопроверка практикумы, тренинги, кейсы, квесты домашние задания дискуссионные вопросы риторические вопросы от учеников Иллюстрации аудио-, видеоклипы и мультимедиа фотографии, картинки графики, таблицы, схемы юмор, анекдоты, приколы, комиксы притчи, поговорки, кроссворды, цитаты Дополнения рефераты статьи фишки для любознательных шпаргалки учебники основные и дополнительные словарь терминов прочие Совершенствование учебников и уроков исправление ошибок в учебнике обновление фрагмента в учебнике элементы новаторства на уроке замена устаревших знаний новыми Только для учителей идеальные уроки календарный план на год

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.

Мировая информационная паутина

Всемирная паутина -- распределённая система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Для обозначения Всемирной паутины также используют слово «веб» (перевод с английского web означает «паутина») и аббревиатуру WWW. Всемирную паутину образуют сотни миллионов веб-серверов. Большинство ресурсов всемирной паутины основаны на технологии гипертекста. Гипертекстовые документы, размещаемые во Всемирной паутине, называются веб-страницами. Несколько веб-страниц, объединённых общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же веб-сервере, называются веб-сайтом. Для загрузки и просмотра веб-страниц используются специальные программы -- браузеры. Всемирная паутина вызвала настоящую революцию в информационных технологиях и взрыв в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же.

История всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и, в меньшей степени, Роберт Кайо. Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр», которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины. В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина.

Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками, что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал, технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год. В рамках проекта Бернерс-Ли написал первый в мире веб-сервер httpd и первый в мире гипертекстовый веб-браузер, называвшийся WorldWideWeb. Этот браузер был одновременно и WYSIWYG-редактором, его разработка была начата в октябре 1990 года, а закончена в декабре того же года.