Computer Review#16(88)

Интернет - не паутина, а трубы, ядро, мысы, острова...

О том, как в Интернете ходит информация, и что из этого следует

Помимо ставшего привычным сравнения Интернета с паутиной, иногда его также сравнивают с коммуникациями современного города, в котором всегда найдутся пути-дорожки между любыми двумя жителями. Здесь есть широкие проспекты и маленькие улочки, лабиринты переулков и закрытые дворики... Это красивая метафора, но, думается, что более точным будет другое сравнение. Хотя Интернет и не является строго иерархической сетью, основу ее все же составляет замкнутая система информационных "трубопроводов" с большим сечением и высокой скоростью передачи информации (сотни и тысячи мегабит в секунду). Это так называемые бэкбоны (backbone) - становой хребет Сети. В узлах Сети находятся провайдеры мирового уровня, или, продолжая аналогию, распределительные станции трубопроводов. К ним подключаются трубопроводы нижнего - национального или государственного уровня. Они имеют "трубы" меньшего диаметра, и скорости передачи информации в них пониже. Это бэкбоны национального уровня, а их распределительные станции представляют провайдеров того же уровня. Следуя этой схеме далее, обнаружим провайдеров регионального уровня и субпровайдеров более низких уровней.

Как же должны подключаться к Сети мы, конечные пользователи? В принципе, подключение производится, исходя из территориальной близости, но при этом, как вы догадываетесь, лучше выбирать провайдера как можно ближе к самой широкой трубе: "заторы" в ней менее вероятны. И очевидно, что у распределительной информационной станции (провайдера) сумма диаметров входных труб "снизу" должна согласовываться суммой диаметров выходных труб "наверх". То есть провайдер, набравший сто клиентов, у каждого из которых модем, скажем, 33,6 Кбит/сек, и имеющий канал "наружу" пропускной способностью 128 Кбит/сек, может обеспечить этим клиентам не World Wide Web, а только World Wide Wait, т.е. "всемирно распространенное ожидание". Значит, выбирая провайдера, желательно знать, какая доля пропускной способности его внешних каналов приходится на одного клиента. По американским источникам считается, что оптимальным является соотношение от 1 к 3 до 1 к 5. Тогда провайдер из нашего примера не должен набирать больше девятнадцати клиентов до тех пор, пока он не обзаведется каналом с большей пропускной способностью. Почему именно девятнадцати? Посчитаем. 19 х 33,6 = 638,4. 638,4: 128 = 4,99. То есть соотношение 1 к 4,99. Понятно, что пример наш условен (у всех клиентов одинаковые и устаревшие модемы), но принцип выбора провайдера он поясняет.

О том, где находится, откуда и куда ходит информация, и что из этого следует

Каковы особенности информационных потоков в Интернете? Этому вопросу были посвящены исследования Интернета, которые проводили специалисты IBM, Compaq и AltaVista (напомним, что оборудование и поисковые технологии этих компаний работают на всех уровнях Сети). В мае и октябре 1999 года они проанализировали при помощи web-навигатора AltaVista свыше 200 млн. web-страниц и 1,5 млрд. ссылок, размещенных на этих страницах. Такая выборка - только часть всех страниц в вебе (по оценкам, их больше миллиарда), но во всех предыдущих исследованиях фигурировало не более 40 млн. страниц, так что представительность выборки выросла многократно.

Что же обнаружилось в результате этих масштабных изысканий? Оказалось, что Интернет - вовсе не паутина, равномерно покрывающая человечество и состоящая из web-страниц и связей между ними. Выяснилось, что эти самые web-страницы можно разделить на несколько категорий, именно в зависимости от того, как они связаны между собой и с остальной Сетью.

ЦЕНТРАЛЬНОЕ ЯДРО Интернета составляют web-страницы, взаимосвязанные так тесно, что, следуя ссылкам, с любой из них в конечном счете можно попасть на любую другую. Примером могут служить страницы IBM.com и MSNBC.com. Размер ЯДРА составляет около 30% исследованных страниц.

ОТПРАВНЫЕ СТРАНИЦЫ (около 24%) содержат ссылки, которые в конечном счете ведут к ядру, но из ядра к ним попасть нельзя. Примером может служить личная страничка о домашних животных со ссылками на онлайновые клубы любителей кошек.

ОКОНЕЧНЫЕ СТРАНИЦЫ составляют тоже около 24%. К ним можно прийти по ссылкам из ядра, но нельзя вернуться назад. Один из примеров - научные отчеты, зарытые в глубине университетских или корпоративных сайтов.

ИЗОЛИРОВАННЫЕ СТРАНИЦЫ (22%) полностью изолированы от центрального ядра. Это либо "мысы", связанные ссылками со страницами любой другой категории, либо "перешейки", соединяющие страницы, не входящие в ядро, либо "острова", которые вообще не пересекаются с остальным Интернетом. Примером такого "острова" может служить группа студентов или семейные web-страницы, связанные исключительно друг с другом. Единственный способ обнаружить их - знать адрес. Никакие поисковые машины не смогут найти эти острова, если они в прошлом каким-то образом не соединялись с "большим" Интернетом.

Интересно, что исследователи обнаружили: пропорции этих четырех категорий с мая по октябрь прошлого года оставались неизменными, несмотря на значительное увеличение общего числа web-страниц.

Предыдущие исследования структуры или топологии Сети дали основание предполагать, что большинство случайно выбранных пар web-страниц отделяют друг от друга в среднем примерно 19 кликов. Проведенный эксперимент выявил гораздо более детальную и сложную картину. Оказывается, значительная часть веба вообще отделена от других его крупных частей! В остальных случаях попасть с одной страницы на другую подчас можно лишь ценой сотен кликов. А с вероятностью 75% такие случайно выбранные страницы вообще никак не связаны. Когда же путь все-таки существует, среднее количество кликов составляет 16. А если этот путь двусторонний, то оно сокращается до 7.

Сказанное выше следует учитывать, если вы хотите, чтобы ваша страничка попалась на глаза как можно большему количеству людей. Например, сайтам электронной коммерции, как показало исследование, важно находиться на основных путях веба: их ссылки должны вести как извне внутрь, так и изнутри наружу. "Отправным" сайтам могут потребоваться дополнительные усилия, чтобы облегчить их поиск для web-навигаторов. Естественно, нужно стремиться к тому, чтобы оказаться внутри тесно связанного ядра веба, а не в какой-то внешней области. Иначе представление о том, что миллионы людей в Интернете могут получить доступ к вашей информации, окажется лишь иллюзией.

Сделанные выводы помогут определить новые стратегии web-серфинга. Сейчас большинство людей пользуется поисковыми машинами для того, чтобы найти конкретные сайты или темы. Но такие механизмы, как AltaVista и Google, позволяют также искать страницы, связанные с данной. Например, любители домашних животных могут выбрать все сайты, указывающие на магазин, где продается какая-нибудь живность. Подобные инструменты способны превратить веб в систему двустороннего движения.

Дмитрий Соломонов,
г.Днепропетровск, Украина


Computer Review#16(88)

Copyright © 1998 "Компьютерное обозрение"
Поддержка - "Иркутский Издательский Дом" - www.iid.irk.ru
Дизайн - leidenwebdesign - http://leiden.irkutsk.ru