![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Рассмотрим тривиальную задачу, заключающуюся в публикации на нашем сайте текущего курса доллара. Для начала следует определиться с источником информации. Курс доллара в Интернете публикуется практически везде, например, на главной странице агентства «РосБизнесКонсалтинг». Среди представленных там многочисленных показателей выбираем курс ЦБ РФ.
Импортирование информации из внешних источников – достаточно распространенный прием, применяемый многими вебмастерами. Эта информация извлекается непосредственно из НТМL-страниц поставщиков контента, и технология извлечения очень проста.
Прежде всего следует тщательно изучить структуру исходного документа и найти в нем интересующие нас сведения (в простейшем случае они будут представлены обычной текстовой строкой). Затем нужно записать фрагменты НТМL-кода до и после полезных данных таким образом, чтобы эти фрагменты однозначно идентифицировали их место положение в документе. Программа, импортирующая информацию из внешнего источника, должна загрузить оттуда НТМL-страницу целиком, просканировать на наличие указанных фрагментов и взять для дальнейшей обработки то, что находится между ними. Кроме того, для того чтобы не просматривать всю страницу, имеет смысл определить также границы блока, в рамках которого будет осуществляться поиск.
Дата публикования: 2015-03-26; Прочитано: 378 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!