Ваша строчка здесь

Использование метаданных при создании HTML документов



META-таги имеют два возможных атрибута



- <META HTTP-EQUIV="имя" CONTENT="содержимое">

- <META NAME="имя" CONTENT="содержимое">


META-таги должны находиться в заголовке
HTML-документа между <HEAD> и </HEAD> (особенно
это важно для документов, использующих
фреймы).


Атрибут HTTP-EQUIV


META-таги с атрибутом HTTP-EQUIV эквивалентны
HTTP-заголовкам. Обычно они управляют
действиями броузеров и могут быть
использованы для совершенствования
информации, выдаваемой обычными
заголовками. Таги такой формы могут дать
такой же эффект, что и HTTP-заголовки, и на
некоторых серверах автоматически могут
быть переведены в настоящие HTTP-заголовки.
HTTP-заголовки описываются в RFC1945 (HTTP/1.0) и
RFC2068 (HTTP/1.1).


HTTP-заголовки могут быть сгенерированы
с помощью CGI-скриптов. Это позволяют
сделать серверы Apache и CERN. В других
серверах могут использоваться другие
механизмы генерирования заголовков.
Некоторые генерируемые сервером поля
заголовков не могут быть подменены
значениями из META-тагов (в частности Date),
другие подменяются только при
ненормальном статус-коде (<>200). Когда
заголовок не понятен, то значение HTTP-заголовка
превалирует над значением META-тагов.


Expires


Источники: HTTP/1.1 (RFC2068)


Дата устаревания. Управление
кэшированием в HTTP/1.0. В Netscape Navigator это
выглядит следующим образом: если
указанная дата прошла, то очередной
запрос этого документа вызывает
повторный сетевой запрос, а не подгрузку
документа из кэша. Дата со значением
"0" интерпретируется как "сейчас".
Такое значение заставляет броузер
каждый раз при запросе проверять -
изменялся ли этот документ. Это, кстати
относится и к прокси-агентам. Поисковые
роботы могут либо совсем не
индексировать такой документ, либо
постоянно "обнюхивать" его.


Дата должна быть задана в формате,
описываемом в RFC850,


<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997
08:21:57 GMT">


что эквивалентно HTTP-заголовку


Expires: Wed, 26 Feb 1997 08:21:57 GMT


Pragma


Контроль кэширования для HTTP/1.0.
Значением должно быть "no-cache". Очень
полезный контейнер, я всегда использую
его при выдаче результатов работы
любого скрипта.


Content-Type


Источники: HTTP/1.0 (RFC1045)


Указание типа документа. Может быть
расширено указанием кодировки страницы
(charset). Если же указывать charset в
содержании META-тага, то Netscape Navigator выводит
такую страницу уже в заданном charset.
Однако будьте аккуратны, если текст
страницы в кодировке Windows, а значение
charset=KOI8-r, то никакими силами
пользователь не сможет поменять encoding,
чтобы увидеть нормальные слова!


<META HTTP-EQUIV="Content-type" CONTENT="text/html;
charset=ISO-2022-JP">


Content-language


Источники: HTTP/1.0


Указание языка документа. Может
использоваться поисковыми машинами при
индексировании страниц. Комбинация поля
Accept-Language (посылаемого броузером) с
содержимым Content-language может быть условием
выбора сервером того или иного языка.


<META HTTP-EQUIV="Content-language" CONTENT="en-GB">


что эквивалентно HTTP-заголовку


В недавно вышедшей спецификации HTML 4.0
появилась другая возможность явного
указания языка - <html lang="en">


Content-language: en-GB


Язык описывается парой значений (язык-диалект).
В примере: Английский-Великобритания


Refresh


Источники: Netscape


Определение задержки в секундах, после
которой броузер автоматически
обновляет документ. Дополнительная
возможность - автоматическая загрузка
другого документа.


<META HTTP-EQUIV="Refresh" Content="3, URL=http://www.name.com/page.html">


что эквивалентно HTTP-заголовку


Refresh: 3; URL=http://www.name.com/page.html


В Netscape Navigator это дает такой же эффект,
что и нажатие на кнопку Reload.


Window-target


Источники: Jahn Rentmeister


Определяет окно текущей страницы;
может быть использован для прекращения
появления новых окон броузера при
применении фреймовых структур.
Действует для многих (но не для всех)
броузеров.


<META HTTP-EQUIV="Window-target" CONTENT="_top">


что эквивалентно HTTP-заголовку


Window-target: _top


Ext-cache


Источники: Netscape


Определяет имя альтернативного кэша
для Netscape Navigator


<META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db;
istructions=User Instructions">


PICS-Label


Platform-Independant Content rating Scheme. Обычно
используется для определения рейтинга
"взрослости" (adult) содержания (sex,violence,
...):-)) однако это довольно гибкая схема и
может использоваться для других целей.


Cache-Control


Источники: HTTP/1.1


Определяет действия кэша по отношению
к данному документу. Возможные значения:


  • Public - документ кэшируется в доступных
    для всех кэшах
  • Private - только в частном кэше
  • no-cache - не может быть кэширован
  • no-store - может быть кэширован, но не
    сохраняется


Vary


Источники: HTTP/1.1


Определяет доступные альтернативы для
указанных в CONTENT полей HTTP-заголовка.


<META HTTP-EQUIV="Vary" CONTENT="Content-language">


что эквивалентно HTTP-заголовку


Vary: Content-language


Lotus


Lotus-редакторы генерируют свои
собственные поля Bulletin-Date и Bulletin-Text
атрибуты. Bulletin-Text содержит описание
документа





Атрибут NAME



META-таги с атрибутом NAME используются в
случаях, когда поля не соотносятся с HTTP-заголовками.
Иногда ясность теряется: некоторые
агенты могут интерпретировать таг "Keywords"
описанный как NAME, другие - как HTTP-EQUIV


Robots


Источники: Spidering


Управление индексацией страницы для
поисковых роботов.


<META NAME="Robots" CONTENT="NOINDEX,FOLLOW">


Возможные значения:


  • ALL
  • NONE
  • INDEX
  • NOINDEX
  • FOLLOW
  • NOFOLLOW


Description


Источники: Spidering, Altavista, Infoseek


Краткая аннотация содержания
документа. Используется поисковыми
системами для описания документа. Этот
таг сильно полезен в случаях, когда в
документе мало текста, когда это
управляющий фреймами файл (frameset) или в
начале документа используются скрипты.
Длина текста до 100 символов.


<META NAME="Description" CONTENT="Документ
содержит словарь META-тагов">


Keywords


Источники: Altavista, Infoseek


Используется поисковыми системами для
индексирования документа. Обычно здесь
указываются синонимы к словам в
заголовке (title) или альтернативный
заголовок. Длина списка до 1000 символов.
Не допускается использование одного и
того же ключевого слова более 7 раз,
поисковые системы просто будут
игнорировать это слово.


<META NAME="Keywords" CONTENT="таги,тэги,метаданные,список">


Document-state


Источники: Spidering


Управление индексацией страницы для
поисковых роботов. Определяет частоту
индексации - или один раз индексировать,
или реиндексировать документ регулярно.


<META NAME="Document-state" CONTENT="Static">


Возможные значения:


  • Static
  • Dynamic


URL


Источники: Spidering


Управление индексацией страницы для
поисковых роботов. Определяет частоту
индексации - или один раз индексировать,
или реиндексировать документ регулярно.


<META NAME="URL" CONTENT="absolute_url">


Author


Источники: HTML редакторы


Обычно имя автора, формат произвольный.


Generator


Источники: HTML редакторы


Обычно название и версия редактора, с
помощью которого создана эта страница.
Может быть использована для определения
доли рынка, занимаемого тем или иным
продуктом.


Copyright


Источники: HTML редакторы


Обычно описание авторских прав на
документ в произвольном формате


Distribution


Возможные значения


  • global
  • local
  • iu (internal use)


Resource-type


Текущее состояние данного файла. Важен
для поисковых систем, т.е. если его
значение document, то поисковая система
приступает к его индексированию.


Прочие


  • Classification
  • Formatter
  • Site-languages
  • Version
  • Template
  • Operator
  • Rating
  • Creation
  • Host
  • Document
  • Subject
  • Build
  • Random text (<META NAME="Joe Smith">)


Помимо перечисленных более или менее
стандартных тагов существует еще
множество других специализированных,
например, для конкретной поисковой
машины тагов.





Таг LINK



Таг LINK предоставляет документу
независимый от среды метод определения
отношения данного документа к другим
документам и ресурсам Сети.
Используется с аргументами REL и REV. С
помощью тага LINK можно:


  • создавать в документе специальные
    навигационные кнопки или меню
  • управлять процессом отображения
    набора HTML файлов в печатные документы
  • привязывать такие ассоциированные
    ресурсы, как таблицы стилей и скрипты
  • предоставлять альтернативные формы
    для данного документа


<LINK rel=help href="http://www.name.com/help.html">


где http://www.name.com/help.html - страница помощи
по данному документу.


Атрибуты REL и REV могут также
использоваться с тагом A. Таги LINK могут
использоваться только в заголовке
документа (head)


Атрибут REL


HTML 3.2 REL-таги


top, contents, index, glossary, copyright, next, previous, search


Некоторые из рекомендованных типов
взаимосвязей:


rel=top
Данная связь указывает на вершину в некой иерархической структуре, например на первую, либо титульную страницу в неком наборе документов.
rel=contents
Данная связь указывает на некий файл, где приводится оглавление к данному документу.
rel=index
Данная связь указывает на другой документ, который можно использовать в целях индексного поиска по текущему документу.
rel=glossary
Данная связь указывает на некий документ, где содержится глоссарий терминов, относящихся к текущему документу.
rel=copyright
Данная связь ссылается на текст, где указаны авторские права на данный документ.
rel=next
Данная связь указывает на следующий документ в неком заранее предопределенном маршруте просмотра. Например, она может использоваться для упреждающей автоматической загрузки браузером следующей страницы.
rel=previous
Данная связь ссылается на предыдущий документ в неком предопределенном маршруте просмотра.
rel=help
Данная связь указывает на документ, предлагающий некую помощь, например это может быть текст, дающий более развернутое описание и предлагающий ссылки на другие документы по этой теме. Назначение этой связи - оказание помощи тем читателям, кто потерял свой путь в Web.
rel=search
Данная ссылка ведет к поисковой странице, контролирующей некий набор страниц, связанных общей темой.







Многие системы изобретают свои
дополнительные значения аргументов
REL и REV

  • Таг Schema
    Этот таг содержит URL
    документа-шаблона. Действие всех
    метаданных из документа-шаблона
    будут распространены на документ
    с тагом Schema (так работает Dublin Core).

    <META NAME="VW96.objecttype"
    CONTENT="Dictionary">

    <LINK REL=SCHEMA.VW96 HREF="http://vancouver-webpages.com/VWbot/VW96-schema.html">

    ViewCall REL-таги

    home, bookmark, tickertape, vmail, icon,
    prefetch, keyn, fastxx

    AOLpress REL-таги

    AOLpress использует
    несколько дополнительных, по
    сравнению с HTML 3.2, тагов

    Home, ToC, Index, Glossary, Copyright, Up,
    Next, Previous, Help, Bookmark, First, Last




Атрибут REV


Используется в конструкции LINK для
индикации обратного соотношения
документов.


<LINK rev=help href="http://www.name.com/index.html">


где текущая страница является
страницей помощи для документа http://www.name.com/index.html


Использование <LINK rev=made href="mailto:document-owner">
в случае использования Lynx вызовет
автоматическую отсылку почты по адресу
document-owner.





Таг BASE


Этот таг определяет для данного
документа базовый адрес URL, который
затем будет использоваться для
переопределения относительных адресов.
Таг BASE полезен, если документ может быть
скопирован в другое место или запрошен
по другому пути с использованием
символической ссылки, или редиректа с
imagemap, и т.д.

Комментариев нет:

Отправить комментарий