Используемая терминология

Словарь терминов

В проекте используются следующие понятия:

URL - Единый указатель ресурсов (англ. URL - Uniform (или Universal) Resource Locator) - единообразный локатор (определитель местонахождения) ресурса. URL - это стандартизированный способ записи адреса ресурса в сети Интернет. Подробнее...

Белый список (от англ. whitelist) - уайтлист - механизм ограничения доступа на основании списка объектов, запрещает доступ ко всем объектам, кроме указанных в списке.>

Блэклист (от англ. blacklist или block list) - черный список - механизм ограничения доступа на основании списка объектов, который разрешает доступ ко всем объектам, кроме перечисленных в списке. См. также Белый список.

Запаркованный сайт (парковка, parked site) - сайт, не имеющий своего собственного уникального контента, и содержащий (обычно) рекламные ссылки. Владелец такого сайта получает доход от переходов посетителей по ссылкам. Существуют компании, специализирующиеся на создании и поддержании сетей запаркованных доменов (parking.nic.ru, sedoparking.com и прочие). Примеры:wanhailine.comworldcup2006.com.

Ошибка первого рода - понятие, используемое для оценки качества статистических гипотез, интерпретируется как ложное срабатывание критерия. В нашем случае под ошибкой первого рода мы понимаем ситуацию, когда сайт не содержащий порнографических материалов, оценивается автоматикой как порнографический.

Ошибка второго рода - понятие, используемое для оценки качества статистических гипотез, интерпретируется как пропуск события. В нашем случае под ошибкой второго рода мы понимаем ситуацию, когда сайт содержащий порнографические материалы, оценивается автоматикой как не порнографический.

Порнография - непосредственное, вульгарно-натуралистическое изображение или словесное описание половых органов и полового акта, имеющее целью сексуальное возбуждение.

Рейт - оценка, выставленная человеком (рейтером), либо автоматической экспертной системой.

Рейтер - аналитик, эксперт, просматривающий сайты и относящий их к определенным категориям.

Категория сайта - тематика, соответствующая определению категории (см. Определения используемых категорий). Выделяется две группы категорий:

  • однозначные (strict) - четко, строго определяемые категории - используются для оценивания сайта как рейтером, так и экспертной системой
    • Porn - порнография
    • Not Porn - не порнография
  • неоднозначные - промежуточные категории - используются для оценивания только рейтером.
    • Adult - сайты для взрослых
    • Sex Shop - магазины товаров для секса
    • Sex education - образовательные сайты сексуальной направленности
    • Sex Health - медицинские сайты сексуальной направленности
    • Not Enough Content - скрытая "техническая" категория, подразумевающая недостаточность содержаний для отнесения сайта к какой-либо категории.