Как работает фильтрация в Web

Свернуть
X
 
  • Время
  • Показать
Очистить всё
новые сообщения
  • piligrim2180
    Отключен

    • 07 April 2007
    • 6968

    #1

    Как работает фильтрация в Web

    ************
    Как работает фильтрация в Web

    Web-фильтры отличаются по сложности, детальности, точности, местонахождению и прозрачности. Простые Web-фильтры реализовать легко, но они работают довольно грубо.
    К тому же мотивированные пользователи, как правило, с большей готовностью стремятся обнаружить и обойти их.

    Черные списки IP-адресов и URL


    Простейшие Web-фильтры используют черные списки IP-адресов. Основное их преимущество скорость. Фактически это быстрый поиск в таблице. Именно благодаря высокой скорости такого подхода Web-фильтрацию можно выполнять в сети в «точках блокировки», где собирается трафик, например в шлюзах между смежными национальными сетями. Однако простота черных списков обусловливает и два их главных недостатка. Во-первых, для непрерывного обновления черного списка требуются большие ресурсы. Во-вторых, черный список IP-адресов работает слишком грубо фильтр либо блокирует, либо разрешает весь Web-контент, получаемый с данного IP-адреса.

    Черные списки URL обеспечивают большую детализацию и зачастую реализованы на серверах DNS, которые определяют IP-адреса по именам соответствующих доменов. Когда DNS-сервер получает запрос на разрешение имени, он проверяет наличие данного URL в черном списке. Если этот URL есть в списке, сервер вернет некорректный IP-адрес или IP-адрес по умолчанию. Черный список URL обладает теми же недостатками, что и список IP-адресов, их поддержка и обновление требуют значительных усилий.

    Оба списка можно использовать для фильтров, размещаемых на прокси-сервере, которые часто применяются для локального кэширования Web-контента. В такой кэш-памяти хранится недавно запрошенный контент, и если пользователям он снова требуется, то он передается из кэша прокси-сервера, а не с оригинального сервера. Поскольку весь Web-контент проходит через прокси-сервер, то последний становится очень удобным местом для фильтрации.

    При всех обращениях в Web-фильтры, размещаемые на прокси-сервере, проверяют попадание адреса в черные списки IP-адресов или URL. При обнаружении совпадения фильтр может вернуть «заблокированную страницу» с сообщением об ошибке. В некоторых странах, например в Китае и Иране, пошли еще дальше и блокируют URL, содержащие запрещенные ключевые слова. Однако ключевые слова не всегда точно отражают содержимое соответствующей Web-страницы, например, слово sex в URL содержат многие другие виды сайтов, помимо порнографических, и, наоборот, блокировка URL с таким словом не всегда позволяет отследить порнографические сайты.

    Фильтрация контента


    Фильтрация контента в режиме реального времени на прокси-сервере или на Web-клиенте имеет два важных преимущества перед черными списками IP-адресов или URL. Во-первых, фильтр анализирует Web-контент, когда происходит обращение к странице, и не требует предварительной установки черного списка. Во-вторых, решение о фильтрации принимается для отдельных Web-страниц или даже для элементов внутри них. Однако к фильтру контента предъявляются два сложных и иногда взаимоисключающих требования: он должен обладать достаточным «интеллектом» для того, чтобы распознать нежелательную страницу или контент внутри страницы, и при этом работать довольно быстро. Фильтры контента, как правило, используют методы машинного обучения и искусственного интеллекта для того, чтобы установить, к какой из предопределенных категорий относится данная Web-страница (рис. 1a). Пользователи или сетевые администраторы могут настроить фильтр так, чтобы он блокировал или разрешал доступ для каждой из категорий отдельно. При этом немаловажное значение имеет скорость работы, поскольку пользователям не хватает терпения, и они уходят с сайта, если тот возвращает запрошенный контент слишком медленно.

    Для определения категории Web-страницы интеллектуальные фильтры контента анализируют различные ее элементы, в том числе метаданные, ссылки, текст, изображения и скрипты. Метаданные в заголовке Web-документа могут содержать информацию об авторстве и ключевых словах.

    Анализ ссылок основывается на принципе «виновности в соучастии». Как правило, страницы имеют ссылки на страницы одного и того же типа. Например, новостной сайт, скорее всего, содержит ссылки на другие новостные сайты. Ссылки, приводимые на странице, могут многое сказать о ее теме.

    Текстовый анализ имеет большое значение для фильтров контента, поскольку многие Web-страницы в основном текстовые. Как правило, фильтры контента выполняют грамматический разбор текста, находят ключевые слова и применяют методы машинного обучения для того, чтобы определить наиболее подходящую для данной страницы категорию. Однако этот подход не совершенен без семантического анализа, поскольку иногда трудно понять разные контексты например, преследует ли страница с сексуальным контентом образовательные или порнографические цели.
  • Tessaract
    Сатанист

    • 18 August 2004
    • 6119

    #2
    Ну и что вы хотели сказать этим ликбезом?
    То, что существуют фильтры контента и "черных" IP-адресов это давно известно!
    Человек человеку волк!!!!!!!!!!!!!!!!

    Комментарий

    • Полковник
      Ветеран

      • 14 September 2005
      • 18241

      #3
      Пилли - вернись в свою жалобу и ответь всё же по существу заданного вопроса.

      .
      "Давайте учиться иметь свое мнение, давайте не будем повторять чужое."
      Виктор Суворов

      Комментарий

      • Человече
        Отключен

        • 25 November 2009
        • 2848

        #4
        Ну и я отмечусь

        Комментарий

        • Arigato
          Православный атеист

          • 02 May 2009
          • 6226

          #5
          piligrim2180
          Не беспокойся, о тебе уже давно известно следующее:
          1. Твой IP-адрес
          2. Твой провайдер и его адрес + телефон
          3. Твой домашний адрес
          4. Твой телефон
          5. Твои Ф.И.О.
          6. Твои почтовые ящики
          7. Твоя дата рождения
          8. Модель твоего недобука
          9. Версия твоей операционной системы
          10. Браузер, который ты используешь
          11. Физическое разрешение дисплея матрицы монитора экрана недобука
          12. Твои фотографии

          Да это почти полная инфа о тебе. Мы тут не хакеры и не воры, как тебе хочется нас видеть. Но, знаешь, если эту инфу кинуть на какой-нибудь хакерский форум, интересно, что они с тобой сделают?

          Комментарий

          • MixoID
            R.I.P

            • 09 July 2007
            • 5889

            #6
            Сообщение от Arigato
            Но, знаешь, если эту инфу кинуть на какой-нибудь хакерский форум, интересно, что они с тобой сделают?
            Останется только переслать им с десяток гигабайт голых негров. Приплюсовать к уже на асусе накопленным - получается пятьдесят.

            Комментарий

            • piligrim2180
              Отключен

              • 07 April 2007
              • 6968

              #7
              ************
              Давно уже наблюдаю, на этом форуме, за размещением и последующем удалении, в сообщениях "местных хакеров", вредоносных ссылок.
              Как только появляется новая жертва, эти "особи", начинают её обрабатывать.
              И, чем больше подлостей они совершают, тем больше наглости проявляют.
              Ибо давно чувствуют себя здесь хозяевами.
              Но, наглость их, в конце концов, и позволила выявить их.





              Сеть микроблогинга Twitter сегодня представила новый сервис сканирования внешних ссылок с целью предотвращения попадания пользователей Twitter на мошеннические и вредоносные сайты с вирусами, троянами и шпионским ПО. Как часть нового сервиса, в Twitter была обновлена система маскировки веб-адресов, которая теперь позволяет получать линки на указанный адрес электронной почты.

              Помимо этого, полностью заработал анонимайзер Twt.tl, который также шифрует гиперссылки.

              "За счет перевода всех ссылок, публикуемых в Twitter, через новый сервис, мы можем детектировать, прерывать и предотвращать распространение вредоносных ссылок в сети. Даже если "плохая" ссылка уже есть и пользователь нажмет на нее, она пройдет через систему нотификации и пользователь будет предупрежден", - говорится в блоге Twitter.

              Напомним, что ранее злоумышленники провели несколько масштабных атак против пользователей Twitter, в результате которых у злоумышленников оказались персональные данные блогеров, в частности адреса, телефоны, банковские данные и прочие сведения. До сих пор борьбу со злоумышленниками Twitter в основном осуществлял путем обнуления паролей.

              Комментарий

              • piligrim2180
                Отключен

                • 07 April 2007
                • 6968

                #8
                ************
                Кстати, очень ошиблись местные воры-вредители, когда решили, что публикацией личных данных могут навредить.
                Увы, но уже давно, всяческая мерзость, и звонила, и писала письма с угрозами, так как ни телефон, ни полное имя, ни почта, никогда не скрывались.
                А вот делать себе "рекламу", через публикацию личных данных, - это, для Христианина, не приемлемо.
                Так как подобные публикации, больше похожи на попрошайничество: "помогите, кто чем может", которыми забит интернет.
                Теперь же, приходят письма и звонки, от Христиан, - и, в основном, не только от пользователей данного форума.
                Именно поэтому настоятельно просил местную администрацию, удалять подобную информацию, так как есть много тех, кто больше моего нуждается в реальной поддержке.
                Это и дети сироты, и беспризорники, и дети из неблагополучных семей, которым не всегда удаётся даже поесть досыта.

                Комментарий

                • Arigato
                  Православный атеист

                  • 02 May 2009
                  • 6226

                  #9
                  Сообщение от piligrim2180
                  Именно поэтому настоятельно просил местную администрацию, удалять подобную информацию, так как есть много тех, кто больше моего нуждается в реальной поддержке.
                  Местная администрация - это местная администрация. Однако не удивляйся, если твои данные появятся еще где-нибудь.
                  Перестань писать клевету, ложь и оскорбления. В противном случае данные могут стать общественным достоянием Интернета, расползутся по сети и глазом моргнуть не успеешь. И уж поверь, тогда тебе не только христиане звонить и писать будут.
                  Это не угроза, а предупреждение (последнее), т.к. пора прекращать твое хамство.

                  Комментарий

                  • piligrim2180
                    Отключен

                    • 07 April 2007
                    • 6968

                    #10
                    ************
                    Зло всегда угрожало и будет угрожать.
                    Ибо трусливо зло в своих подлостях.
                    А обличённое зло, тем более.

                    ************
                    Давно уже наблюдаю, на этом форуме, за размещением и последующем удалении, в сообщениях "местных хакеров", вредоносных ссылок.

                    Как только появляется новая жертва, эти "особи", начинают её обрабатывать.
                    И, чем больше подлостей они совершают, тем больше наглости проявляют.
                    Ибо давно чувствуют себя здесь хозяевами.
                    Но, наглость их, в конце концов, и позволила выявить их.

                    Комментарий

                    • Arigato
                      Православный атеист

                      • 02 May 2009
                      • 6226

                      #11
                      Можешь обличать кого хочешь, вот только по хорошему прошу, что бы ты убрал всю клевету, когда ты говоришь о конкретных людях (обо мне в частности), т.к. ни каких доказательств у тебя нет, ибо ложь все то, что ты про меня (и других форумчан) тут написал.
                      Если ты не понимаешь, во что это может для тебя вылиться, то мне тебя жаль. Еще раз повторю: это не угроза, а просьба. Но если ты проигнорируешь мою просьбу - пеняй на себя, т.к. я не потерплю клевету в свой адрес.

                      Комментарий

                      • piligrim2180
                        Отключен

                        • 07 April 2007
                        • 6968

                        #12
                        ************
                        Зло всегда угрожало и будет угрожать.

                        Ибо трусливо зло в своих подлостях.
                        А обличённое зло, тем более.

                        ************
                        Давно уже наблюдаю, на этом форуме, за размещением и последующем удалении, в сообщениях "местных хакеров", вредоносных ссылок.

                        Как только появляется новая жертва, эти "особи", начинают её обрабатывать.
                        И, чем больше подлостей они совершают, тем больше наглости проявляют.
                        Ибо давно чувствуют себя здесь хозяевами.
                        Но, наглость их, в конце концов, и позволила выявить их.

                        Комментарий

                        • MixoID
                          R.I.P

                          • 09 July 2007
                          • 5889

                          #13
                          Из черного:

                          Как-то раз к нам заходил
                          Некро-педо-зоофил,
                          Мертвых, маленьких зверушек
                          Он с собою приносил...

                          Комментарий

                          • Tessaract
                            Сатанист

                            • 18 August 2004
                            • 6119

                            #14
                            Ух-ты, а Пилигримма-то отключили, ну хоть немного человек отдохнет и глядишь успокоится!
                            Человек человеку волк!!!!!!!!!!!!!!!!

                            Комментарий

                            • Полковник
                              Ветеран

                              • 14 September 2005
                              • 18241

                              #15
                              Давно уже наблюдаю, на этом форуме, за размещением и последующем удалении, в сообщениях "местных хакеров", вредоносных ссылок.
                              ---


                              Чувак так и не смог объяснить, что такое вредоносная ссылка. А я у него спрашивал, вежливо.

                              Раз, так, то он этого не знает, ну раз не смог объяснить.

                              Раз не знает, то и отличить не может.

                              И, следовательно его заявление, есть клевета.

                              Статья, однако.

                              .
                              "Давайте учиться иметь свое мнение, давайте не будем повторять чужое."
                              Виктор Суворов

                              Комментарий

                              Обработка...