|
Еще в рубрике: - Почувствуй себя настоящим программистом! - Непридуманная история - Супер-топменеджер - Хорошая, плохая, умная… - Камашитра - Краткая памятка о сроках по работе с [неразборчиво]. - Все цифры о России… - Гугл большой брат (2) - Протокол SOCKS 5 на русском - Посадить боинг 767 как планер - Как я однажды лопухнулся. - Житьё программиста в США |
Гугл - большой брат (2)
Автор: Админ Админыч
Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска. Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию. 1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается. 1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo. 2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее 3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц. Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about … 4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное достаточно много сайтов наивны в том смысле, что их logins сломаны прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически если страница в ответ на запрос по ссылке была создана, она будет сохранена). 5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности. Что произошло с Гуглом можно доходчиво объяснить слегка иначе. Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.
Версия для печати КомментарииКомментариев: 10917
1651
QuorryApors (гость)
08.05.2009 23:46
Автору спасибо, продолжайте нас радовать!
1652
Ensueteextige (гость)
09.05.2009 01:50
1653
Wrogentego (гость)
09.05.2009 04:15
Хорошо пишете. Надеюсь, когда-нибудь увижу нечто подобное и на своем блоге…
1654
Wrogentego (гость)
09.05.2009 04:32
Опубликовал на своем блоге вашу статью, и напечатол там конечно-же обратную ссылку на вас. Но вот зашел посмотреть поевился ли трекбек, а его нет…
1655
VopvefApone (гость)
09.05.2009 11:26
Ага, теперь ясно… А то я не сразу поняла где тут связь с названием…
1656
gallHattcinc (гость)
09.05.2009 11:29
большое спасибо!Взяла себе тоже-пригодится.
1657
insatomit (гость)
09.05.2009 16:38
Здравствуйте! Прошу прощения, что пишу не совсем в тему. Я тоже использую Вордпресс для своего блога и у меня возник вопрос, как настроить новую тему. Поиск на официальном сайте ничего не дал, там только пользовательские настройки рассматривают, а мне нужно, видимо, шаблоны править. Не подскажете, где почитать?
1658
gallHattcinc (гость)
09.05.2009 17:16
Ты как обычно радуешь нас своими лучшими фразами спасибо, беру!
1659
gallHattcinc (гость)
09.05.2009 22:27
На Ваш блог знакомый в аську ссылку кинул. Оказалось ,что не зря Понравилось. Тепрь постоянно читать буду
1660
gallHattcinc (гость)
09.05.2009 22:43
Вот решил вам немного помочь и послал этот пост в социальные закладки. Очень надеюсь ваш рейтинг возрастет.
1661
kononin (гость)
10.05.2009 00:34
Так зачитался, что пропустил бы любимую передачу
1662
gutspeels (гость)
10.05.2009 02:01
Автор, почему так хило обновляете сайт?
1663
warixssert (гость)
10.05.2009 04:42
Лучшие фильмы онлайн на <a href=warix.ru>сериалы онлайн Не проходи мимо!
1664
warixssert (гость)
10.05.2009 05:11
Лучшие фильмы онлайн на <a href=warix.ru>смотреть фильмы онлайн Не проходи мимо!
1665
warixssert (гость)
10.05.2009 07:06
Лучшие фильмы онлайн на <a href=warix.ru>сериалы онлайн Не проходи мимо!
1666
warixssert (гость)
10.05.2009 07:14
Лучшие фильмы онлайн на <a href=warix.ru>Фильмы онлайн Не проходи мимо!
1667
kneernmon (гость)
10.05.2009 13:31
Супер статья! Подписался на RSS, буду следить =)
1668
Soreawava (гость)
10.05.2009 17:23
Почему на блоге так мало тем про кризис, Вас этот вопрос не волнует?
1669
ForexxTrader (гость)
10.05.2009 17:50
Советую автору установить плагин «Akismet», иначе у тебя спама набралось потрясающе много.
1670
Кордия (гость)
10.05.2009 19:46
Интересно тут у вас
1671
insineNak (гость)
11.05.2009 00:05
Где аргументы?
1672
Itasoumuts (гость)
11.05.2009 00:49
Огромное вам пасибо! а еще посты на эту тему будут в будущем? Очень жду!
1673
gajets (гость)
11.05.2009 01:17
Блог очень интересный, но на rss что-то подписаться не могу. Посмотрите настройки пожалуйста)
1674
Itasoumuts (гость)
11.05.2009 01:44
Очень понравилось, даже не ожидала.
1675
Itasoumuts (гость)
11.05.2009 06:49
Можно и подискутировать по этому поводу …
1676
Itasoumuts (гость)
11.05.2009 07:04
Спасибо вам за сайт, очень полезный ресурс, мне очень нравится
1677
totsKanuava (гость)
11.05.2009 07:58
Где аргументы?
1678
Fliert (гость)
11.05.2009 10:00
а вот вопросик можно? У вас время после поста указано. Это московское? Заранее спасибо!
1679
gajets (гость)
11.05.2009 12:57
Прочёл.Поржал =))
1680
gajets (гость)
11.05.2009 16:06
Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363
У вас RSS в кривой кодировке!
|