|
Еще в рубрике: - Почувствуй себя настоящим программистом! - Непридуманная история - Супер-топменеджер - Хорошая, плохая, умная… - Камашитра - Краткая памятка о сроках по работе с [неразборчиво]. - Все цифры о России… - Гугл большой брат (2) - Протокол SOCKS 5 на русском - Посадить боинг 767 как планер - Как я однажды лопухнулся. - Житьё программиста в США |
Гугл - большой брат (2)
Автор: Админ Админыч
Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска. Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию. 1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается. 1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo. 2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее 3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц. Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about … 4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное достаточно много сайтов наивны в том смысле, что их logins сломаны прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически если страница в ответ на запрос по ссылке была создана, она будет сохранена). 5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности. Что произошло с Гуглом можно доходчиво объяснить слегка иначе. Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.
Версия для печати КомментарииКомментариев: 10926
1801
Assownelababe (гость)
27.05.2009 04:26
1802
мepтвeц (гость)
27.05.2009 04:32
Текст по настоящему понравился, особенно здесь последний абзац хорош
1803
FoodBlog (гость)
27.05.2009 04:45
<a href=foodlab.ru>Все про еду
1804
Neksskymn (гость)
27.05.2009 04:46
Твоя страничка прекрасная, всему офису интересно было читать
1805
FoodBlog (гость)
27.05.2009 05:12
<a href=foodlab.ru>Все про еду
1806
FoodBlog (гость)
27.05.2009 07:07
<a href=foodlab.ru>Все про еду
1807
FoodBlog (гость)
27.05.2009 07:13
<a href=foodlab.ru>Все про еду
1808
exewowdenly (гость)
27.05.2009 10:37
Автору спасибо, продолжайте нас радовать!
1809
andrometten (гость)
27.05.2009 12:45
Интересно было почитать. Думаю у Вас скоро появится группа постоянных посетителей
1810
reigmadisrers (гость)
27.05.2009 16:52
1811
parabellum (гость)
27.05.2009 20:18
Все-таки, подобное не всем интересно. Хотя, каждому свое.
1812
reigmadisrers (гость)
27.05.2009 22:03
1813
reigmadisrers (гость)
27.05.2009 23:11
Я тоже иногда такое замечала, но как-то раньше не придавала этому значения.
1814
reigmadisrers (гость)
27.05.2009 23:49
1815
reigmadisrers (гость)
28.05.2009 00:01
1816
kneernmon (гость)
28.05.2009 00:54
Если это не большой секрет
1817
reigmadisrers (гость)
28.05.2009 00:57
1818
reigmadisrers (гость)
28.05.2009 01:15
1819
reigmadisrers (гость)
28.05.2009 01:17
1820
BumLulkymut (гость)
28.05.2009 02:19
Сенкс. Интересно, и вообще полезный у Вас блог
1821
reigmadisrers (гость)
28.05.2009 05:26
1822
NewebMan (гость)
28.05.2009 05:58
<a href=serialix.ru>Фильмы онлайн
1823
reigmadisrers (гость)
28.05.2009 06:01
1824
reigmadisrers (гость)
28.05.2009 09:28
1825
porosenochek (гость)
28.05.2009 10:28
Ну вот, дожился… Скоро за монитором буду проводить больше времени, чем с девушкой ((
1826
reigmadisrers (гость)
28.05.2009 10:44
1827
reigmadisrers (гость)
28.05.2009 11:22
1828
reigmadisrers (гость)
28.05.2009 11:39
1829
reigmadisrers (гость)
28.05.2009 11:41
1830
reigmadisrers (гость)
28.05.2009 11:44
Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364
|