логин:    пароль:  [ регистрация ]
MXDA / xda - home / Гугл - большой брат (2)
Еще в рубрике:

- Почувствуй себя настоящим программистом!
- Непридуманная история
- Супер-топменеджер
- Хорошая, плохая, умная…
- Камашитра
- Краткая памятка о сроках по работе с [неразборчиво].
- Все цифры о России…
- Гугл — большой брат (2)

- Протокол SOCKS 5 на русском
- Посадить боинг 767 как планер
- Как я однажды лопухнулся.
- Житьё программиста в США

Гугл - большой брат (2)

Автор: Админ Админыч
Опубликовано: June 21, 2006, 9:29 pm

Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска.
Чтобы понимать, что попадает в Гугл надо иметь представление о топологии Интернета — или, в частном примере, Веба. Это, как выяснили в свое время работы сотрудников Zerox — «малый мир», порожденный случайным степенным графом с показателем степени около -2 (попозже я перепишу из статьи более точную оценку). Графы такого рода (с показателем больше -3.4, если я верно помню) как правило образуют одну гигантскую связную компоненту. Т.е. ВСЕ СВЯЗАНО ссылками СО ВСЕМ для подавляющего большинства веб-страниц (точнее, процентов 80-90, размер гигантской компоненты, которые в теории случайных графов аналитически вычисляется по степени распределения; оценка соответствыет жизни хорошо), причем средний путь от любой страницы А до любой другой Б чрезвычайно короток.
На основе этих работ — и предложенного алгоритма ранжирования страниц — Сергей Брин и его соученик создали свою поисковую машину. В начале они придерживались идеологии GNU и свободного программирования. Теперь Гугл превратился в корпорацию, в пайщиках которой типичные имена первых спекулянтов финансово-властной группировки корпоративной америки, начиная с Киссинджера, и более того, и пайщики, и хозяева в большой части принадлежат этническому еврейскому подмножеству властной элиты [здесь: добавить имена — emdrone]
Гугл когда-то мгновенно стал популярным и выдвинулся на первое место за отказ следовать стратегии других поисковиков, превращавших свои страницы в «порталы» заваленные рекламой и коммерческими ссылками (также если вы, коммерческая организация, платили, они выдвигали ваши страницы на первые места). Гугл также отказывался размещать на первой странице рекламу (ее привычный вид сохранен до сих пор).

Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию.
Отчего? Давайте рассмотрим список претензий, предъявленных ему при номинации на «Большого Брата» (кстати, держа в памяти, что список был составлен не журналистами, а программистами и/или был ими вычитан множество раз и фактология вроде бы не опровергнута):

1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается.
2. ГУГЛ ЗАПИСЫВАЕТ ВСЕ, ЧТО МОЖЕТ — cookie ID, IP адрес, время, дату и т.д. Гугл изменяет результаты в зависимости от IP-адреса (IP delivery based on geolocation)
[Например, насколько я помню один хороший пример, поиск из Германии не покажет ссылки на некоторые сайты, признанные «незаконными». Награды тому, кто догадается что это за сайты не будет, слишком просто — сайты, вскрывающие еврейское холокостничество и переписывание истории Второй Мировой — emdrone]
3. ГУГЛ ХРАНИТ ИНФОРМАЦИЮ ВЕЧНО. Есть свидетельства, что эта информация не просто в каких-то backups, но легко доступна.
4. ГУГЛ НЕ ОТВЕЧАЕТ, ЗАЧЕМ ЕМУ ЭТИ ДАННЫЕ. Запросы об их privacy policies игнорируются. Во время интервью с Сергеем Брином NYTimes (28 ноября 2002), он не стал отвечать на вопрос, используется ли эта информация в судебных запросах.
[По новым положениям акта «Патриот», кстати сам факт сообщения жертве факта поиска по ее private информации является преступлением — emdrone]
5. ГУГЛ НАНИМАЕТ АГЕНТОВ СЕКРЕТНЫХ СЛУЖБ. Мэт Катц (или Каттс), один из главных, старших инженеров, работал на NSA, Агенство Национальной Безопасности. Гугл хочет нанять больше работников имеющих допуски секретности.
6. ГУГЛ TOOLBAR — spyware, программа-шпион. Если включены advanced features, toolbar для майкрософтовского браузера Explorer «звонит» на Гугл каждый раз, когда вы читаете новую страницу, он считывает информацию cookie. Privacy Policy Гугла в этом признается, но только потому что компания Alexa в свое время проиграла судебное дело (class-action lawsuit), и их toolbar делал то же самое. Гугловский toolbar сам себя обновляет устанавливая новые версии не спрашивая вас, хозяина компьютера. Это означает, что если он присутствует на вашем компьютере, Гугл имеет доступ к файлам на вашем диске каждый раз, когда вы соединяетесь с Гуглом. Даже Майкрософт запрашивает, не хотите ли вы сделать upgrade — но не Гугл.
7. ГУГЛ «CACHE COPY» веб-страниц нарушает законы [копирайта, которого мне лично не жалко, но речь сейчас идет шире — о доступе к как он используется корпорацией — emdrone]. После удаления с вебсайта материалы продолжают появляться на Гугле.
8. ГУГЛ СОВСЕМ НЕ ДРУЖЕСТВЕННАЯ СИЛА — сейчас он обладает 75% монополией на внешние ссылки большинства вебсайтов. Вебмастеры не могут не ублажать Гугл если они хотят усилить траффик. Если они ведут себя «неправильно» (например, экспуатируя слабости полу-секретных, полу-известных алгоритмов ранжирования страниц Гуглом), они неожиданно могут обнаружить, что наказаны, и traffic на их сайтах исчезает [т.е. Гугл подправляет ранг их страниц, засовывая в задницу — emdrone]. Гугл не опубликовал никаких стандартов по этим вопросам, для наказанных не существует процессов апелляции. Гугл совершенно не подчинен никому. В большинстве случаев, он просто не отвечает на e-mail’ы вебмастеров.
9 ГУГЛ — БОМБА ЗАМЕДЛЕННОГО ДЕЙСТВИЯ В СМЫСЛЕ ВОПРОСОВ PRIVACY. Обслуживая около 200 миллионов поисков в день, большинство из-за пределов США, гугл — катстрофа, которая может случиться в любой момент. Васхингтонские бюрократы могут только мечтать о той изящной эффективности в сборе данных, которой добился Гугл.


Добавлю от себя.

1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo.

2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее

3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц.
Например, никаким автоматическим сбором информации невозможно объяснить label приставленный к результату гуглопоиска на имя David Irving:

Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about …
www.fpp.co.uk/
[Дословно: "Веб сайт опозорившегося британского отрицателя Холокоста Дейвида Ирвинга. Содержит последние новости о себе … -- второе предложение действительно есть на его сайте. Первое же подставлено евреями работающими в Гугле.
Чтобы понять, отчего он удостоился штучного обращения, надо знать, насколько центральным для холокостников было дело против Ирвинга, историка Второй Мировой, выкапывающего новые документы в архивах вместо переписывания устоявшейся версии истории. Для суда против него этнической мафией — деятелями вроде вложившегося Спилберга — были собраны миллионы (5? 15? не помню, есть на сайте Ирвинга, лень проверять) и куплен за 300-400 тысяч кембриджский профессор истории Эванс]

4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное — достаточно много сайтов наивны в том смысле, что их logins сломаны — прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически — если страница в ответ на запрос по ссылке была создана, она будет сохранена).
Гугл хранит ВСЕ, но чистит отчасти то, что потом предоставляет для поиска простому населению. Компаниям он продает слегка другие услуги. Государству (которо, можно сказать, теперь его почти совладелец) — абсолютно иные.
Кроме того, список претензий еще раз подтверждает, что toolbar или прочие гугловспомогательные программы (какого-нибудь локального поиска вашего PC, которые незаметно для вас делится информацией с Гуглом) действительно «hack» персональные компьютеры до той степени, до какой гуглопрограмма имеет доступ к вашим локальным файлам.

5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности.
OED.

Что произошло с Гуглом можно доходчиво объяснить слегка иначе.
Мы все помним эволюцию ЖЖ: написанный Фитцем «под себя» как проект-хобби, он продолжался в духе открытого программирования и GNU-деклараций. Пока не стал достаточно заметен и куплен. Тут же состоялся пересмотр политики, от деклараций и клятв перед «user community» ничего не осталось, АТ наводит корпоративные порядки по доносам (что я с моим пессимизмом предсказал абсолютно, буквально, еще в январе — запись friends-only, но соврать мне не дадут)

Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.

Версия для печати
Добавить в «любимые обзоры»


Комментарии

Комментариев: 10926
1441 griple (гость) 12.04.2009 15:58

Ваш сайт в опере не очень то корректо показывается, а так все отлично! спасибки вам за умные мысли!

1442 soksantarbob (гость) 13.04.2009 01:53

Я бы сказала о монументальности, грандиозности некоторых сюжетов. А назвала бы — «нефильтрованный реал». На мой взгляд, красота — это все-таки другое: лучшее, чистое, избранное, заставляющее трепетать и поражаться. Можно найти красоту во всем, но всё скопом — не есть красота. Имхо.

1443 soksantarbob (гость) 13.04.2009 02:49

Ты как обычно радуешь нас своими лучшими фразами спасибо, беру!

1444 soksantarbob (гость) 13.04.2009 07:37

очень занимательно было почитать

1445 soksantarbob (гость) 13.04.2009 07:52

Опубликовал на своем блоге вашу статью, и напечатол там конечно-же обратную ссылку на вас. Но вот зашел посмотреть поевился ли трекбек, а его нет…

1446 griple (гость) 13.04.2009 13:36

Огромное вам пасибо! а еще посты на эту тему будут в будущем? Очень жду!

1447 griple (гость) 13.04.2009 14:42

Ценные рекомендации, беру на заметку

1448 SexLabel (гость) 14.04.2009 00:55

Вау, тут настоящая война спам ботов :) давайте еше пишите!

1449 chuvachok (гость) 14.04.2009 03:10

С тебя бутылка! Пока тут все читал, от удивления голово ебнулся об стол и разбил (голову в смысле).

1450 Petimmaxia (гость) 14.04.2009 03:46

Спасибо. Просто спасибо, за красивые мысли вслух. В цитатник.

1451 Petimmaxia (гость) 14.04.2009 04:41

Огромное вам пасибо! а еще посты на эту тему будут в будущем? Очень жду!

1452 Фотостудия 'Эксклюзив' (гость) 14.04.2009 09:09

Фотоагенство

1453 Petimmaxia (гость) 14.04.2009 09:16

Огромное вам человеческое спасибо, очень актуальная заметка.

1454 Petimmaxia (гость) 14.04.2009 09:32

По правде говоря, сначала не очень то до конца понял, но перечитав второй раз дошло — спасибо!

1455 griple (гость) 15.04.2009 00:10

Огромное вам человеческое спасибо, очень актуальная заметка.

1456 griple (гость) 15.04.2009 00:27

Опутеть как интересно, во задвигаете. Класс!

1457 Oxisee (гость) 15.04.2009 07:05

Классная статья, кстати автору хочу предложить установить от яндекс.денег фишку на сайт „Дай рубль“. Я бы дал, так сказать на поддержание.

1458 Oxisee (гость) 15.04.2009 08:00

Интересно, а почему так редко блог обновляете?

1459 Oxisee (гость) 15.04.2009 12:24

Чёрт возьми! Круто!Вы Сами ответили.Беру в цитник! Смысл жизни и всё остальное. Решено.Без шуток.

1460 Oxisee (гость) 15.04.2009 12:39

Добавил в свои закладки. Теперь буду вас намного почаще читать!

1461 Фотостудия 'СОЮЗ' (гость) 16.04.2009 01:46

Рекламная фотостудия

1462 prersonure (гость) 16.04.2009 02:06

У вас RSS в кривой кодировке!

1463 prersonure (гость) 16.04.2009 03:39

Можно и подискутировать по этому поводу …

1464 Deanda (гость) 16.04.2009 08:57

Очень интересно!!! Только не очень могу понять как часто обновляется ваш блог?

1465 mandarinchik (гость) 16.04.2009 09:00

С дуба падали листья ясеня, я сказал тогда — нихуя себе. Так это про вас ))

1466 Deanda (гость) 16.04.2009 09:51

Классно всё: и картинка ,и информация

1467 Фотопортал (гость) 16.04.2009 11:17

Фотопортал с отличной коллекцией специально отобранных фото.

1468 prersonure (гость) 16.04.2009 11:26

Классная статья, кстати автору хочу предложить установить от яндекс.денег фишку на сайт „Дай рубль“. Я бы дал, так сказать на поддержание.

1469 prersonure (гость) 16.04.2009 11:43

Спасибо за статью.. Актуально мне сейчас.. Взяла себе еще перечитать.

1470 Deanda (гость) 16.04.2009 14:18

По правде говоря, сначала не очень то до конца понял, но перечитав второй раз дошло — спасибо!

Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364


Имя:
E-mail:
Правила:
Разрешены тэги: <b>, <i>, <u>. Если хотите дать ссылку - пишите ее просто: http://... Все поля обязательны. Ваш email на странице отображаться не будет.
Текст сообщения:
rss