логин:    пароль:  [ регистрация ]
MXDA / xda - home / Гугл - большой брат (2)
Еще в рубрике:

- Почувствуй себя настоящим программистом!
- Непридуманная история
- Супер-топменеджер
- Хорошая, плохая, умная…
- Камашитра
- Краткая памятка о сроках по работе с [неразборчиво].
- Все цифры о России…
- Гугл — большой брат (2)

- Протокол SOCKS 5 на русском
- Посадить боинг 767 как планер
- Как я однажды лопухнулся.
- Житьё программиста в США

Гугл - большой брат (2)

Автор: Админ Админыч
Опубликовано: June 21, 2006, 9:29 pm

Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска.
Чтобы понимать, что попадает в Гугл надо иметь представление о топологии Интернета — или, в частном примере, Веба. Это, как выяснили в свое время работы сотрудников Zerox — «малый мир», порожденный случайным степенным графом с показателем степени около -2 (попозже я перепишу из статьи более точную оценку). Графы такого рода (с показателем больше -3.4, если я верно помню) как правило образуют одну гигантскую связную компоненту. Т.е. ВСЕ СВЯЗАНО ссылками СО ВСЕМ для подавляющего большинства веб-страниц (точнее, процентов 80-90, размер гигантской компоненты, которые в теории случайных графов аналитически вычисляется по степени распределения; оценка соответствыет жизни хорошо), причем средний путь от любой страницы А до любой другой Б чрезвычайно короток.
На основе этих работ — и предложенного алгоритма ранжирования страниц — Сергей Брин и его соученик создали свою поисковую машину. В начале они придерживались идеологии GNU и свободного программирования. Теперь Гугл превратился в корпорацию, в пайщиках которой типичные имена первых спекулянтов финансово-властной группировки корпоративной америки, начиная с Киссинджера, и более того, и пайщики, и хозяева в большой части принадлежат этническому еврейскому подмножеству властной элиты [здесь: добавить имена — emdrone]
Гугл когда-то мгновенно стал популярным и выдвинулся на первое место за отказ следовать стратегии других поисковиков, превращавших свои страницы в «порталы» заваленные рекламой и коммерческими ссылками (также если вы, коммерческая организация, платили, они выдвигали ваши страницы на первые места). Гугл также отказывался размещать на первой странице рекламу (ее привычный вид сохранен до сих пор).

Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию.
Отчего? Давайте рассмотрим список претензий, предъявленных ему при номинации на «Большого Брата» (кстати, держа в памяти, что список был составлен не журналистами, а программистами и/или был ими вычитан множество раз и фактология вроде бы не опровергнута):

1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается.
2. ГУГЛ ЗАПИСЫВАЕТ ВСЕ, ЧТО МОЖЕТ — cookie ID, IP адрес, время, дату и т.д. Гугл изменяет результаты в зависимости от IP-адреса (IP delivery based on geolocation)
[Например, насколько я помню один хороший пример, поиск из Германии не покажет ссылки на некоторые сайты, признанные «незаконными». Награды тому, кто догадается что это за сайты не будет, слишком просто — сайты, вскрывающие еврейское холокостничество и переписывание истории Второй Мировой — emdrone]
3. ГУГЛ ХРАНИТ ИНФОРМАЦИЮ ВЕЧНО. Есть свидетельства, что эта информация не просто в каких-то backups, но легко доступна.
4. ГУГЛ НЕ ОТВЕЧАЕТ, ЗАЧЕМ ЕМУ ЭТИ ДАННЫЕ. Запросы об их privacy policies игнорируются. Во время интервью с Сергеем Брином NYTimes (28 ноября 2002), он не стал отвечать на вопрос, используется ли эта информация в судебных запросах.
[По новым положениям акта «Патриот», кстати сам факт сообщения жертве факта поиска по ее private информации является преступлением — emdrone]
5. ГУГЛ НАНИМАЕТ АГЕНТОВ СЕКРЕТНЫХ СЛУЖБ. Мэт Катц (или Каттс), один из главных, старших инженеров, работал на NSA, Агенство Национальной Безопасности. Гугл хочет нанять больше работников имеющих допуски секретности.
6. ГУГЛ TOOLBAR — spyware, программа-шпион. Если включены advanced features, toolbar для майкрософтовского браузера Explorer «звонит» на Гугл каждый раз, когда вы читаете новую страницу, он считывает информацию cookie. Privacy Policy Гугла в этом признается, но только потому что компания Alexa в свое время проиграла судебное дело (class-action lawsuit), и их toolbar делал то же самое. Гугловский toolbar сам себя обновляет устанавливая новые версии не спрашивая вас, хозяина компьютера. Это означает, что если он присутствует на вашем компьютере, Гугл имеет доступ к файлам на вашем диске каждый раз, когда вы соединяетесь с Гуглом. Даже Майкрософт запрашивает, не хотите ли вы сделать upgrade — но не Гугл.
7. ГУГЛ «CACHE COPY» веб-страниц нарушает законы [копирайта, которого мне лично не жалко, но речь сейчас идет шире — о доступе к как он используется корпорацией — emdrone]. После удаления с вебсайта материалы продолжают появляться на Гугле.
8. ГУГЛ СОВСЕМ НЕ ДРУЖЕСТВЕННАЯ СИЛА — сейчас он обладает 75% монополией на внешние ссылки большинства вебсайтов. Вебмастеры не могут не ублажать Гугл если они хотят усилить траффик. Если они ведут себя «неправильно» (например, экспуатируя слабости полу-секретных, полу-известных алгоритмов ранжирования страниц Гуглом), они неожиданно могут обнаружить, что наказаны, и traffic на их сайтах исчезает [т.е. Гугл подправляет ранг их страниц, засовывая в задницу — emdrone]. Гугл не опубликовал никаких стандартов по этим вопросам, для наказанных не существует процессов апелляции. Гугл совершенно не подчинен никому. В большинстве случаев, он просто не отвечает на e-mail’ы вебмастеров.
9 ГУГЛ — БОМБА ЗАМЕДЛЕННОГО ДЕЙСТВИЯ В СМЫСЛЕ ВОПРОСОВ PRIVACY. Обслуживая около 200 миллионов поисков в день, большинство из-за пределов США, гугл — катстрофа, которая может случиться в любой момент. Васхингтонские бюрократы могут только мечтать о той изящной эффективности в сборе данных, которой добился Гугл.


Добавлю от себя.

1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo.

2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее

3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц.
Например, никаким автоматическим сбором информации невозможно объяснить label приставленный к результату гуглопоиска на имя David Irving:

Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about …
www.fpp.co.uk/
[Дословно: "Веб сайт опозорившегося британского отрицателя Холокоста Дейвида Ирвинга. Содержит последние новости о себе … -- второе предложение действительно есть на его сайте. Первое же подставлено евреями работающими в Гугле.
Чтобы понять, отчего он удостоился штучного обращения, надо знать, насколько центральным для холокостников было дело против Ирвинга, историка Второй Мировой, выкапывающего новые документы в архивах вместо переписывания устоявшейся версии истории. Для суда против него этнической мафией — деятелями вроде вложившегося Спилберга — были собраны миллионы (5? 15? не помню, есть на сайте Ирвинга, лень проверять) и куплен за 300-400 тысяч кембриджский профессор истории Эванс]

4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное — достаточно много сайтов наивны в том смысле, что их logins сломаны — прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически — если страница в ответ на запрос по ссылке была создана, она будет сохранена).
Гугл хранит ВСЕ, но чистит отчасти то, что потом предоставляет для поиска простому населению. Компаниям он продает слегка другие услуги. Государству (которо, можно сказать, теперь его почти совладелец) — абсолютно иные.
Кроме того, список претензий еще раз подтверждает, что toolbar или прочие гугловспомогательные программы (какого-нибудь локального поиска вашего PC, которые незаметно для вас делится информацией с Гуглом) действительно «hack» персональные компьютеры до той степени, до какой гуглопрограмма имеет доступ к вашим локальным файлам.

5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности.
OED.

Что произошло с Гуглом можно доходчиво объяснить слегка иначе.
Мы все помним эволюцию ЖЖ: написанный Фитцем «под себя» как проект-хобби, он продолжался в духе открытого программирования и GNU-деклараций. Пока не стал достаточно заметен и куплен. Тут же состоялся пересмотр политики, от деклараций и клятв перед «user community» ничего не осталось, АТ наводит корпоративные порядки по доносам (что я с моим пессимизмом предсказал абсолютно, буквально, еще в январе — запись friends-only, но соврать мне не дадут)

Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.

Версия для печати
Добавить в «любимые обзоры»


Комментарии

Комментариев: 10925
1471 Deanda (гость) 16.04.2009 14:34

Добавил в свои закладки. Теперь буду вас намного почаще читать!

1472 kneernmon (гость) 17.04.2009 01:04

Можно ли взять одну картинку с Вашего блога? Очень понравилась. Линк на Вас есстественно поставлю.


1473 Arionmadysto (гость) 17.04.2009 08:57

У вас на сайте символы как квадратики- исправьте, ато хочется прочитать


1474 Impobami (гость) 17.04.2009 10:25

А у вас пара ошибок в тексте… тока не обижайтесь )

1475 lepeamutle (гость) 17.04.2009 10:55

На Ваш блог знакомый в аську ссылку кинул. Оказалось ,что не зря Понравилось. Тепрь постоянно читать буду

1476 Impobami (гость) 17.04.2009 11:28

Можно и подискутировать по этому поводу …

1477 lepeamutle (гость) 17.04.2009 12:01

вы шутите…21 век на дворе, неужели нет ничего достойного внимания, как энциклопедия.Милые мои, вот нет снега в
гордах, это тоже тема и история, пересмотрите темы.Я почту просматриваю, мне шлют не пойми что, не знаю кто, столько мусора, может оно и нужно, но не в дневнике.Я так понимаю, дневник это часть твоей души.Нам дается право выбирать — пользуйтесь. А информация бесполезной не бывает

1478 Impobami (гость) 17.04.2009 16:13

А Вы не задумывались о том, чтобы параллельно завести еще один блог, на смежную тему? У Вас неплохо получается

1479 Impobami (гость) 17.04.2009 16:29

Ваш пост навел меня на думки *ушел много думать* …

1480 RalaFuede (гость) 17.04.2009 16:38

Почему на блоге так мало тем про кризис, Вас этот вопрос не волнует?

1481 RalaFuede (гость) 17.04.2009 18:56

Автору спасибо, продолжайте нас радовать!

1482 lepeamutle (гость) 17.04.2009 19:05

Да уж. В этом блоге хоть комментаторы нормальные.. А то пишут обычно в комментарии ерунду всякую.

1483 lepeamutle (гость) 17.04.2009 19:22

Ценные рекомендации, беру на заметку

1484 duggefly (гость) 18.04.2009 11:29

Огромное вам человеческое спасибо, очень актуальная заметка.

1485 duggefly (гость) 18.04.2009 12:24

У вас RSS в кривой кодировке!

1486 Anaetatry (гость) 18.04.2009 13:29

Подписался на rss

1487 duggefly (гость) 18.04.2009 17:16

Огромное вам человеческое спасибо, очень актуальная заметка.

1488 duggefly (гость) 18.04.2009 17:32

По правде говоря, сначала не очень то до конца понял, но перечитав второй раз дошло — спасибо!

1489 Познавательная информация о DVD-плеерах (гость) 18.04.2009 21:36

Если Вы любите фильмов, тогда Вам необходим DVD-плеер. Он позволяет смотреть фильмы на дисках в лучшем качестве видео и звука.
Также на дисках хранится больше информации, они более долговечные и экономичнее. познавательную информацию о DVD-плеерах, устройстве DVD-диска, скорости вращения дисков, возможностях однократной и многократной записи дисков можно узнать на сайте dvdplays.ru

1490 cogbrirl (гость) 18.04.2009 21:58

вы шутите…21 век на дворе, неужели нет ничего достойного внимания, как энциклопедия.Милые мои, вот нет снега в
гордах, это тоже тема и история, пересмотрите темы.Я почту просматриваю, мне шлют не пойми что, не знаю кто, столько мусора, может оно и нужно, но не в дневнике.Я так понимаю, дневник это часть твоей души.Нам дается право выбирать — пользуйтесь. А информация бесполезной не бывает

1491 cogbrirl (гость) 18.04.2009 23:38

вы шутите…21 век на дворе, неужели нет ничего достойного внимания, как энциклопедия.Милые мои, вот нет снега в
гордах, это тоже тема и история, пересмотрите темы.Я почту просматриваю, мне шлют не пойми что, не знаю кто, столько мусора, может оно и нужно, но не в дневнике.Я так понимаю, дневник это часть твоей души.Нам дается право выбирать — пользуйтесь. А информация бесполезной не бывает

1492 cogbrirl (гость) 19.04.2009 06:06

А Вы не задумывались о том, чтобы параллельно завести еще один блог, на смежную тему? У Вас неплохо получается

1493 cogbrirl (гость) 19.04.2009 06:31

Интересно, а почему так редко блог обновляете?

1494 Подробная информация о DVD-плеерах на dvdpleers.ru (гость) 19.04.2009 08:41

Если Вы любитель смотреть фильмы, тогда Вам просто необходим DVD-плеер. Он дает возможность просматривать фильмы на дисках в наилучшем качестве видео и звука. Кроме этого на дисках хранится больше информации, они долговечнее и экономичные. Подробную информацию о DVD-плеерах, устройстве DVD-диска, скорости вращения дисков, возможностях однократной и многократной записи дисков можно узнать на нашем сайте.
<a href=dvdpleers.ru>Познавательная информация о устройстве DVD-диска

1495 inhibiosmops (гость) 19.04.2009 13:23

очень занимательно было почитать

1496 luckysms (гость) 19.04.2009 13:57

Давайте лучше о приколах поговорим, а то не только ж яше прикалываться

1497 inhibiosmops (гость) 19.04.2009 14:24

Опубликовал на своем блоге вашу статью, и напечатол там конечно-же обратную ссылку на вас. Но вот зашел посмотреть поевился ли трекбек, а его нет…

1498 inhibiosmops (гость) 19.04.2009 19:04

очень занимательно было почитать

1499 inhibiosmops (гость) 19.04.2009 19:20

Можно и подискутировать по этому поводу …

1500 luckysms (гость) 19.04.2009 20:06

Давайте лучше о приколах поговорим, а то не только ж яше прикалываться

Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364


Имя:
E-mail:
Правила:
Разрешены тэги: <b>, <i>, <u>. Если хотите дать ссылку - пишите ее просто: http://... Все поля обязательны. Ваш email на странице отображаться не будет.
Текст сообщения:
rss