логин:    пароль:  [ регистрация ]
MXDA / xda - home / Гугл - большой брат (2)
Еще в рубрике:

- Почувствуй себя настоящим программистом!
- Непридуманная история
- Супер-топменеджер
- Хорошая, плохая, умная…
- Камашитра
- Краткая памятка о сроках по работе с [неразборчиво].
- Все цифры о России…
- Гугл — большой брат (2)

- Протокол SOCKS 5 на русском
- Посадить боинг 767 как планер
- Как я однажды лопухнулся.
- Житьё программиста в США

Гугл - большой брат (2)

Автор: Админ Админыч
Опубликовано: June 21, 2006, 9:29 pm

Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска.
Чтобы понимать, что попадает в Гугл надо иметь представление о топологии Интернета — или, в частном примере, Веба. Это, как выяснили в свое время работы сотрудников Zerox — «малый мир», порожденный случайным степенным графом с показателем степени около -2 (попозже я перепишу из статьи более точную оценку). Графы такого рода (с показателем больше -3.4, если я верно помню) как правило образуют одну гигантскую связную компоненту. Т.е. ВСЕ СВЯЗАНО ссылками СО ВСЕМ для подавляющего большинства веб-страниц (точнее, процентов 80-90, размер гигантской компоненты, которые в теории случайных графов аналитически вычисляется по степени распределения; оценка соответствыет жизни хорошо), причем средний путь от любой страницы А до любой другой Б чрезвычайно короток.
На основе этих работ — и предложенного алгоритма ранжирования страниц — Сергей Брин и его соученик создали свою поисковую машину. В начале они придерживались идеологии GNU и свободного программирования. Теперь Гугл превратился в корпорацию, в пайщиках которой типичные имена первых спекулянтов финансово-властной группировки корпоративной америки, начиная с Киссинджера, и более того, и пайщики, и хозяева в большой части принадлежат этническому еврейскому подмножеству властной элиты [здесь: добавить имена — emdrone]
Гугл когда-то мгновенно стал популярным и выдвинулся на первое место за отказ следовать стратегии других поисковиков, превращавших свои страницы в «порталы» заваленные рекламой и коммерческими ссылками (также если вы, коммерческая организация, платили, они выдвигали ваши страницы на первые места). Гугл также отказывался размещать на первой странице рекламу (ее привычный вид сохранен до сих пор).

Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию.
Отчего? Давайте рассмотрим список претензий, предъявленных ему при номинации на «Большого Брата» (кстати, держа в памяти, что список был составлен не журналистами, а программистами и/или был ими вычитан множество раз и фактология вроде бы не опровергнута):

1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается.
2. ГУГЛ ЗАПИСЫВАЕТ ВСЕ, ЧТО МОЖЕТ — cookie ID, IP адрес, время, дату и т.д. Гугл изменяет результаты в зависимости от IP-адреса (IP delivery based on geolocation)
[Например, насколько я помню один хороший пример, поиск из Германии не покажет ссылки на некоторые сайты, признанные «незаконными». Награды тому, кто догадается что это за сайты не будет, слишком просто — сайты, вскрывающие еврейское холокостничество и переписывание истории Второй Мировой — emdrone]
3. ГУГЛ ХРАНИТ ИНФОРМАЦИЮ ВЕЧНО. Есть свидетельства, что эта информация не просто в каких-то backups, но легко доступна.
4. ГУГЛ НЕ ОТВЕЧАЕТ, ЗАЧЕМ ЕМУ ЭТИ ДАННЫЕ. Запросы об их privacy policies игнорируются. Во время интервью с Сергеем Брином NYTimes (28 ноября 2002), он не стал отвечать на вопрос, используется ли эта информация в судебных запросах.
[По новым положениям акта «Патриот», кстати сам факт сообщения жертве факта поиска по ее private информации является преступлением — emdrone]
5. ГУГЛ НАНИМАЕТ АГЕНТОВ СЕКРЕТНЫХ СЛУЖБ. Мэт Катц (или Каттс), один из главных, старших инженеров, работал на NSA, Агенство Национальной Безопасности. Гугл хочет нанять больше работников имеющих допуски секретности.
6. ГУГЛ TOOLBAR — spyware, программа-шпион. Если включены advanced features, toolbar для майкрософтовского браузера Explorer «звонит» на Гугл каждый раз, когда вы читаете новую страницу, он считывает информацию cookie. Privacy Policy Гугла в этом признается, но только потому что компания Alexa в свое время проиграла судебное дело (class-action lawsuit), и их toolbar делал то же самое. Гугловский toolbar сам себя обновляет устанавливая новые версии не спрашивая вас, хозяина компьютера. Это означает, что если он присутствует на вашем компьютере, Гугл имеет доступ к файлам на вашем диске каждый раз, когда вы соединяетесь с Гуглом. Даже Майкрософт запрашивает, не хотите ли вы сделать upgrade — но не Гугл.
7. ГУГЛ «CACHE COPY» веб-страниц нарушает законы [копирайта, которого мне лично не жалко, но речь сейчас идет шире — о доступе к как он используется корпорацией — emdrone]. После удаления с вебсайта материалы продолжают появляться на Гугле.
8. ГУГЛ СОВСЕМ НЕ ДРУЖЕСТВЕННАЯ СИЛА — сейчас он обладает 75% монополией на внешние ссылки большинства вебсайтов. Вебмастеры не могут не ублажать Гугл если они хотят усилить траффик. Если они ведут себя «неправильно» (например, экспуатируя слабости полу-секретных, полу-известных алгоритмов ранжирования страниц Гуглом), они неожиданно могут обнаружить, что наказаны, и traffic на их сайтах исчезает [т.е. Гугл подправляет ранг их страниц, засовывая в задницу — emdrone]. Гугл не опубликовал никаких стандартов по этим вопросам, для наказанных не существует процессов апелляции. Гугл совершенно не подчинен никому. В большинстве случаев, он просто не отвечает на e-mail’ы вебмастеров.
9 ГУГЛ — БОМБА ЗАМЕДЛЕННОГО ДЕЙСТВИЯ В СМЫСЛЕ ВОПРОСОВ PRIVACY. Обслуживая около 200 миллионов поисков в день, большинство из-за пределов США, гугл — катстрофа, которая может случиться в любой момент. Васхингтонские бюрократы могут только мечтать о той изящной эффективности в сборе данных, которой добился Гугл.


Добавлю от себя.

1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo.

2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее

3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц.
Например, никаким автоматическим сбором информации невозможно объяснить label приставленный к результату гуглопоиска на имя David Irving:

Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about …
www.fpp.co.uk/
[Дословно: "Веб сайт опозорившегося британского отрицателя Холокоста Дейвида Ирвинга. Содержит последние новости о себе … -- второе предложение действительно есть на его сайте. Первое же подставлено евреями работающими в Гугле.
Чтобы понять, отчего он удостоился штучного обращения, надо знать, насколько центральным для холокостников было дело против Ирвинга, историка Второй Мировой, выкапывающего новые документы в архивах вместо переписывания устоявшейся версии истории. Для суда против него этнической мафией — деятелями вроде вложившегося Спилберга — были собраны миллионы (5? 15? не помню, есть на сайте Ирвинга, лень проверять) и куплен за 300-400 тысяч кембриджский профессор истории Эванс]

4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное — достаточно много сайтов наивны в том смысле, что их logins сломаны — прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически — если страница в ответ на запрос по ссылке была создана, она будет сохранена).
Гугл хранит ВСЕ, но чистит отчасти то, что потом предоставляет для поиска простому населению. Компаниям он продает слегка другие услуги. Государству (которо, можно сказать, теперь его почти совладелец) — абсолютно иные.
Кроме того, список претензий еще раз подтверждает, что toolbar или прочие гугловспомогательные программы (какого-нибудь локального поиска вашего PC, которые незаметно для вас делится информацией с Гуглом) действительно «hack» персональные компьютеры до той степени, до какой гуглопрограмма имеет доступ к вашим локальным файлам.

5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности.
OED.

Что произошло с Гуглом можно доходчиво объяснить слегка иначе.
Мы все помним эволюцию ЖЖ: написанный Фитцем «под себя» как проект-хобби, он продолжался в духе открытого программирования и GNU-деклараций. Пока не стал достаточно заметен и куплен. Тут же состоялся пересмотр политики, от деклараций и клятв перед «user community» ничего не осталось, АТ наводит корпоративные порядки по доносам (что я с моим пессимизмом предсказал абсолютно, буквально, еще в январе — запись friends-only, но соврать мне не дадут)

Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.

Версия для печати
Добавить в «любимые обзоры»


Комментарии

Комментариев: 10925
1681 sweesKafroure (гость) 11.05.2009 20:42

Автору спасибо, продолжайте нас радовать!

1682 Fliert (гость) 12.05.2009 00:03

Сенкс за инфу, почитал с интересом

1683 Noffidiolla (гость) 12.05.2009 00:23

Почему на блоге так мало тем про кризис, Вас этот вопрос не волнует?

1684 Сайт посвящен различным браузерам (гость) 12.05.2009 00:36

Знакомство с браузером IE.
Опции печати меню Файл в IE.
Опция «Отправить» в IE.

1685 paurceree (гость) 12.05.2009 03:32

Весьма граммотная запись. Добавил Ваш блог в закладки. Спасибо.

1686 Fliert (гость) 12.05.2009 06:18

Хорошо пишете. Надеюсь, когда-нибудь увижу нечто подобное и на своем блоге…

1687 Fliert (гость) 12.05.2009 06:39

Интересно, а почему так редко блог обновляете?

1688 Momboxabofe (гость) 12.05.2009 09:34

Очень понравилось, даже не ожидала.


1689 Undodubano (гость) 12.05.2009 09:38

очень занимательно было почитать

1690 Momboxabofe (гость) 12.05.2009 09:58

Добрый день всем посетителям этого прекрасного блога. Хочу внести и свой вклад в целую историю положительных отзывов. Как и все остальные пользователи этого блога, я полностью доволен абсолютно всем (что бывает довольно редко, т.к. по профессии я педагог). Скорость работы, навигация, условно понятый интерфейс и целое море положительной информации – моя любимая обстановка. Сегодня я первый раз на этом сайте, но уже готов стать активным его пользователем. Буду рад всем, кто поддержит меня и будет также изо дня в день пользоваться данным блогом.


1691 Undodubano (гость) 12.05.2009 11:49

очень занимательно было почитать

1692 Undodubano (гость) 12.05.2009 16:59

Спасибо за статью.. Актуально мне сейчас.. Взяла себе еще перечитать.

1693 Undodubano (гость) 12.05.2009 17:15

Очень понравилось, даже не ожидала.

1694 Momboxabofe (гость) 12.05.2009 18:24

Отличная подборка! Но мен больше всего понравились


1695 Momboxabofe (гость) 12.05.2009 18:43

Добавил в избранное, очень интересно, спасибо.


1696 Saimmireenal (гость) 13.05.2009 10:01

По моему у Вас украли эту статью и поместили на другом сайте. Я её уже видела.

1697 Saimmireenal (гость) 13.05.2009 10:54

Спасибо огромное. Почитал и понравилось. Картинок бы ещё

1698 TutTucturf (гость) 13.05.2009 11:13

Огромное вам пасибо! а еще посты на эту тему будут в будущем? Очень жду!

1699 TutTucturf (гость) 13.05.2009 12:21

Спасибо огромное. Почитал и понравилось. Картинок бы ещё

1700 Saimmireenal (гость) 13.05.2009 15:49

Опубликовал на своем блоге вашу статью, и напечатол там конечно-же обратную ссылку на вас. Но вот зашел посмотреть поевился ли трекбек, а его нет…

1701 Saimmireenal (гость) 13.05.2009 16:05

Неплохой пост, но много лишнего.

1702 TutTucturf (гость) 13.05.2009 17:51

Интересно, а почему так редко блог обновляете?

1703 TutTucturf (гость) 13.05.2009 18:08

Очень понравилось, даже не ожидала.

1704 exewowdenly (гость) 13.05.2009 22:02

Почему на блоге так мало тем про кризис, Вас этот вопрос не волнует?

1705 Idiota (гость) 14.05.2009 10:07

Благодарю!!!У Вас часто появляются очень интересные посты! Очень поднимаете мое настроение.

1706 IrrargeDes (гость) 14.05.2009 10:46

Ты как обычно радуешь нас своими лучшими фразами спасибо, беру!

1707 Idiota (гость) 14.05.2009 11:00

И да прибудет с нами сила

1708 NeeryixtexSiz (гость) 14.05.2009 11:26

Металлоискатели — металлодетекторы Fisher m-scope. Металлодетекторы купить forum. Магнит поисковый Усилие 110 кг — GARRETT. Металлоискатели, подарки. Металлоискатели любых моделей: металлоискатель купить. Металлоискатели по низким ценам. Металлоискатели любых моделей: металлоискатель garrett. Нужны металлоискатели? Купить металлоискатель Fisher m-scope 1270-x. Купить металлоискатель Whites Prizm IV.
<a href=kondrat-shop.ru/goods-151.html> Металоискатель, собрать металлоискатель. Металоискатель, металлоискатель гроза.
Металлоискатели JJ-Connect — металлоискатель garrett. Металлоискатели C-Scope.

1709 IrrargeDes (гость) 14.05.2009 11:51

большое спасибо!Взяла себе тоже-пригодится.

1710 undexinonging (гость) 14.05.2009 13:04

Очень понравилось, даже не ожидала.

poolsite.ru

Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364


Имя:
E-mail:
Правила:
Разрешены тэги: <b>, <i>, <u>. Если хотите дать ссылку - пишите ее просто: http://... Все поля обязательны. Ваш email на странице отображаться не будет.
Текст сообщения:
rss