логин:    пароль:  [ регистрация ]
MXDA / xda - home / Гугл - большой брат (2)
Еще в рубрике:

- Почувствуй себя настоящим программистом!
- Непридуманная история
- Супер-топменеджер
- Хорошая, плохая, умная…
- Камашитра
- Краткая памятка о сроках по работе с [неразборчиво].
- Все цифры о России…
- Гугл — большой брат (2)

- Протокол SOCKS 5 на русском
- Посадить боинг 767 как планер
- Как я однажды лопухнулся.
- Житьё программиста в США

Гугл - большой брат (2)

Автор: Админ Админыч
Опубликовано: June 21, 2006, 9:29 pm

Во-первых, ситуация возникает в силу алгоритма работу Гугла: он crawls по всем веб-страницам (ссылкам типа href и src), сохраняет их копии на своих машинах, а затем обрабатывает и выставляет (очищенную часть) их для поиска.
Чтобы понимать, что попадает в Гугл надо иметь представление о топологии Интернета — или, в частном примере, Веба. Это, как выяснили в свое время работы сотрудников Zerox — «малый мир», порожденный случайным степенным графом с показателем степени около -2 (попозже я перепишу из статьи более точную оценку). Графы такого рода (с показателем больше -3.4, если я верно помню) как правило образуют одну гигантскую связную компоненту. Т.е. ВСЕ СВЯЗАНО ссылками СО ВСЕМ для подавляющего большинства веб-страниц (точнее, процентов 80-90, размер гигантской компоненты, которые в теории случайных графов аналитически вычисляется по степени распределения; оценка соответствыет жизни хорошо), причем средний путь от любой страницы А до любой другой Б чрезвычайно короток.
На основе этих работ — и предложенного алгоритма ранжирования страниц — Сергей Брин и его соученик создали свою поисковую машину. В начале они придерживались идеологии GNU и свободного программирования. Теперь Гугл превратился в корпорацию, в пайщиках которой типичные имена первых спекулянтов финансово-властной группировки корпоративной америки, начиная с Киссинджера, и более того, и пайщики, и хозяева в большой части принадлежат этническому еврейскому подмножеству властной элиты [здесь: добавить имена — emdrone]
Гугл когда-то мгновенно стал популярным и выдвинулся на первое место за отказ следовать стратегии других поисковиков, превращавших свои страницы в «порталы» заваленные рекламой и коммерческими ссылками (также если вы, коммерческая организация, платили, они выдвигали ваши страницы на первые места). Гугл также отказывался размещать на первой странице рекламу (ее привычный вид сохранен до сих пор).

Все это в прошлом. В 2003м Гугл был выдвинут на награду «Большой Брат». Совсем недавно он вышел с IPO (Initial Public Offer), спекуляция оказалась чрезвычайно успешной. Гугл превратился в про-правительственную корпорацию.
Отчего? Давайте рассмотрим список претензий, предъявленных ему при номинации на «Большого Брата» (кстати, держа в памяти, что список был составлен не журналистами, а программистами и/или был ими вычитан множество раз и фактология вроде бы не опровергнута):

1. БЕССМЕРТНЫЕ COOKIES. Гугл был первым поисковиком оставлявшим на машинах пользователей cookie со сроком уничтожения в 2-38 году. Повторные заходы и поиск вас идентифицируют; информация о ваши поисках собирается.
2. ГУГЛ ЗАПИСЫВАЕТ ВСЕ, ЧТО МОЖЕТ — cookie ID, IP адрес, время, дату и т.д. Гугл изменяет результаты в зависимости от IP-адреса (IP delivery based on geolocation)
[Например, насколько я помню один хороший пример, поиск из Германии не покажет ссылки на некоторые сайты, признанные «незаконными». Награды тому, кто догадается что это за сайты не будет, слишком просто — сайты, вскрывающие еврейское холокостничество и переписывание истории Второй Мировой — emdrone]
3. ГУГЛ ХРАНИТ ИНФОРМАЦИЮ ВЕЧНО. Есть свидетельства, что эта информация не просто в каких-то backups, но легко доступна.
4. ГУГЛ НЕ ОТВЕЧАЕТ, ЗАЧЕМ ЕМУ ЭТИ ДАННЫЕ. Запросы об их privacy policies игнорируются. Во время интервью с Сергеем Брином NYTimes (28 ноября 2002), он не стал отвечать на вопрос, используется ли эта информация в судебных запросах.
[По новым положениям акта «Патриот», кстати сам факт сообщения жертве факта поиска по ее private информации является преступлением — emdrone]
5. ГУГЛ НАНИМАЕТ АГЕНТОВ СЕКРЕТНЫХ СЛУЖБ. Мэт Катц (или Каттс), один из главных, старших инженеров, работал на NSA, Агенство Национальной Безопасности. Гугл хочет нанять больше работников имеющих допуски секретности.
6. ГУГЛ TOOLBAR — spyware, программа-шпион. Если включены advanced features, toolbar для майкрософтовского браузера Explorer «звонит» на Гугл каждый раз, когда вы читаете новую страницу, он считывает информацию cookie. Privacy Policy Гугла в этом признается, но только потому что компания Alexa в свое время проиграла судебное дело (class-action lawsuit), и их toolbar делал то же самое. Гугловский toolbar сам себя обновляет устанавливая новые версии не спрашивая вас, хозяина компьютера. Это означает, что если он присутствует на вашем компьютере, Гугл имеет доступ к файлам на вашем диске каждый раз, когда вы соединяетесь с Гуглом. Даже Майкрософт запрашивает, не хотите ли вы сделать upgrade — но не Гугл.
7. ГУГЛ «CACHE COPY» веб-страниц нарушает законы [копирайта, которого мне лично не жалко, но речь сейчас идет шире — о доступе к как он используется корпорацией — emdrone]. После удаления с вебсайта материалы продолжают появляться на Гугле.
8. ГУГЛ СОВСЕМ НЕ ДРУЖЕСТВЕННАЯ СИЛА — сейчас он обладает 75% монополией на внешние ссылки большинства вебсайтов. Вебмастеры не могут не ублажать Гугл если они хотят усилить траффик. Если они ведут себя «неправильно» (например, экспуатируя слабости полу-секретных, полу-известных алгоритмов ранжирования страниц Гуглом), они неожиданно могут обнаружить, что наказаны, и traffic на их сайтах исчезает [т.е. Гугл подправляет ранг их страниц, засовывая в задницу — emdrone]. Гугл не опубликовал никаких стандартов по этим вопросам, для наказанных не существует процессов апелляции. Гугл совершенно не подчинен никому. В большинстве случаев, он просто не отвечает на e-mail’ы вебмастеров.
9 ГУГЛ — БОМБА ЗАМЕДЛЕННОГО ДЕЙСТВИЯ В СМЫСЛЕ ВОПРОСОВ PRIVACY. Обслуживая около 200 миллионов поисков в день, большинство из-за пределов США, гугл — катстрофа, которая может случиться в любой момент. Васхингтонские бюрократы могут только мечтать о той изящной эффективности в сборе данных, которой добился Гугл.


Добавлю от себя.

1. Большинством «альтернативных» поисковиков сейчас в Штатах владеек корпорация Yahoo.

2. Центральность поисковиков для слежения за интернетом, составления профилей на отдельный пользователей и т.д. делают их эквивалентом системы Эшелон в Интернетовском мире. Отсюда и интерес властной мафии к владению Гуглом, и закрытость его работы, и сотрудники NSA, создающие его кишочки, и вечное хранение и так далее

3. Помимо госконтроля (который в мире неоконов и 911 также этнически не слеп) Гугл уже несколько раз проявлял свои этнические предпочтения в маркировке отдельных страниц.
Например, никаким автоматическим сбором информации невозможно объяснить label приставленный к результату гуглопоиска на имя David Irving:

Web site of disgraced British Holocaust denier David Irving. Contains latest news about himself, as well as articles reproduced from the world media about …
www.fpp.co.uk/
[Дословно: "Веб сайт опозорившегося британского отрицателя Холокоста Дейвида Ирвинга. Содержит последние новости о себе … -- второе предложение действительно есть на его сайте. Первое же подставлено евреями работающими в Гугле.
Чтобы понять, отчего он удостоился штучного обращения, надо знать, насколько центральным для холокостников было дело против Ирвинга, историка Второй Мировой, выкапывающего новые документы в архивах вместо переписывания устоявшейся версии истории. Для суда против него этнической мафией — деятелями вроде вложившегося Спилберга — были собраны миллионы (5? 15? не помню, есть на сайте Ирвинга, лень проверять) и куплен за 300-400 тысяч кембриджский профессор истории Эванс]

4. В силу вышесказанного, я сильно, очень сильно сомневаюсь, что Гугл respects, удовлетворяет (необязательные для него) предпочтения вебмастеров выраженные в HTTP headers и/или в robots.txt -- Гугл копирует все, что видно/доступно из гигантской связной компоненты графа. (Отпадают внутренние сайты компаний и те части сайтов, что правильно защищенные процедурами login and authentication, но их меньшинство; ничтожно мало окажется сайтов специально настроенных после долгой слежки чтобы не пускать только IP/domain crawlers гугла (которых много, которые могут иметь сильно разные IP и не разрешаться в его собственный domain), но чтобы при том оставаться открытыми прочим посетителям. Верно обратное — достаточно много сайтов наивны в том смысле, что их logins сломаны — прямые ссылки извлекают внутренние страницы, я например повсеместно натыкаюсь на это на сайтах англоязычных газет. Поскольку сама суть Веба в гиперссылках, подавляющее число сайтов подвязано к гигантской компоненте и видимо для crawlers. Для crawlers тем более не важно, генерируются ли страницы веб сайтами динамически — если страница в ответ на запрос по ссылке была создана, она будет сохранена).
Гугл хранит ВСЕ, но чистит отчасти то, что потом предоставляет для поиска простому населению. Компаниям он продает слегка другие услуги. Государству (которо, можно сказать, теперь его почти совладелец) — абсолютно иные.
Кроме того, список претензий еще раз подтверждает, что toolbar или прочие гугловспомогательные программы (какого-нибудь локального поиска вашего PC, которые незаметно для вас делится информацией с Гуглом) действительно «hack» персональные компьютеры до той степени, до какой гуглопрограмма имеет доступ к вашим локальным файлам.

5. И последнее. В предыдущем постинге вопрос о Гугле возник из-за «исламского экстремистского» сайта, который так удачно обнаружила BBC часы спустя после взрывов. Если они его так легко обнаружили, сайт имел какие-то ссылки куда-то еще. Следовательно, он обязан был быть индексирован Гуглом, если только он не появился, приблизительно говоря, «за сутки» до этого. Теоретически возможно, что «исламский экстремистский сайт» знал заранее IP адреса всех crawlers Гугла (т.е. программ, которые автоматически ходят от страницы к странице, сгружая их, выделяя ссылки, двигаясь дальше) и их позапрещал. Un-fucking-likely. Хотя бы потому, что для «исламских» сайтов (и тем более сайтов на арабском) с почти 100% вероятностью можно утверждать в современных США будут проводиться crawls с отдельных, специализированный машин как Гуглом, так и сотрудниками госбезопасности.
OED.

Что произошло с Гуглом можно доходчиво объяснить слегка иначе.
Мы все помним эволюцию ЖЖ: написанный Фитцем «под себя» как проект-хобби, он продолжался в духе открытого программирования и GNU-деклараций. Пока не стал достаточно заметен и куплен. Тут же состоялся пересмотр политики, от деклараций и клятв перед «user community» ничего не осталось, АТ наводит корпоративные порядки по доносам (что я с моим пессимизмом предсказал абсолютно, буквально, еще в январе — запись friends-only, но соврать мне не дадут)

Гугл проделал тот же путь. Только в случае Гугла все намного, намного серьезнее.

Версия для печати
Добавить в «любимые обзоры»


Комментарии

Комментариев: 10926
1801 Assownelababe (гость) 27.05.2009 04:26


Должен признать, вебмастер зачетно накропал.=)

1802 мepтвeц (гость) 27.05.2009 04:32

Текст по настоящему понравился, особенно здесь последний абзац хорош :)


1803 FoodBlog (гость) 27.05.2009 04:45

<a href=foodlab.ru>Все про еду
<a href=afraze.ru>Блог техно-исскуства
<a href=autopre.ru>Все про Авто
<a href=windows-blog.ru>Програмы для Windows

1804 Neksskymn (гость) 27.05.2009 04:46

Твоя страничка прекрасная, всему офису интересно было читать

1805 FoodBlog (гость) 27.05.2009 05:12

<a href=foodlab.ru>Все про еду
<a href=afraze.ru>Блог техно-исскуства
<a href=autopre.ru>Все про Авто
<a href=windows-blog.ru>Програмы для Windows

1806 FoodBlog (гость) 27.05.2009 07:07

<a href=foodlab.ru>Все про еду
<a href=afraze.ru>Блог техно-исскуства
<a href=autopre.ru>Все про Авто
<a href=windows-blog.ru>Програмы для Windows

1807 FoodBlog (гость) 27.05.2009 07:13

<a href=foodlab.ru>Все про еду
<a href=afraze.ru>Блог техно-исскуства
<a href=autopre.ru>Все про Авто
<a href=windows-blog.ru>Програмы для Windows

1808 exewowdenly (гость) 27.05.2009 10:37

Автору спасибо, продолжайте нас радовать!

1809 andrometten (гость) 27.05.2009 12:45

Интересно было почитать. Думаю у Вас скоро появится группа постоянных посетителей

1810 reigmadisrers (гость) 27.05.2009 16:52


Админ я не могу зарегестрироваться может я просто не то делаю ? Письма просто не приходит никакого ??

1811 parabellum (гость) 27.05.2009 20:18

Все-таки, подобное не всем интересно. Хотя, каждому свое.

1812 reigmadisrers (гость) 27.05.2009 22:03


А я считаю, что все это верно и очень точно подмечено! И таких мелочей можно накопать тысячу.

1813 reigmadisrers (гость) 27.05.2009 23:11

Я тоже иногда такое замечала, но как-то раньше не придавала этому значения.

1814 reigmadisrers (гость) 27.05.2009 23:49


У моего друга Павел точно такой же почти

1815 reigmadisrers (гость) 28.05.2009 00:01


Хорошо пишете. Надеюсь, когда-нибудь увижу нечто подобное и на своем блоге…

1816 kneernmon (гость) 28.05.2009 00:54

Если это не большой секрет;), автор блога откуда родом?


1817 reigmadisrers (гость) 28.05.2009 00:57


Что-то футер у вас вправо съехал (в опере при разрешении 1024х768)

1818 reigmadisrers (гость) 28.05.2009 01:15


Может быть кто-нить поделится ссылочкой на что-нибудь из этой же тематики? Уж очень заинтересовало

1819 reigmadisrers (гость) 28.05.2009 01:17


Занятно-занятно, нигде раньше на такое не натыкался.

1820 BumLulkymut (гость) 28.05.2009 02:19

Сенкс. Интересно, и вообще полезный у Вас блог

1821 reigmadisrers (гость) 28.05.2009 05:26


Суть в следующем: я хоштел бы узнать про цпну домена netormozi.com и про моишансы на его покупку. Также я хотел уточнить по покоду: входит ли в эту смму сам сайт или нет? Желательно, ответьте в комментариях. А то мыльник батахлит.

1822 NewebMan (гость) 28.05.2009 05:58

<a href=serialix.ru>Фильмы онлайн
<a href=almeo.ru>Альфа Ромео
<a href=icemax.ru>Хокейный блог
<a href=sonynote.ru>Ноутбуки сони

1823 reigmadisrers (гость) 28.05.2009 06:01


Очень интересно. Но чего-то не хватает. Может быть, стоит добавить каких-нибудь картинок или фото?

1824 reigmadisrers (гость) 28.05.2009 09:28


Сезон охоты 2 скачать бесплатно

1825 porosenochek (гость) 28.05.2009 10:28

Ну вот, дожился… Скоро за монитором буду проводить больше времени, чем с девушкой ((

1826 reigmadisrers (гость) 28.05.2009 10:44


Надеюсь, остальные записи окажутся такими же интересными

1827 reigmadisrers (гость) 28.05.2009 11:22


Сезон охоты 2 скачать бесплатно

1828 reigmadisrers (гость) 28.05.2009 11:39


Надеюсь, остальные записи окажутся такими же интересными

1829 reigmadisrers (гость) 28.05.2009 11:41


Должен признать, вебмастер зачетно накропал.

1830 reigmadisrers (гость) 28.05.2009 11:44


Сезон охоты 2 скачать бесплатно

Страницы: 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 | 60 | 61 | 62 | 63 | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 74 | 75 | 76 | 77 | 78 | 79 | 80 | 81 | 82 | 83 | 84 | 85 | 86 | 87 | 88 | 89 | 90 | 91 | 92 | 93 | 94 | 95 | 96 | 97 | 98 | 99 | 100 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 | 111 | 112 | 113 | 114 | 115 | 116 | 117 | 118 | 119 | 120 | 121 | 122 | 123 | 124 | 125 | 126 | 127 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 | 153 | 154 | 155 | 156 | 157 | 158 | 159 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 | 169 | 170 | 171 | 172 | 173 | 174 | 175 | 176 | 177 | 178 | 179 | 180 | 181 | 182 | 183 | 184 | 185 | 186 | 187 | 188 | 189 | 190 | 191 | 192 | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 202 | 203 | 204 | 205 | 206 | 207 | 208 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 | 218 | 219 | 220 | 221 | 222 | 223 | 224 | 225 | 226 | 227 | 228 | 229 | 230 | 231 | 232 | 233 | 234 | 235 | 236 | 237 | 238 | 239 | 240 | 241 | 242 | 243 | 244 | 245 | 246 | 247 | 248 | 249 | 250 | 251 | 252 | 253 | 254 | 255 | 256 | 257 | 258 | 259 | 260 | 261 | 262 | 263 | 264 | 265 | 266 | 267 | 268 | 269 | 270 | 271 | 272 | 273 | 274 | 275 | 276 | 277 | 278 | 279 | 280 | 281 | 282 | 283 | 284 | 285 | 286 | 287 | 288 | 289 | 290 | 291 | 292 | 293 | 294 | 295 | 296 | 297 | 298 | 299 | 300 | 301 | 302 | 303 | 304 | 305 | 306 | 307 | 308 | 309 | 310 | 311 | 312 | 313 | 314 | 315 | 316 | 317 | 318 | 319 | 320 | 321 | 322 | 323 | 324 | 325 | 326 | 327 | 328 | 329 | 330 | 331 | 332 | 333 | 334 | 335 | 336 | 337 | 338 | 339 | 340 | 341 | 342 | 343 | 344 | 345 | 346 | 347 | 348 | 349 | 350 | 351 | 352 | 353 | 354 | 355 | 356 | 357 | 358 | 359 | 360 | 361 | 362 | 363 | 364


Имя:
E-mail:
Правила:
Разрешены тэги: <b>, <i>, <u>. Если хотите дать ссылку - пишите ее просто: http://... Все поля обязательны. Ваш email на странице отображаться не будет.
Текст сообщения:
rss