2
Дополнительное исследование службы Google Flu Trends (в соответствии с независимым дополнительным клиническим исследованием в госпитале Джона Хопкинса): Dugas et al. Google Flu Trends: Correlation with Emergency Department Influenza Rates and Crowding Metrics // CID Advanced Access. – January 8, 2012. – DOI 10.1093/cid/cir883.
3
Покупка авиабилетов: Farecast – информация от Кеннета Кукьера: Kenneth, Cukier. Data, data everywhere // The Economist. – February 27, 2010. – P. 1–14. А также интервью с Эциони (2010–2012 гг.).
4
Директор исследовательского центра имени Тьюринга при Вашингтонском университете.
7
Астрономия и секвенирование ДНК. Специальный отчет в журнале The Economist (см. выше): Data, data everywhere // The Economist. – February 27, 2010. – P. 1–14.
13
По оценкам за 2013 год, объем сохраненной информации равен 1,2 зеттабайта, из которых нецифровая информация составляет менее 2 % (из интервью Гилберта Кукьеру).
14
Печатный станок и восемь миллионов книг (больше, чем было выпущено с момента основания Константинополя): Eisenstein, Elizabeth L. The Printing Revolution in Early Modern Europe. – Cambridge: Canto/Cambridge University Press, 1993. – P. 13–14.
15
Аналогия Питера Норвига. Из бесед с Норвигом о его труде The Unreasonable Effectiveness of Data (написанном в соавторстве), в частности: Norvig, Peter. The Unreasonable Effectiveness of Data // Лекция в Университете провинции Британская Колумбия. – Видео YouTube. – 23.09.2010. URL: http://www.youtube.com/watch?v=yvDCzhbjYWs.
17
Jeopardy! («Рискуй!») – телеигра, популярная во многих странах мира. Российский аналог – «Своя игра». Здесь и далее прим. ред.
18
Walmart – американская компания-ретейлер, управляющая крупнейшей в мире розничной сетью.
19
CapitalOne – американская банковская холдинговая компания, специализирующаяся на кредитах.
20
«Человек, который изменил всё» (Moneyball) – биографическая спортивная драма режиссера Беннетта Миллера. На русском языке издана книга: Льюис М. Moneyball. Как математика изменила самую популярную спортивную лигу в мире. М.: Манн, Иванов и Фербер, 2014.
21
Линия Мажино – система французских укреплений на границе с Германией.
22
О Джеффе Йонасе и о том, что «говорят» данные: беседа с Джеффом Йонасом (декабрь 2010 года, Париж).
23
В Древнем Риме: перепись граждан с указанием имущества для определения их социально-политического, военного и податного положения.
25
Вклад Неймана: Kruskal, William. Representative Sampling, IV: the History of the Concept in Statistics, 1895–1939 / William Kruskal and Frederick Mosteller // International Statistical Review. – 1980. – Vol. 48. – P. 169–195, 187–188. Знаменитая статья Неймана: Neyman, Jerzy. On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection // Journal of the Royal Statistical Society. – 1934. – Vol. 97, No. 4. – P. 558–625.
26
Выборки из 1100 результатов наблюдений достаточно. Пример см. в статье: Babbie, Earl. Practice of Social Research. – 12th ed., 2010. – P. 204–207.
29
23andme – частная компания в Маунтин-Вью, Калифорния, где разрабатываются новые биотехнологические методы.
30
Генетическое секвенирование Стива Джобса: Isaacson, Walter. Steve Jobs. – 2011.
31
Google Flu Trends: прогнозирование на уровне городов с 75 %-ной точностью: Dugas et al. Google Flu Trends: Correlation with Emergency Department Influenza Rates and Crowding Metrics // CID Advanced Access. – January 8, 2012.
32
Эциони о временных данных: интервью Кукьеру (октябрь 2011 года).
33
Исполнительный директор компании Xoom: Rosenthal, Jonathan. Special report: International banking // The Economist. – May 19, 2012. – P. 7–8.
35
Левитт С., Дабнер С. Фрикономика. М.: Манн, Иванов и Фербер, 2011.
36
Замена выборок: Savage, Mike. The Coming Crisis of Empirical Sociology / Mike Savage & Roger Burrows // Sociology. – 2007. – Vol 41. – P. 885–899.
37
Об анализе исчерпывающих данных, полученных от оператора мобильной связи: Onnela, J.-P. et al. Structure and tie strengths in mobile communication networks // Proceedings of the National Academy of Sciences of the United States of America (PNAS). – May, 2007. – Vol. 104. – P. 7332–7336. URL: http://nd.edu/~dddas/Papers/PNAS0610245104v1.pdf
38
Кросби: Crosby, Alfred W. The Measure of Reality: Quantification and Western Society. – 1997.
40
Идея о том, что «2 + 2 = 3,9»: Hopkins, Brian. Expand Your Digital Horizon With Big Data / Brian Hopkins and Boris Evelson // Forrester. – September 30, 2011.
42
Эндшпиль – заключительная часть шахматной партии.
43
Таблица шахматных эндшпилей. Наиболее полная общедоступная таблица шахматных эндшпилей, названная в честь ее создателей (Nalimovtableset), охватывает все варианты игры при шести (и менее) фигурах. Ее размер превышает 7 терабайт, и главная задача – сжатие содержащейся в ней информации. См.: Nalimov, E. V. Space-efficient indexing of chess endgame tables / E. V. Nalimov, G. McC. Haworth, and E. A. Heinz // ICGA Journal. – 2000. – Vol. 23, no. 3. – P. 148–162.
44
Лингвистическим корпусом называют совокупность текстов, собранных в соответствии с определенными принципами, размеченных по определенному стандарту и обеспеченных специализированной поисковой системой. Термин введен в употребление в 1960-х годах в связи с развитием практики создания корпусов, которому начиная с 1980-х способствовало развитие вычислительной техники.
45
Эффективность алгоритма: Banko, Michele. Scaling to Very Very Large Corpora for Natural Language Disambiguation / Michele Banko & Eric Brill // Microsoft Research. – 2001. – P. 3. URL: http://acl.ldc.upenn.edu/P/P01/P01–1005.pdf.
49
Цитата из статьи Норвига: Halevy, A. The Unreasonable Effectiveness of Data / A. Halevy, P. Norvig, and F. Pereira // IEEE Intelligent Systems. – Mar./Apr., 2009. – P. 8–12. Обратите внимание, что ее название – вариация на тему знаменитой статьи Юджина Вигнера The Unreasonable Effectiveness of Mathematics in the Natural Sciences, в которой он рассматривает, почему физику можно аккуратно выразить в математических формулах, но они плохо годятся для гуманитарных наук. См.: Wigner, E. The Unreasonable Effectiveness of Mathematics in the Natural Sciences // Comm. Pure and Applied Mathematics. – 1960. – Vol. 13, no. 1. – P. 1–14.
51
Billion Prices Project – проект в рамках учебной инициативы, в котором используются цены, ежедневно собираемые на сотнях сайтов розничных торговцев по всему миру, для проведения экономических исследований.
52
Кукьер: трудности считывания данных по беспроводной связи: Data, data, everywhere // The Economist. – February 27, 2010. Система, безусловно, не является непогрешимой: причиной пожара на нефтеперерабатывающем заводе BP Cherry Point в феврале 2012 года оказались ржавые трубы.
53
Chief Executive Officer – главный исполнительный директор.
54
Цитата Маркуса: Marcus, James. Amazonia: Five Years at the Epicenter of the Dot.Com Juggernaut // The New Press. – June, 2004. – P. 199.
55
Линден: интервью Кукьеру (март 2012 года).
Конец бесплатного ознакомительного фрагмента.